OSC大阪で出展しました!
鹿野です。
1/25 は OSC大阪 で、おーぷん万葉として出展してきました。
展示していた EgoisticLily については、昨年OSC東京で展示していたものと同じでした。
……次のOSC東京ではその辺りも改善したいですね。。。
BERT対応……失敗!?
実は今回、BERTに対応できそうか試みたのですが、、、
なんともめっちゃ激遅!
なものとなってしまい、とてもじゃないけどかな漢字変換として使えそうなレベルではなかったので。見送ることにしてました。こりゃ設計を一から始めていかないと厳しいですね。
ただ、方針を少し変えればうまくいくのじゃないかという予測もあるので、この辺りの話は次回、OSC東京でのお楽しみということで。。
OSC東京は、2/21〜2/22、駒沢大学です。
2/21(金) にはセミナーも予定してます!
(考えてみたら私東京では初セミナーな気がする。他の地域ではよくやってますがね……)
Sudachi辞書に関する小技
おーぷん万葉では Sudachi 関係者の方に日頃からお世話になってますが(という表現でいいのかよくわからん!)、今回 Sudachi辞書(.csv)の作り方を教わったので、メモ代わりに記載しておきます。
Sudachi辞書(.csv)の作成方法
1. git-lfsでCSV取得
SudachiDict を git clone した後、git-lfs でCSV(本体)を取得します。
> cd src/main/text/ > git-lfs pull
2. CSVの結合
そのうち、 small_lex.csv と core_lex.csv を結合します
> cat small_lex.csv core_lex.csv > sudachi_core.csv
これでコア辞書(Sudachiで最も推奨されてるらしい辞書)を作ることができるようです。
かんたんですね!(てか大した話でもないですが)
というわけで次は・・・
次は、来月のOSC東京です。
今度こそBERT対応したモデルをお披露目できればなぁ〜と。