Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: kakasi の辞書のメンテナンス方法



金平と申します。

アドバイスありがとうございました。
再度質問させて下さい。

>>  自動で行なう方法は今のところありません。
>>  先日行なわれた ITX 2002 Summer <http://www.ipa.go.jp/itx2002/summer/>
>>  にて、「未知語を対象にしたキーワード抽出とシソーラス構築アルゴリズム」
>>  という展示をしている方はいました。技術的には不可能ではないようです。
>>  # 残念ながら、その方の成果はオープンソースにしているわけではありません
>>  # でしたが... 論文発表はされているようです。

 kakasiの辞書に存在しない単語が、インデックス作成対象ファイル
にあった場合の、kakasiの辞書への登録方法です。

 「自動で行う方法はない」とアドバイスを頂きましたが、、
手動で行う方法について教えていただけたらと思います。

 インデックス作成時に、”辞書にない単語”があった場合に
どこかのファイルに”辞書にない単語”が書き出される
ということはないのでしょうか?
そうすれば、辞書のメンテナンスを行う時に、
そのファイル(辞書未登録単語)を参照して、
kakasidictへ追加することによりメンテナンス
が容易になると思うのですが。

私が考える辞書のメンテナンス方法は、
新しくアップロードするファイルの単語を全てなめて、
kakasidictに登録されているかどうか
一つ一つ検索していく方法しか思いあたらないのですが。
この方法だとすごく手間がかかります。

”辞書にない単語”が分かる方法はありませんでしょうか?

どうか宜しくお願いします。