Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: kanwadict(kakasiの辞書)について



  KAKASI の話題なので、kakasi-dev で行なう方が適切な気もします。

At Fri, 18 Jul 2003 18:19:54 +0900,
h-nakatomi@xxxxxxxxx wrote:
> 検索の精度を上げるため、kakasi辞書の強化に取り組んでいます。
> 具体的には、NMZ.slogから、ユーザが、どんなキーワードで検索
> しているのか抽出して、mkkanwaコマンドで追加していこうと考え
> ています。
> そこで質問ですが、kanwadictには、同じ行が複数、登録されて
> いくのですか?それとも、重複する行は削除してくれるのでしょうか?

  質問の意味は、

* 新規キーワードのみを記録したファイルを用意
* それを mkkanwa コマンドに処理させる
* 既存の辞書に既に同じエントリがあった場合、生成される kanwadict には
  同じエントリが追加されてしまうのか

  ということだと理解しました。

  mkkanwa はまったく新規の辞書を作成するためのコマンドなので、このよう
な流れで処理を行なうと、新規キーワードのみが入力された辞書が作成されて
しまいます。

  KAKASI のソースに附属の kakasidict と一緒に mkkanwa に処理させるのが
よいでしょう。
  同一の単語の重複チェックはしていなかったと思うので、自力で除外するか、
気にせずそのまま使うか、どちらかを選択する必要があります。
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
	knok@xxxxxxxxxx / knok@xxxxxxxxxx