Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

mknmz 実行時の KAKASI の不具合



伊藤と申します。
遅くなりましたが、「商用データベースでのNamazu使用は?」の件、
お答え頂きありがとうございました。

今回は、質問のメールです。

mknmzでインデックス作成を行った時のNMZ.wについてです。

 (例)test.txt
    私の趣味は、車です。

  このテキストファイルを、mknmzのインデックス作成の対象ディレクトリに置き、
  mknmzを実行します。
  この時、NMZ.wには、test.txtに記述されている
  「私の趣味は、車です。」そのものが書かれてしまいます。
  従って、キーワード「趣味」で検索しても、test.txtはヒットしません。
  もちろん、「趣味」を中間一致で検索すれば、test.txtはヒットします。
 
ここで疑問に感じたのですが、
NMZ.wには、分かち書きされた単語が、書かれているわけではないのですか?
NMZ.wは、正規表現・部分一致検索時に使用する単語表であるとのことですが、
(ソシム 西村めぐみ著 「オープンソースソフトウェアによる全文検索・データベースWebの作り方」より)
namazuのプログラムソースを見たところ、通常の検索(特別な検索式を用いない)においても、
NMZ.wの単語表を参照しているようです。
このことから、NMZ.wには、分かち書きされた単語が書かれると考えた方が自然ですよね。
従って、mknmzの実行時に分かち書きを行うKAKASIが、
正常に動作していないのではないかと考えました。
もしそうだとしたら、考えられる原因を教えて頂きたいのです。
コンパイル、インストールを何回かして繰り返してみましたが、うまくいきません。
KAKASI自体は、正常に動作しています。telnet等のコマンドラインから、
  kakasi -w < test.txt
とすれば、分かち書きを行います。

ご参考になるかどうかわかりませんが、
  Namazu 2.0.5
  kakasi 2.3.2
  Text::kakasi 1.04
  linux 2.0.36
という環境です。

自力での解決策が見出せませんので、よろしくお願い致します。