Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: バグ報告



>                                            千葉市中央区長洲
>                                                    藤原  誠
岩谷さん、
良く Software Design の記事を拝見致しています。素適ですね。

(以前に個人メールをいただいたこともあると思います。その時には
失礼致しました)

さて、
岩谷さん>     namzu -ah xfs . >testresult.html
岩谷さん> 等とします。xfsという語が文章中に複数個含まれるファイルで、検索に

この件ですが、簡単に言ってしまえば、kakasi で見つからなくて 
ChaSen で見つかるということですよね。

Namazu は、日本語の場合、一番初めのわかち書きを、外部の
kakasi / chasen に頼っていて、単語の切出しの品質というのは、
かなりというか完全にそちらに依存しています。
そうして、これら二つにもそれぞれに得意不得意があって、
さらにそれらが頼っている辞書にも依存します。ですから、こういう
ことはあり得ます。例えばひらがなだけで出来ている単語とかが、
一番はっきりしています。

一つだけ出していただいた例が xls だと思うのですが、
(とここまで書いて、自分で試して見たら xls だったら見つかるは
ずなので)、馬場さんが書いているように、岩谷さんの環境設定の
可能性も残っていますね。ただ chasen では一部にせよ動いている
そうなので、mknmz を実行した時の環境変数が問題になっているの
かも知れません。

例えば次を見ていただきたいと思います。
http://www.namazu.org/doc/tutorial.html#japanese
(これは 2.0.6 の説明です)
---
(藤原)
http://www.ki.nu/software/NetBSD/iBook2/
http://www.ki.nu/software/namazu/tutorial/