Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: ヒットのしかたが変では



>                                            千葉市中央区長洲
>                                                    藤原  誠

> (3) (検索)NMZ.w の中を見ると、変に長い文字列が見えたりしませんか

nishi> かなり長い文章とかあるようです。
nishi> しかし長い文章は"‖"とか"|"で区切られてリストされています。
nishi> これは別の意味があるのでしょうか。

「長い文章がある」というのはわかち書きがうまく動いていない
(うまく動かなかったことがある)ということで、それでは思うように
検索することは出来ません。 
  
 || (?上の縦棒二本は何 (*)) のようなものは特に深い意味はないと
思いますが、正直 「区切られれてリストする」という意味が僕には
分りません。さしさわりのない範囲で例をそのまま記入していただい
た方が状況が良く伝わるのですが。

それで、
 1. kakasi を入直す
 2. mknmz を入直す
 3. 設定を見直す
 4. 初めから索引を作り直す

などをした方がいいと思います。
その前に mknmz --help で日本語にはなりますよね ?
mknmz -C で
わかち書き: module_kakasi -ieuc -oeuc -w
のような字は表示されますか。

あるいは (僕は少し表示を変更しているので
setenv LANG C
した後の表示で言うと) 次のような文字は見えますか ?
KAKASI: module_kakasi -ieuc -oeuc -w
ChaSen: module_chasen -j -F '%m '
Wakati: module_kakasi -ieuc -oeuc -w

それらに問題がないとすると、
それでまずは 4. だと思います。
「NMZ.* を消して、もう一度 mknmz をして見る」でしょうか。
それでも NMZ.w に単語以上の並びがあったらおかしいです。
その時には 1,2 などかなと思います。

>  perl -MText::Kakasi -e ''
> と入力すると何も表示されないのが正しいのですが、そうなりますか。
nishi> とりあえず何も表示されませんでした。perlの入れなおし等も行なって
nishi> おりません。正しく動いているということでしょうか。

  正しく動いているという意味にはなりません。少なくとも 
「Kakasi の Perl 部品は入っていて、Perl から利用出来る」と
いうことが確認出来て、問題は他のところにありそうだと分るだ
けです。

nishi> ちなみに .mknmzrc の設定ファイルの最後の方の、
nishi> # Softwares for handling a Japanese text
nishi> という行以下はwebで検索するだけなら#(コメント)を外す必要はない
nishi> のですよね。kakasiに関する行もあったのでちょっと心配になりました。

どのような場合でもそのままで構いません。それらの変数をどう
しても変更したい強い理由がある時にだけ設定(修正)します。

(*) 二つの文字の 16 進表現
   euc-japan   sjis
‖ a1 c2       81 61
| a1 c3       81 62
---
(藤原)