[Namazu-users-ja 447] Re: 検索式に記号文字を使えるようにするには

"堅田 一夫" katada @ i-net.asahi.co.jp
2005年 7月 20日 (水) 20:26:38 JST


ご返答ありがとうございます。

 >そのヒットしない HTML ファイルだけでインデックスを作成して、
 >検索してもヒットしませんか? それともその場合はヒットしますか?

ヒットしないHTMLファイルのみでインデックスを作ってもヒットしませんでした。
また、おかしな現象として参考ヒット数の表示のところが

参考ヒット数: { [ 【: 0 ] [ 備: 0 ] [ 考: 0 ] [ 】: 0 ] :: 0 }

のようになりました。
ヒットするHTMLファイルのみでインデックスを作るとヒットし、なおかつ
参考ヒット数の表示も

参考ヒット数: { [ 【: 1 ] [ 備考: 1 ] [ 】: 1 ] :: 1 }

のようになりました。

ご指摘いただきました【備 考】とか [備考] になっているかを確認いたしましたが
【備考】になっておりました。

ヒットするHTMLとヒットしないHTMLのソースを見比べていて気づいたのですが、
ヒットしないHTMLには【備考】の直前のタグ<font style=line-height:130%;>の 
“130%;”の後ろに半角
スペースが入っていました。
その半角スペースを取り除いてインデックスを作成するとヒットするようになりました。

半角スペースが悪さをしていたようです。
この現象は既知なものなのでしょうか?


At 19:34 05/07/20, you wrote:
 >寺西です。
 >
 >"堅田 一夫" wrote:
 >>
 >> 検索式に例えば【備考】と入れて検索をかけると、
 >> 【備考】と入力されているHTMLのすべてをヒットできません。
 >
 >これだけの情報ではさまざまな可能性が考えられるので、的をえた答えは
 >でないでしょう。
 >
 >そのヒットしない HTML ファイルだけでインデックスを作成して、
 >検索してもヒットしませんか? それともその場合はヒットしますか?
 >
 >ヒットしない HTML ファイルには正確に【備考】と書かれていますか?
 >【備 考】とか [備考] とかになっていませんか?
 >
 >> インデックスファイルを作成する際に、【】などの記号が無視される
 >> といったことはあるのでしょうか?
 >
 >微妙な話ですが、【備考】は単語ではないので、わかち書きされて
 >分解されます。たぶん検索時には、
 >
 >参考ヒット数:  {  [ 【: 1 ]  [ 備考: 1 ]  [ 】: 1 ]  :: 1 }
 >
 >というように3つに分解されたかと思います。
 >無視はされませんが、分解されてインデックスに登録されます。
 >そのため、所詮 3 つの語の AND 検索になります。
 >
 >また、記号によっては半角記号に変換されてインデックスに登録
 >されますし、記号によっては mknmz の -K や -E オプションで削除する
 >こともできます。
 >
 >> 実行環境
 >> OS:SunOS 5.9
 >> namazu:2.0.12
 >> kakasi:2.3.4
 >
 >さっさと Namazu を 2.0.14 にバージョンアップしましょう。
 >まずすることはバージョンアップです。
 >--
 >=====================================================================
 >寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
 >http://www.asahi-net.or.jp/~yw3t-trns/index.htm
 >Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E
 >
 >_______________________________________________
 >Namazu-users-ja mailing list
 >Namazu-users-ja @ namazu.org
 >http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja



========================
堅田 一夫
katada @ i-net.asahi.co.jp 





Namazu-users-ja メーリングリストの案内