namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

初めまして&全角中グロについて質問です



初めまして、塙と申します。よろしくお願いいたします。

早速で申し訳ありませんが、"・"(全角の中グロというのかな?)の扱いについ
て質問です。

日本語全文検索システムを構築するため、Webサーバ上にNamazuをインストールし
ました。なんとかうまくいったようで、Webブラウザを使ってCGI経由での検索が
できるようになりました。

環境は以下の通りです
●Webサーバ
 Solaris2.5.1(SPARC) + Apache1.2.6
 検索対象となるHTMLファイルは漢字コーはS-JIS、改行コードLFで保存
 Namazu v1.2.0.8 + kakasi 2.2.5 + nkf-1.62をインストール
●クライアントPC
 WindowsNT4.0 + Netscape Communicator4.05(cgi-bin/namazu.cgiで検索)

で、いろいろ検索を試しところ、検索語に例えば"ビル・ゲイツ"と入れて検索す
ると、以下のような結果が出ます。(もちろん検索対象のHTMLファイルに"ビル・
ゲイツ"はあります。)
----------------------------------------------------------------------
検索結果

参考ヒット数: { [ ビル: 210 ] [ ・: 0 ] [ ゲイツ: 118 ] :: 0 } 

検索式にマッチする項目はありませんでした。
----------------------------------------------------------------------
全角の中グロにマッチしないため、「マッチする項目が無い」と出ています。


他のサイトも調べてみましたのですが、それぞれ違った結果になりました。
●Namazu mailing list archives(Namazu v1.3.0.0)
(http://avocado.aichi-u.ac.jp/%7Ealias/namazu/)
参考ヒット数: { [ ビル: 8 ] [ ・: 0 ] [ ゲイツ: 0 ] :: 0 } 
 →中グロはヒットしない

●パシフィック・ハイテック(Namazu v1.2.0.1)
(http://www.pht.co.jp/cgi-bin/namazu.cgi)
参考ヒット数: 
     tlj-general-ml: { [ ビル: 1 ] [ ・: 258 ] [ ゲイツ: 0 ] :: 0 } 
 →中グロはヒットする

●日経インターネットテクノロジー(Namazu v1.1.2.2)
( http://nit.nikkeibp.co.jp/cgi-bin/namazu.cgi)
参考ヒット数: [ ビル: 9 ] [ .: 1158 ] [ ゲイツ: 0 ] 
 →中グロは半角ピリオドに変換されてヒットする

できれば中グロをヒットさせるようにしたいのですが、これは設定可能でしょう
か? ドキュメントを読んでもよく分からなかったので、申し訳ありませんがよ
ろしくお願いいたします。

-----------------------------------------------------------------------
 塙 理和   Masakazu Hanawa        株式会社IDGコミュニケーションズ
 hanawa@xxxxxxxxx                  〒102 東京都千代田区富士見1-2-27
                                   TEL 03-3222-6584 FAX 03-3222-5068