[Namazu-users-ja 390] Re: 記号を含む特定の文言を含むインデックス

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2005年 5月 18日 (水) 22:55:05 JST


寺西です。

円 田河 wrote:
> 
> 原則、記号を含まないインデックスを作ろうとしています。ただし、たとえば、
> 「TCP/IP」のような記号を含む特定の文言だけはインデックスに含めたいのですが、
> どのようにすればいいのでしょうか。

う〜ん、Namazu じゃ無理かもしれません。
TCP/IP は tcp/ip と tcp, /, ip が登録されます。

記号を含まないようにするには -K オプションを付けることで実現しますが、
上記の場合、tcp, ip しか登録されなくなります。

-E オプションで、単語の両端の記号を削除することはできます。
tcp/ip は tcp/ip, tcp, ip となり、98% は 98 だけになります。
多くの場合は -E でよさそうですが、必ずしもご希望の動作とはならない
気がします。
(特定の文言が英文字、数字で構成されておればよいが、日本語が含まれると
ダメでしょう。)

そもそも、記号を含まないインデックスを作りたい理由は何でしょう。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-users-ja メーリングリストの案内