Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

正規表現での検索エラー



安藤と申します.

namazu 2.0.4
kakasi 2.3.2
chasen 2.02
Perl 5.6.0
Linux 2.2.15

という環境で namazu を利用させていただいています.

正規表現を使った検索で,パターンによって検索できないことがあるようです.
例えば

/インタ?フェ[ーイ]ス/
/インタ?フェース/

では,正しく検索ができるのですが,

/インタ?フェイス/

ですと,

  14: Directive:  [Index]
      Argument 1: [/usr/local/namazu/index]
  45: Directive:  [Replace]
      Argument 1: [/home/****************/]
      Argument 2: [http://*********************/]
  66: Directive:  [Lang]
      Argument 1: [ja]
  72: Directive:  [Scoring]
      Argument 1: [tfidf]
namazu(debug): load_rcfile: /usr/local/namazu/namazurc loaded
namazu(debug):  -n: 20
namazu(debug):  -w: 0
namazu(debug): query: [/インタ?フェイス/]
namazu(debug): Index name [0]: /usr/local/namazu/index/pon
namazu(debug): set_phrase_trick: /インタ?フェイス/
namazu(debug): set_regex_trick: /インタ?フェイス/
namazu(debug): query.tokennum: 1
namazu(debug): query.tab[0]: /インタ?フェイス/
namazu(debug): size of /usr/local/namazu/index/pon/NMZ.t: 648
namazu(debug): before nmz_strlower: [/インタ?フェイス/]
namazu(debug): after nmz_strlower:  [/インタ?フェイス/]
namazu(debug): do REGEX search
namazu(debug): REGEX: 'インタ?フェイス'
検索結果

参考ヒット数:  [  (不明なエラー。バグ報告してください)  ]

検索式にマッチする文書はありませんでした。


とエラーがでます.(namazu でも namazu.cgi でも)

いくつかの環境で試したのですが,分かち書きに
kakasi を使って作ったインデックスにおいて上のようなエラーが再現され,
chasen を使った場合は正しく検索できるようです.(たまたま?)

分かち書きの時のオプション指定は,デフォルトの mknmzrc に記述されているのを
そのまま使用しています.

---
安藤 弦彦/Lancelot <lancelot@xxxxxxxxxxxxxx>