Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

複数桁数字のインデックス化



かつきと申します。
初めて参加させていただきます。

漢字(2バイト)、英単語(1バイト)はインデックス化できるのですが、数字(1
バイト)がインデックス化できません。
現象としては”1234”のような複数桁の数字です。

主に.pdfや.txtファイルを読み込みます。

1ファイルの中身が(<--A)
"漢字","123"のような場合は、"漢字"のみインデックス化できています。

1ファイルの中身が(<--B)
"ABC","123"のような場合は、"ABC","123"をインデックス化できています。

上記Aの場合に数字をインデックス化できず困っております。

環境は以下のとおりです。
文字コード等に問題があるのでしょうか。
皆様のお力をいただければ幸いに存じます。

$ mknmz -C
読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc
システム: linux
Namazu: 2.0.10
Perl: 5.006
NKF: /bin/nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: /usr/local/bin/chasen -j -F '%m '
わかち書き: /usr/local/bin/chasen -j -F '%m '
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/share/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
対応メディアタイプ:
  application/excel
  application/ichitaro6
  application/msword
  application/pdf
  application/powerpoint
  application/x-bzip2
  application/x-compress
  application/x-gzip
  application/x-js-taro
  application/x-rpm
  message/news
  message/rfc822
  text/hnf
  text/html
  text/html; x-type=mhonarc
  text/plain
  text/plain; x-type=rfc
  text/x-hdml
  text/x-roff
------------------------------
 Katsuki Naoto
   mailto:naoto.katsuki@xxxxxxxxxxxxx
------------------------------