Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Word ・ Excelのインデックスがうまくできない



寺西です。

zyoru@xxxxxxxxxxxxxx wrote:
> 
> 現在LinuxでNAMAZUを利用してWord、Excel、PDFファイルの全文検索を行える
> ようにしているのですが、WordとExcelのファイルがうまく検索できない状況
> で困っています。(具体的には、Wordの一行目以降と、Excelの1列目以降の文
> 章が検索できないです)

この症状は初耳です。

mknmz -C を実行すると、どのような結果が表示されますか?

# doccat の評価版が使われているのなら、このような症状がでるかもしれ
# ませんが、wvWare, xlHtml がインストールされている環境では
# 起こらないはず。

> Linux : Kondara Linux 2.1
> Namazu : 2.0.12
> perl : 5.006
> nkf : 2.0

本件と直接関係ないことですが、
nkf 2.0 はやめましょう。nkf 1.71 か nkf 2.02 以降をご使用ください。

> Kakasi : 2.3.4
> wvWare : 0.7.2
> lv : 4495
> xlHtml : 0.5.1

wvWare 0.7.2 というのが微妙ですが、たぶん 0.7.2 までは Namazu 2.0.12
はサポートしていたと思います。

% wvWare test.doc | lv -Iu8 -Oej > word.html

と Namazu を通さず、wvWare で処理した word.html は期待した結果
が得られているでしょうか。まずは、それを確認してください。

同様に excel の方も以下の結果を確認してください。

% xlhtml -m test.xls | lv -Iu8 -Oej > excel.html
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E