Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Word、Excel文書の検索ができません。



山崎です。
いろいろとご教授いただきありがとうございます。

その後、いろいろと試してみたのですが、
やはり、Windows2000からSamba共有がかかっているLinuxのディレクトリに
Word2000、Excel2000で作成したファイルをコピーし、
そのファイルに対して全文検索をかけようとすると
検索結果が文字化けしてしまったり、
MS-WORDファイルがファイル名で検索できません。

試したこととしては

1.メーリングリストの情報を元にmsword.plを編集し、
 インデックスを再作成した。

->検索結果のタイトル部分に
 ファイル名が表示されるようになりました。
 (ただし、ファイル名は文字化けし、
  ファイル名で検索を行っても、検索結果にヒットしません。)

2.MS-EXCELとMS-WORDファイルをLinuxサーバーに転送し、
 インデックスを再作成した。

->検索結果のタイトルが文字化けしてしまう。

3.MS-WORDとMS-EXCELファイルのファイル名の文字コードをEUCに変更し、
 インデックスを再作成した。

->文字化けせずに、検索結果のタイトルにファイル名が表示された。
 ただし、Excelファイルはファイル名での検索を行えばヒットするが、
 Wordファイルはヒットしない。

4.「+subject:ファイル名」と検索式でフィールドを指定し、
 MS-WORD文書の検索を実行。

->ファイル名の文字コードがEUCのファイルのみ
 ファイル名で検索結果にヒットしました。

5.namazu.cgiと同じ場所に置いてある「.namazurc」に
 Lang ja_JP.SJISを指定し、
 インデックスを再作成。

->ファイル名の文字コードがShist-JISであっても、
 検索結果のタイトルにファイル名が正しく表示される。
 ただし、「+subject:ファイル名」と検索式でフィールドを指定し、
 MS-WORD文書の検索を実行すると、
 ファイル名がShift-JISのファイルは検索結果にヒットしない。
 NMZ.field.subjectを見ると、
 ファイル名がShift-JISのものは
 全て文字化けしている。


MS-WORD、MS-EXCELファイルをコピーするたびに、
ファイル名をEUCに変更したり
検索をするたびに、「+subject:ファイル名」と検索式に入力するのは
分かりにくいため、ファイル名がShift-JISでも
検索できるようにしたいと思っています。
ファイル名の文字コードがEUC-JPだと出来るのに、
Shift-JISだと出来ないのは何か設定がおかしいのでしょうか。


Naoko Yamazaki

n_yamazaki@xxxxxxxxxxx