Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Word、Excel文書の検索ができません。



坂野@タイムインターメディアです。

●検索結果のタイトルについて

以前、同じようなことを調べたときは、
Wordの文書をインデクシングした場合、
検索結果のファイル名には、ファイルのプロパティ情報が表示されました。
ちょっと情報が古いかもしれませんが、以下のページが役に立つかもしれません。

http://www.kabayaki.jp/manual_doc_filter.html

●ファイル名が、検索にヒットしない件

文字化けの件とも関連しているかも知れませんが、
他に、ファイル名がタイトルやuriのフィールドインデックスにあるだけで、
本文のインデックスにはないということも考えられます。

その場合は、+subject:ファイル名 等と検索式でフィールドを指定すれば
ヒットすると思います。
検索式でフィールド指定の方法について、詳しくはこちら

http://www.namazu.org/doc/manual.html#query-field

ちなみに、タイトル, uri, 本文のインデックスに単語があるかどうかは、
検索してみなくても、それぞれ、NMZ.field.subject, NMZ.field.uri, NMZ.w を見れば分かります。 

インデックスの仕様についてはこちら。

http://www.namazu.org/doc/nmz.html.ja

山崎 直子 さんは書きました:
>
>はじめまして、山崎と申します。。
>初投稿ですが、よろしくお願いします。
>
>Windows2000からSamba共有がかかっているLinuxのディレクトリに
>Word2000、Excel2000で作成したファイルをコピーし、
>そのファイルに対して全文検索をかけようとしているのですが、
>うまくいきません。
>
>MSWordファイルはインデックスは作成できているのですが、
>検索結果のタイトルにファイル名でなく、
>本文が表示されてしまいます。
>また、ファイル名で検索をかけても
>ヒットしません。
>
>MSExcelファイルもインデックスは作成できるのですが、
>検索結果のタイトルが文字化けしてしまいます。
>また、ファイル名で検索をかけても
>ヒットしません。
>
>なお、テキストのインデックスは正常に作成されます。
>
>環境はこのようになっています。
>
> TurboLinux 7
> Namazu 2.0.12
> perl 5.6.1
> nkf 1.9
> Kakasi 2.3.2
> wvWare 0.7.2
> lv 4494
> xlHtml 0.4
>
>「.namazurc」にはLang jaを指定して、
>namazu.cgiと同じ場所に置いてあります。
>インデックス作成時には
>インデックスの出力先指定のオプションをつけて実行しています。
>
>
>私のやろうとしていることが元々出来ないのか、
>環境がおかしいのか、
>設定方法があるのかが分からなくて困っています。
>
>どなたかご教授いただけますでしょうか。
>よろしくお願い致します。
>
>
>Naoko Yamazaki
>
>n_yamazaki@xxxxxxxxxxx
>
>**************************************
>(株) サン・データセンター
>       ネットワークプロジェクト  山崎
>       n_yamazaki@xxxxxxxxxxx
>〒238-0004
>神奈川県横須賀市小川町14−1
>   ニッセイ横須賀センタービル7F
>   Tel  0468-24-0010(代表)
>   Fax 0468-27-2878
>**************************************
>
>

================================================================
Yoh Sakano                        | E-Mail: sakano@xxxxxxxxxxxxx
TIME INTERMEDIA CORPORATION       | TEL: 03-5362-9009
IPB Bldg. 26-27 Saka-machi        | FAX: 03-5362-9008
Shinjuku-ku, Tokyo 160-0002 Japan | HP: http://www.timedia.co.jp/