Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

samba で作成したファイル名の拡張子が欠ける



はじめまして。中村ともうします。

sambaサーバーのドキュメントをnamazuで全文検索したいと考え
ています。

サーバー:RedHat Linux6.2
クライアント:Windows 98/NT/2000
なまず:namazu:2.0.5
文書フィルタ:xlHtml-0.2.8
       lv4.4.9.4
       wv-0.6.5
WEBサーバー:apache1.3.12
samba:2.0.7

上記ソフトを全て導入し、sambaサーバーにてWindowsクライアント
から、MS-Excel/Wordの文書を書き落としました。
その後、namazuにてindexを作成し、namazu.cgiを介してブラウザ
より検索が可能な状態になっております。

URIは、.namazurcのなかで、
Replace /home/httpd/html/sambaroot/ file:////hostname/docroot/
などと指定し、ブラウザの検索結果から直接ファイルを引用できる
ようにしております。

ところが、一部の日本語ファイルで、拡張子(Excelなら.xls、Word
なら.doc)が欠けて、Winクライアントよりファイル引用出来ない
ものが出てきております。

例えば、「漢字.doc」なるファイルを作成し、その文書が検索結果に
表示されると、
文書名「漢字.do」
URI「file:////hostname/docroot/漢字.do」
などとなり、ファイルを引用できません。
もちろん、「.do」はmimeタイプにも登録してませんのでアプリケー
ションの起動などもできません。

この現象は、ファイル名が英数字だと発生せず、また、日本語でも
起こるものとそうでないものがあるようです。

この現象の発端は、namazuの検索結果のURIが、SJIS/EUCのコード違い
のためURIの日本語部分の文字列が
file:////hostname/doc/%90V%82%B5%82%A2%83t%83H%83%8B%83_/aaa.xls 
などのようにコードで出力したため、mknmzのコマンドオプション-Uを
使用してそれを回避しようとしたため起こったようです。

-Uオプションを使用しない場合、コード標記のままですと、正確にファイル
を引用可能です。
ただ、人間の目で見るとファイル名もその所在(フォルダ名)も判らない
ため、日本語で標記したく思っています。

このような現象(もしくは目的)に対する対処法をご存知の方がおられま
したら、ご教授いただきたく思っております。

-- 
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
   中村 大
   mailto:hu_nakamura@xxxxxxxxxxxxxxx
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/