Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

lv コンバートが機能していないようです



はじめて投稿させていただきます。
Amuro Rayです。

今後ともどうぞよろしくお願いします。

Namazuの検索対象のコンバートについてつまずいているので、
どなたかご伝授いただければ幸いです。

●問題
Microsoft WordドキュメントをNamazuの検索対象にするために、
wvWare+lvを使って検索しましたが、Namazuの検索結果が文字
化けしてしています。

ただし、検索結果のパスからwordドキュメントは正しく読み出
し、word文書を参照することはできています。

●現状

1.Namazuの検索結果には、対象のファイルサマリとパスが表
示されているので、目的のWordファイルはNamazuのインデック
スになっている。NMZ.slogを参照したところ、文書中のアルフ
ァベットのみ確認できたが、日本語の部分は化けている。


2.wvWareのコンバートを次のように確認したところ、

    $wvWare test.doc > test.html
    $less test.html

    <META HTTP-EQUIV="Content-Type" CONTENT="text/html; 
  charset=UTF-8">

    UTF-8の出力を確認。(当然日本語部分は化けている。)
  ブラウザ(Netscape6.2)では、日本語もすべて正しく表示さ
  れている。

3.lvのコンバートを確認したところ、

    $lv -Iu8 -Oej test.html
    $less test.html

    文字化けせずEUC-JISでの出力を確認。


4.mknmzのインデックス作成状況のレポートを見ると、どう
もlvが起動していない様子。

インデックス作成のmknmz出力

Looking for indexing files...
8 files are found to be indexed.
1/8 - /usr/share/namazu/doc/ja/manual.html [text/html]
2/8 - /usr/share/namazu/doc/ja/nmz.html [text/html]
3/8 - /usr/share/namazu/doc/ja/test.html [text/html]
4/8 - /usr/share/namazu/doc/ja/tips.html [text/html]
5/8 - /usr/share/namazu/doc/ja/tutorial.html [text/html]
Diagnostic: (./wvWare.c:1168) Attempt to open /usr/local/lib/wv/wvHtml.xml faile
d, using /usr/local/share/wv/wvHtml.xml
 Diagnostic: (./ftxbxs.c:11) 1
 Diagnostic: (./ftxbxs.c:12) 0
 Diagnostic: (./ftxbxs.c:13) 0
 Diagnostic: (./ftxbxs.c:14) -1
 Diagnostic: (./ftxbxs.c:15) 1026
 Diagnostic: (./ftxbxs.c:16) 0
 Diagnostic: (./ftxbxs.c:11) 1
 Diagnostic: (./ftxbxs.c:12) 0
 Diagnostic: (./ftxbxs.c:13) 0
 Diagnostic: (./ftxbxs.c:14) 0
 Diagnostic: (./ftxbxs.c:15) 0
 Diagnostic: (./ftxbxs.c:16) 0
 Diagnostic: (./bkd.c:60) bkd cp is 0
 Diagnostic: (./bkd.c:60) bkd cp is 33
 Diagnostic: (./bkd.c:60) bkd cp is 36
 Diagnostic: (./bkd.c:65) bkd id is 0
 Diagnostic: (./bkd.c:65) bkd id is ffffffff
 Diagnostic: (./escher.c:112) Eating type 0xf00b
 Diagnostic: (./escher.c:631) Eating type 0xf122
 Diagnostic: (./escher.c:223) Eating type 0xf004
 Diagnostic: (./wvWare.c:851) field began
 Diagnostic: (./wvWare.c:864) this field has an associated embedded object of id
 3de0f402
 Diagnostic: (./field.c:261) embed
 Diagnostic: (./field.c:341) command  EMBED MSDraw.Drawing.8.2  , ret is 0
 Diagnostic: (./wvWare.c:902) picture 0x01 here, at offset 0 in Data Stream, obj
 is 0, ole is 0
 6/8 - /usr/share/namazu/doc/ja/test.doc 
 [application/msword]
7/8 - /var/www/web/worddoc/test.html [text/html]
Diagnostic: (./wvWare.c:1168) Attempt to open /usr/local/lib/wv/wvHtml.xml faile
d, using /usr/local/share/wv/wvHtml.xml
 Diagnostic: (./ftxbxs.c:11) 1
 Diagnostic: (./ftxbxs.c:12) 0
 Diagnostic: (./ftxbxs.c:13) 0
 Diagnostic: (./ftxbxs.c:14) -1
 Diagnostic: (./ftxbxs.c:15) 1026
 Diagnostic: (./ftxbxs.c:16) 0
 Diagnostic: (./ftxbxs.c:11) 1
 Diagnostic: (./ftxbxs.c:12) 0
 Diagnostic: (./ftxbxs.c:13) 0
 Diagnostic: (./ftxbxs.c:14) 0
 Diagnostic: (./ftxbxs.c:15) 0
 Diagnostic: (./ftxbxs.c:16) 0
 Diagnostic: (./bkd.c:60) bkd cp is 0
 Diagnostic: (./bkd.c:60) bkd cp is 33
 Diagnostic: (./bkd.c:60) bkd cp is 36
 Diagnostic: (./bkd.c:65) bkd id is 0
 Diagnostic: (./bkd.c:65) bkd id is ffffffff
 Diagnostic: (./escher.c:112) Eating type 0xf00b
 Diagnostic: (./escher.c:631) Eating type 0xf122
 Diagnostic: (./escher.c:223) Eating type 0xf004
 Diagnostic: (./wvWare.c:851) field began
 Diagnostic: (./wvWare.c:864) this field has an associated embedded object of id
 3de0f402
 Diagnostic: (./field.c:261) embed
 Diagnostic: (./field.c:341) command  EMBED MSDraw.Drawing.8.2  , ret is 0
 Diagnostic: (./wvWare.c:902) picture 0x01 here, at offset 0 in Data Stream, obj
 is 0, ole is 0
 8/8 - /var/www/web/worddoc/test.doc [application/msword]
Writing index files...
[Base]
Date:                Sat Dec  8 18:40:43 2001
Added Documents:     8
Size (bytes):        241,979
Total Documents:     8
Added Keywords:      2,943
Total Keywords:      2,943
Wakati:              module_kakasi -ieuc -oeuc -w
Time (sec):          10
File/Sec:            0.80
System:              linux
Perl:                5.006001
Namazu:              2.0.5


5.mknmzrcを確認。次の行以外がすべてコメントアウト"#"に
なっていた。(mknmzrcの機能自体よくわかっていないので、理
解が必要なところです。)

package conf;  # Don't remove this line!
(そのほか#ですべてコメントアウトされていた。wvWareはいっ
たいどこから起動されているのかが不明。)



●実施したセットアップ

TurboLinux7のバンドルパッケージNamazuとlvが既にインスト
ールしてある環境に、wvWareをダウンロード、コンパイル、イ
ンストール。(DNS、Webサーバが動作している環境)

コンバートツールがインストールされていると、インデックス
の対象になると、ある本に書かれていたのですが、その仕組み
はわからずじまいで、解決の糸口を探している状況です。

問題になっている使用環境は次のとおりです。
よろしくお願いします。


環境
TurboLinux7
Linux 2.4.5-3
nkf 1.9
kakasi 2.3.2
perl 5.6.1
namazu 
wvWare 0.6.7
lv 4.49.4

"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜

Name   :   Amuro Ray
E-Mail  :  gundam@xxxxxxxxxxxxxxxx

"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜