namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Trouble of indexing on winNT



> 
> また、どのような手順で作業を行っているかも詳しく説明していただけれ
> ば何か分かるかもしれません。
> 
以下の手順で、mknmzもまったくいじっていない状態で検索結果を表示させてみま
した。なお正常表示とは文字化けをしていないという意味です。

1.namazu1.2.0.7.1 for win32 をダウンロード
2.デフォルトでインストール、namazu/docをインデックス化。
3.コマンドライン(c:>)で、namazu "試し",mamazu "動作",namazu "試してみよ
う"は正常に表示した。(文字化けはなかった)
4.ディレクトリjaを「日本語」、その下位ファイルを日本語(「マニュアル」、
「リンクス」、「紹介」、「よくある質問」)に変換、enを「英語」にした、コ
マンドラインで同様に検索したが正常に表示した。
5.その他のディレクトリ(下位に複数の日本語ディレクトリがある)をインデッ
クス化して、コマンドラインから namazu "**"と適当なワードを入力して検索
し、結果をファイルに保存すると、インデックス作成時の一番めのディレクトリ
に関しては、タイトル、抄録、ファイル名も正常表示。それ以外は、英語ファイル
名はOKだが、日本語ファイル名、抄録は文字化けとなっている。
6.上記ディレクトリ内の下位ディレクトリをローマ字のものと取り替えて同様に
インデックスを作成し、同様にコマンドラインから検索してみると、キーワード
Aの場合は、一つ目のディレクトリについては、正常表示し、あとのものは文字
化けした。(いずれもファイル名は正常表示)、次に2つ目のキーワードBの場
合は、正常表示するはずの一つ目のディレクトリについても、その中の一つのファ
イルが抄録の文字化けとなった。これはさらに下位の日本語ディレクトリにある
エクセルファイルをhtml化したものだった。(タイトルは正常表示)(いずれも、
ファイル名は正常表示)
7.上記ローマ字のディレクトリ名を少しかえてディレクトリの順番をかえてみた
ら、2つ目のディレクトリのファイルまで正常表示した。ただし、上のエクセル
のhtml化ファイルは同じ症状。
(上記はいずれもコマンドラインでのものです)

以下は、インデックス作成時のバッチファイルの内容です。対象ディレクトリ
は、3種類。下のものは、namazu/doc以下を日本語ディレクトリとした場合。

path c:\perl\bin;c:\perl\lib;c:\usr\local\bin;c:\usr\local\namazu\bin
set NAMAZUCONFPATH=c:\usr\local\namazu\lib\namazu.conf
SET KANWADICTPATH=c:\usr\local\lib\kakasi\kanwadict
SET ITAIJIDICTPATH=c:\usr\local\lib\kakasi\itaijidict

del c:\usr\local\namazu\index\NMZ.*
c:/perl/bin/perl c:/usr/local/bin/mknmz12071 -O c:/usr/local/namazu/index
                     (上の行の続き→     c:/usr/local/namazu/testdoc/


日本語コードのカオスに迷い込んだ気がします。だんだん素人には手におえない
世界になってきたような、、、。
「こんなに速くてイインデックスか?」「イインデックス!」なんて駄洒落を
<私が>言える日がくるのでしょうか?

原 ( mithara@xxxxxxxxxxxxxxxx )