Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

環境変数 LANG



うすだといいます。始めて投稿させてもらいます。

Namazuをいつも使用させていただいております。
自由に使用できる全文検索ソフトはずっと欲しかった物
でしたので大変重宝しています。

現在は職場で作成したドキュメントや、関連機関のWebデータ
を収集した物のサーチに利用しています。

NamazuがVer2になったことから早速入れ替えをしたのですが、
実のところ即座に躓きました。
Ver2.0.1になって改善されたところや当メーリングリストの記述
で解決できたこともありますが、気になる部分もありますので
4点ほど、ご報告と質問をさせて戴きます。

使用環境は以下の通りです。
OS     : FreeBSD 3.2-RELEASE
Namazu : Ver2.0.1
Perl   : version 5.005_03 built for i386-freebsd
gcc    : version 2.7.2.1 
nkf    : Version 1.7 (1/9811/Shinji Kono)
kakasi :  Version 2.3.1


1.環境変数 Lang = C のときにmknmzでインデックスを作成すると
 日本語部分がバラバラになることについてマニュアルに記述をお願い
 します。
 おそらく英語のみでの利用との折衷からこういう仕様に変更されたと
 思いますが、Ver1のときと違う挙動なので、環境変数をセットする
 理由や"ja"にしなかったときの挙動などをマニュアルにもう一言
 記述してくださればと思います。

 例:「建設」で探したときに { [ 建: 0 ] [ 設: 0 ] :: 0 }として
  ヒット数0になることなど。
 これには、大分悩みました。
 職場内のサーバーには日本語データを蓄積していますが、日本語環
 境は不要なのでLang = ja と設定することはありません。
 Lang = ja でmknmzを実行すれば希望通りのインデックスは作れますが
 環境変数以外に実行時オプションで指定することができても
 よいのではないでしょうか。

2.mknmzrcの読み込み後の優先順位
 テストのために./mknmzrcというファイルを作成して
  % mknmz --config=./mknmzrc -V /home/www/foo 
  として実行しています。

  @@ 設定ファイルを読み込み中:
  @@  /usr/local/etc/namazu/mknmzrc
  @@  ./mknmzrc
  @@ 対象の探索を開始: Fri Mar  3 12:59:13 2000
 
  となっているので./mknmzrcも読み込んでいるようですが
  /usr/local/etc/namazu/mknmzrc内の設定に従って動作しているようです。
 テスト時に/usr/local/etc/namazu/mknmzrcをrenameして試していますが
 改善ができたらお願いします。

3.Excelのファイルへの対応
 Excelのファイルをhtmlに吐き出すxlHtmlというものもあるようです。
 (http://www.gate.net/~ddata/xlHtml/index.htm)
 MSword用のフィルターwvHtmlを利用するmsword.plを少し書き換えて
 excel.plとでもすれば使えるようです。

 この際Namazu2.0.1付属のMMagic.pmでは
 Excel95ファイルは(application/excel)として認識されますが
 Excel97ファイルは(application/powerpoint)として認識されてしまいますので
  下記の程度の追加が必要です。
 # Reversed-engineered MS Office magic numbers
 0	string		\320\317\021\340\241\261\032\341
 >48	byte		0x1B		application/excel
 0	string		\320\317\021\340\241\261\032\341 <=追加
 >48	byte		0x1E		application/excel      <=追加
 
 ただし、Excel97ファイルはUTF8コードのhtmlファイルに変換されているので
 lvでeuc等に置き換えることで検索ができますが
 Excel95ファイルは何のコードに変換されているのか不明なので利用できない
 かも知れません。

4.説明書のmknmzコマンド行引数の所に -C の説明がありません。
 追加をお願いします。
************************************************
臼田幸生 <usuda@xxxxxxxxxx>
建設省土木研究所  建設マネジメント技術研究センター