[Namazu-win32-users-ja 1269] インデックスファイルの文字コード

Toru Ishizuka ishizuka @ o-plans.co.jp
2010年 10月 12日 (火) 21:04:03 JST


たびたびお世話になります 石塚です。

 win版perlの制約から逃れるため、linux(CentOS5.3)上で
windowsの共有ディレクトリをマウントした状態でインデック
スを作成してみましたが、260byte以上のパスも下位バイトに
0x5cを持つ文字を含むパスでも正常に扱えることを確認できま
した。
 同じようにcygwin(1.7.7)上でnamazuを実行したのですが、
インデックスは作られるものの、文字コードが他の環境と違う
ためか、キーワードによる検索ができません。キーワード以外
の+filename:や+uri:による検索はできています。

 ・NMZ.field.XXXXファイルの文字コード
  cygwin UTF8
  CentOS EUC
  Win    EUC

 ・NMZ.wの文字コード
  cygwin UTF8
  CentOS EUC
  Win    EUC

 windows環境でもEUCでファイルができているので、namazuの
実行環境によらずEUCでファイルが作成されるものだと思って
いるのですが、確認すべき設定等はありますでしょうか。
 ※cygwinの標準機能ではsmbfsが使えなかったため、windows
側で共有したフォルダをcygwin側から参照しています。

 よろしくお願いします。

---
ishizuka



Namazu-win32-users-ja メーリングリストの案内