[Namazu-devel-ja 835] Re: Namazu 2.0.15RC1 動作チェック  (Vine Linux3.2)

Yukio USUDA m6694ha392t @ asahi-net.or.jp
2006年 1月 7日 (土) 08:40:40 JST


臼田です

Tadamasa Teranishi wrote:
> > 
> > とりあえず、分かち書きの結果がわからないので、EUC-JP で
> > "*全* *文* *検* *索*"
> > を検索してテストしようかと思います。
> 
> この修正を行った差分を添付します。
> 
試してみました。

chasen で utf-8 辞書を使用する設定になっている場合に
エラーになることを確かめました。

PASS: namazu-cgi-10.pl
FAIL: chasen-1.pl
PASS: mecab-1.pl
PASS: kakasi-1.pl
PASS: kakasi-2.pl
PASS: kakasi-3.pl
====================
1 of 43 tests failed
====================

chasen の辞書がどの文字コードになっているのかは問い合わせる方法
がないのでやっかいですね。

> > 少なくとも辞書が UTF-8 だったら、これは見つからないだろうという予測
> > によるものです。
> 
> ipadic の辞書を UTF-8 に変換してみたのですが、エラーが出てしまい
> ました。

私が chasen サイトの FAQ を元に作業した際には
$ `chasen-config --mkchadic`/makemat -i w 
を実行した際に
/usr/local/libexec/chasen/makeda: Symbol.dic:28-251: premature end of file or  string
と引っかかりました。
Symbol.dic の変換がうまくいかないようなのですが、これは記号ばかりの辞書なので
当面不要と判断してこれだけリネームし無効にしておいて変換作業を完了させました。


> > ですが、インデックス対象のファイルをHTMLだけにすることでも良さ
> > そうです。
> 
> やはり html.html ファイルだけを対象とするようにしました。

テスト目的がはっきりしてよいと思います。

臼田幸生




Namazu-devel-ja メーリングリストの案内