[Namazu-devel-ja 857] Re: Namazu 2.0.15RC1 公開 + 動作チェックに協力していただける方募集

Tadamasa Teranishi yw3t-trns @ asahi-net.or.jp
2006年 1月 11日 (水) 14:28:41 JST


寺西です。

Yoshiharu ITO wrote:
> 
> o オリジナル chasen-2.3.3 + ipadic 2.7.0

余談ですが、ipadic 2.7.0 は開発版のはずです。
# だから何ということはないですけど。

> パッチをあてない場合 COMPOSIT_POS を有効にすることである程度分離されな
> くなることは確認できましたが, 品詞が変わるところで切れてしまうようです.

なるほど。

> 英文等はこれで良いかもしれませんが, わたしが期待している(大昔の chasen
> と同じ)出力結果とは異なるので不十分になります.

わかりました。"-" 等がダメなんですね。なるほど。

しかし、
http://chasen.aist-nara.ac.jp/ml/chasen-users/msg00299.html
のような問題もあり、どのみち大昔の ChaSen とは同じ動作にはならない
ので、そういう場合は 2.3.0 より前の ChaSen を使う必要があるいうのが
私の認識だったのですが...。
 
>  > そして、Namazu 2.0.15 からはこの修正すら必要としないはずです。
> 
> は, 繰り返しになりますが途試してみます.

で、Namazu 2.0.15 からは昔の ChaSen と同じかどうかは別にして、

00
17221
1fk
1fk-17221-00

が単語として登録されるはずです。
少なくとも "1fk-17221-00" が登録されない場合はバグということになり
ます。

> 端末の出力は
> 
>     :
> PASS: mecab-1.pl
> PASS: mecab-2.pl
> FAIL: mecab-3.pl
>     :
> 
> となりました. mecab-2.pl が PASS になってますが, test-log では

mecab-2.pl が PASS しちゃうのは問題ですが、これは次の RC2 からは
FAIL になるはずです。(既に修正済みのはずなので)

>     :
>   *** starting mecab-2.pl
>   *** ../scripts/mknmz -b -f /usr/home/yochy/namazu-2.0.15RC1/pltests/tmp.mknmzrc-mecab-2 -O /usr/home/yochy/namazu-2.0.15RC1/pltests/idx112 /usr/home/yochy/namazu-2.0.15RC1/pltests/../tests/data/ja
> 検索対象のファイルを調べています...
> 48個のファイルがインデックス作成の対象として見つかりました
> 1/48 - /usr/home/yochy/namazu-2.0.15RC1/pltests/../tests/data/ja/ID3v1.mp3 [audio/mpeg]
> No matching function for overloaded 'new_Tagger' at /usr/gnu/lib/perl5/site_perl/5.8.7/i386-freebsd-thread-multi-64int/MeCab.pm line 170.

同じエラーになっていますね。

perl バインディングのテストでは、

  use MeCab;

  my $c = new MeCab::Tagger (join " ", @ARGV);
  print $c->parse ($sentence);

であるのに大して、mknmz では

  require MeCab;
  import MeCab;

  $t = new MeCab::Tagger([qw(mecab -O wakati)]);
  my $text = $t->parse($str);

なので、これでエラーになる理由はないのですけどね。
# 謎です。use じゃないとダメ?

> うーん, わたしのところでは何も考えずに make できたんですけど....

手元の環境では

             :
reading ./Others.csv ..  2
reading ./Postp-col.csv ..  90
reading ./Postp.csv ..  146
reading ./Prefix.csv ..  206
reading ./Suffix.csv ..  1294
reading ./Symbol.csv ..  198
reading ./Verb.csv ..  128946
--> ここで HDD をずっとアクセスしている状態となります。

プロセスを見ると以下の処理で無限ループになるようです。

17752 pts/1    S      0:00 make
17753 pts/1    D      0:45 perl
/usr/local/libexec/mecab/mecab-dict-index -c euc
17755 pts/1    S      0:00 /usr/local/libexec/mecab/mecab-tool --darts
--input=-

どうも、mecab-tool か perl で無限ループ(あるいは非常に時間がかかる
処理)におちいっているようです。

ちなみに ChaSen 用の ipadic-2.7.0 では辞書の作成ができているので、
MeCab-0.90rc6 とうちの環境との相性の問題なのでしょう。

# 時間があれば、他の環境で試してみます。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns @ asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




Namazu-devel-ja メーリングリストの案内