Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: namazu-2.0.12-mecab.patch



竹迫です。

Perl 5.005_03 の our 宣言問題は、修正パッチを commit しました。
代わりに use vars を使用することにしました。
(参照: namazu-devel-ja#03067,03068)

>takesako@xxxxxxxxx wrote:
>> 
>> 以前 mecabメーリングリストで話題になった namazu-2.0.12-mecab.patch
>> を commit しました。(HEAD, stable-2-0)
>...
>> とりあえず、experimental という位置付けで Namazu 2.0.13 で公開したい
>> と思います。
>
>experimental という位置付けでも公開するなら、ドキュメントの修正も
>しませんか? (まずは、必要最小限程度でも)

とりあえず最低限のドキュメントの修正として、以下を考えています。

問題がないようであれば、臼田さんの tutorial.html の修正も含めて、
明日の朝 commit する予定です。(stable-2-0 HEAD 両方とも)

cvs server: Diffing doc/ja
Index: doc/ja/tutorial.html
===================================================================
RCS file: /storage/cvsroot/namazu/doc/ja/tutorial.html,v
retrieving revision 1.44.4.10
diff -u -r1.44.4.10 tutorial.html
--- doc/ja/tutorial.html        11 Jul 2003 09:02:09 -0000      1.44.4.10
+++ doc/ja/tutorial.html        15 Jul 2003 08:59:38 -0000
@@ -189,13 +189,40 @@
   <td>1.03</td><td>&lt;=</td><td>
   <a href="http://www.daionet.gr.jp/~knok/chasen/Text-ChaSen-1.03.tar.gz">
   Text-ChaSen-1.03.tar.gz</a></td>
-  <td align=CENTER>
+  <td>
   <a href="http://www.daionet.gr.jp/~knok/chasen/">
   野首貴嗣</a></td>
   <td><a href="http://www.daionet.gr.jp/~knok/chasen/">Text::ChaSen</a></td>
   <td><br></td>
 </tr>

+<tr>
+  <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">MeCab</a></td>
+  <td>(和布蕪) -- 日本語 形態素解析器</td>
+  <td>△</td>
+  <td>0.76</td><td>&gt;= 0.6</td><td>
+  <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/src/mecab-0.76.tar.gz">
+  mecab-0.76.tar.gz</a></td>
+  <td>
+  <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">
+  工藤 拓</a></td>
+  <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/src/">MeCab</a></td>
+  <td>※ experimental support</td>
+</tr>
+
+<tr>
+  <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings.html">mecab-perl</a></td>
+  <td>MeCab Perl モジュール化</td>
+  <td>▲</td>
+  <td>0.76</td><td>&gt;= 0.76</td><td>
+  <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings/mecab-perl-0.76.tar.gz">
+  mecab-perl-0.76.tar.gz</a></td>
+  <td>
+  <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings.html">
+  工藤 拓</a></td>
+  <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings/">MeCab</a></td>
+  <td>※ experimental support</td>
+</tr>

 <tr><td>
 <a href="http://search.cpan.org/search?mode=module&amp;query=MMagic">File::MMagic</a>
@@ -220,9 +247,11 @@
 <table cellspacing=0 cellpadding=3 border=1>
 <tr><td>両方用意しておいた場合</td><td>
 (無指定ではわかち書きに KAKASI を使うが、茶筌も
--c オプションをするだけで使用できる)</tr>
+-c オプションをするだけで使用できる)</td>
+</tr>
 <tr><td>片方しか用意していない場合</td><td>
-./configure の時点でどちらを使うかが選ばれます。</tr>
+./configure の時点で KAKASI/ChaSen のどちらを使うかが選ばれます。</td>
+</tr>
 </table>

 <li>
@@ -234,6 +263,17 @@
 インストールは <code>perl Makefile.PL; make; make install</code>
 と実行するだけです。
 問題がなければ入れておいた方がいいでしょう。
+
+<li>
+※ MeCabを使用する場合 (Namazu 2.0.13 から実験的にサポート)<br>
+現在は、mknmz の設定ファイル mknmzrc をカスタマイズして使用する必要があります。
+コマンドライン版の mecab を使用する場合は、
+$WAKATI = "mecab -O wakati";
+Perlモジュール版 MeCab を使用する場合は、
+$WAKATI = "module_mecab";
+と書く必要があります。
+ただし、MeCab は現在開発段階にあり、仕様そのものが不安定です。御了承ください。
+
 <li>
 namazu 2.0 以降では ChaSen2 にだけ対応しています。

@@ -732,6 +772,12 @@
 <a href="http://chasen.aist-nara.ac.jp/">Chasen (茶筌)</a>
 <dd>「日本語形態素解析器」であるが、KAKASIと同様に「わかち書き」
 (正確には日本語の単語の切出し)に使っている。
+
+<dt>
+<a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">MeCab (和布蕪)</a>
+<dd>MeCab は、ChaSenを基に開発された高速な形態素解析器です。
+現在 ChaSen とは独立に、工藤さんがフルスクラッチから開発しています。
+解析精度は ChaSen と変わらないにもかかわらず、ChaSen より高速に動作します。

 <dt>わかち書き
 <dd>
Index: doc/en/tutorial.html
===================================================================
RCS file: /storage/cvsroot/namazu/doc/en/tutorial.html,v
retrieving revision 1.9.4.9
diff -u -r1.9.4.9 tutorial.html
--- doc/en/tutorial.html        11 Jul 2003 09:02:08 -0000      1.9.4.9
+++ doc/en/tutorial.html        15 Jul 2003 08:59:35 -0000
@@ -199,6 +199,33 @@
   <td><br></td>
 </tr>

+<tr>
+  <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">MeCab</a></td>
+  <td>Yet Another Japanese Morphology Analyzer</td>
+  <td>for Japanese processing only. **</td>
+  <td>0.76</td><td>&gt;= 0.6</td><td>
+  <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/src/mecab-0.76.tar.gz">
+  mecab-0.76.tar.gz</a></td>
+  <td>
+  <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">
+  Taku Kudo</a></td>
+  <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/src/">MeCab</a></td>
+  <td>*** experimental support</td>
+</tr>
+
+<tr>
+  <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings.html">mecab-perl</a></td>
+  <td>MeCab Perl Module</td>
+  <td>for Japanese processing only. ++</td>
+  <td>0.76</td><td>&gt;= 0.76</td><td>
+  <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings/mecab-perl-0.76.tar.gz">
+  mecab-perl-0.76.tar.gz</a></td>
+  <td>
+  <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings.html">
+  Taku Kudo</a></td>
+  <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings/">MeCab</a></td>
+  <td>*** experimental support</td>
+</tr>

 <tr><td>
 <a href="http://search.cpan.org/search?mode=module&amp;query=MMagic">File::MMagic</a>
@@ -246,6 +273,15 @@
 When executing ./configure, Namazu selects which one to use.</tr>
 </table>

+<li>using MeCab (***), it supports experimentally above Namazu 2.0.13.<br>
+It is necessary to customize mknmzrc.
+If you want to use MeCab of command line version,
+write it as $WAKATI = "mecab -O wakati"; .
+And, if you want to use MeCab of Perl module version,
+write it as $WAKATI = "module_mecab"; .
+However, MeCab is in a development stage now
+and its specification is unstable.
+
 <li>
 Namazu 2.0x requires ChaSen 2.x.
 The older version of ChaSen 1.x will not work with Namazu 2.0.x.
@@ -740,6 +776,12 @@
 <dt>
 <a href="http://chasen.aist-nara.ac.jp/">ChaSen</a>
 <dd>Japanese morphological analyzer. Namazu uses this as a segmentation tool.
+
+<dt>
+<a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">MeCab</a>
+<dd>MeCab is yet another part-of-speech and morphological analyzer which developed based on ChaSen.
+Mr. Kudo is developing from the full scratch, independently of ChaSen.
+Although analysis accuracy does not change with ChaSen, it operates at high-speed than ChaSen.

 <dt>Segmentation
 <dd>


--
  株式会社ドリーム・アーツ
    竹迫 良範  <takesako@xxxxxxxxxx>