Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mknmzで文書ファイルから英単語リストの作成は可能か



長部です。

On Sat, 08 Mar 2003 23:13:04 +0900 (JST)
Hideyuki SHIRAI (白井秀行) <shirai@xxxxxxxxxxxxxxxxxxx> wrote:


> WideStudio ってなんだか知らないのですが、こういう目的のときは
> 「WideStudioのリファレンスマニュアルからクラス名、メソッド名を抽
> 出」しないといけないわけだから、なんらかの「法則」に則ってクラス
> 名、メソッド名を抽出しないと、その辞書は意味が無いですよね。 
> (おそらく)mknmz の出力ではその「法則」が失われているし、必要では
> ない単語もたくさん含まれていると思うので、mknmz を使うより、自分
> で「抽出する」手段を作ったほうが良いのではないかと思われます。
> 例えば、索引の見出し部分だけ抽出するとか、すばり クラス名一覧表
> が本文に含まれていれば、全文検索の結果より良い辞書が出来ますよね。

mknmzの出力を利用する場合、クラス名、メソッド名以外の単語も出て来る
ので、確かにあまりよくありませんね。WideStudioのリファレンスマニュアル
を見た所、クラス名、メソッド名、プロパティ、トリガ名等がhtmlの
タグを手がかりに取り出せることが分かりました。Rubyでスクリプトを
書いてみます。

> 
> ちなみに、辞書が出来た後も ispell-complete-word で使うより、
> dabbrev や lisp-complete-symbol(のようなもの)で使えるようにした
> 方が便利じゃないかな、という気がします。

dabbrevのことは知っているのですが、バッファにあるファイル内の単語しか
候補にならないようなので、使えないかなと思ったのですが、どうなんで
しょうか。辞書を作って、毎回バッファに読み込んでおくのが一番安直
ですが、あまり賢くはないですよね。