Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mknmzで文書ファイルから英単語リストの作成は可能か



特定の単語に反応 ^^;;;

# 未知の言語で mknmz の出力を elisp の補完に応用するって、なにか
# しらいいかも。

From: Satoshi Osabe <s-osabe@xxxxxxxxxxxxxxxxx> さん曰く
Subject: [namazu-users-ja] mknmzで文書ファイルから英単語リストの作成は可能か
Message-ID: <20030308222948.0100b050.s-osabe@xxxxxxxxxxxxxxxxx>
Date: Sat, 8 Mar 2003 22:29:48 +0900

> mknmzの出力ファイルについて質問です。
> htmlの文章より、英単語を全て取り出したいのですが、mknmzの出力ファイルを
> 使うことはできませんか。NMZ.wが最もほしいものに近いのですが、大文字
> 小文字が保たれていません。
> 
> 目的は、WideStudioという統合開発環境を用いてコーディングしている時、
> クラス名、メソッド名の入力補完をするための辞書ファイルを作成することです。
> コーディングにはMeadowを使用していますが、 WideStudioのリファレンスマニュアル
> より、クラス名、メソッド名を抽出して、辞書ファイルにして、それをもとに、
> meadowでispell-complete-wordで入力補完ができないかと思っています。

WideStudio ってなんだか知らないのですが、こういう目的のときは
「WideStudioのリファレンスマニュアルからクラス名、メソッド名を抽
出」しないといけないわけだから、なんらかの「法則」に則ってクラス
名、メソッド名を抽出しないと、その辞書は意味が無いですよね。

(おそらく)mknmz の出力ではその「法則」が失われているし、必要では
ない単語もたくさん含まれていると思うので、mknmz を使うより、自分
で「抽出する」手段を作ったほうが良いのではないかと思われます。
例えば、索引の見出し部分だけ抽出するとか、すばり クラス名一覧表
が本文に含まれていれば、全文検索の結果より良い辞書が出来ますよね。

# けど、できあがったらめちゃくちゃ便利になりそうですね。
# ぼくもあたらしい言語を使わなきゃいけないときは、まず、既存の
# major-mode を探す(なかったら作る)のと、思った通りに補完が効く
# ように頑張る、をやります :-)

ちなみに、辞書が出来た後も ispell-complete-word で使うより、
dabbrev や lisp-complete-symbol(のようなもの)で使えるようにした
方が便利じゃないかな、という気がします。

-- 
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)