Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: ms-word ドキュメントのヘッダ、フッタは検索対象になるのか



Amuro Rayです。

その後の疑問です。

そもそも、mknmzによるインデックスの作成は、どのように行
われているのでしょうか?
nkf、KAKASIの説明はよくあるのですが、mknmzの挙動って見た
ところ余り紹介されていないようで、ヘッダ、フッタの情報が
どの時点で切り捨てられているのか、見当がつかないのです。

推測なんですが、

mknmz
↓
filter対象チェック(どうなっているかわかりません。)
↓
対象filterプログラム処理
↓
検索対象ファイルを全てHTMLにする!?
↓
nkfコード変換!?
↓
分かち書き
↓
インデックスファイルに保存

のような順番でしょうか?
filter以下ディレクトリを見てみましたが、検索対象ファイル
のチェックや、フィルタ処理などはPerlを知らないので、特に
見当がつかないです。とほほ。



"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜

Name   :   Amuro Ray
E-Mail  :  gundam@xxxxxxxxxxxxxxxx

"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜