namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE: [namazu 1262] インデックス対象外にするには?



初めてお便りします。

インドネシア在住の戸塚と申します。

インドネシア在住の有志で「よろずインドネシア」という
掲示板を運営しています。
インドネシアについての同様の質問等が多く、mamazu
を利用させて頂き、インデックスを作成して、先ずは
過去ログの検索をして頂くようお願いしています。

>HTMLファイルを mknmz をする時に、ある単語を
>インデックス対象外にする方法はないのでしょうか?

実は、私もこの問題で悩みました。

私どもの過去ログにも、おっしゃるように定型文が付与
されたり、自動処理のためのタグが多くこれを削除して
みました。

私共の削除目的は、もう一つ、賃借しているサーバー
スペース削減で、今回、年末年始休みを利用して徹底
削除を試みました。

投稿本文からは、定型文(不要分)とフォローアップの
日付、時刻、自動処理用タグを外し、容量的には
40%程の削減になりました。

また、インデックス用元ファイルでは、titleは残しました
が、次のtitleと同じ標題やら、各種改行コード、全角
スペース、半角スペースx2等々を取り除きました。
これにより、ひらがな、カタカナの検索スピードが上が
ったように思っています。ただ、インデックスファイル容量
の削減率は、思った程上がらず、十数パーセントで、
結果は、元ファイルよりも、インデックスファイルの容量
の方が大きくなってしまいました。

この削除のためのソフトには、textSSを使っています。
↓は作者のホームページです。
http://www.yamashita-y.tis.ne.jp/atelier/
namazuと同様に使い勝手の良いソフトです。

また、私共の掲示板は、
http://yorozu.indosite.org/index.shtml

検索のページは、
http://yorozu.indosite.org/search/

です。覗いて頂ければ幸いです。

戸塚龍太郎
PT Intechsys Trisatya
Jakarta, Indonesia