[Namazu-users-ja 556] Re: htmlファイルのみを検索対象にする

Atsuko Nakamoto Nakamoto_Atsuko @ nissin.co.jp
2005年 10月 25日 (火) 09:25:13 JST


中本です。
おはようございます。


> mknmzrc の LANG には何を設定していますか?
Lang ja
に設定しています。


> $ locale -a | grep ja
> 
> の結果は何がでますか?

ja_JP
ja_JP.eucjp
ja_JP.ujis
ja_JP.utf8
japanese
japanese.euc

>$ locale
>の結果もお知らせください。

LANG=ja_JP.eucJP
LC_CTYPE="ja_JP.eucJP"
LC_NUMERIC="ja_JP.eucJP"
LC_TIME="ja_JP.eucJP"
LC_COLLATE="ja_JP.eucJP"
LC_MONETARY="ja_JP.eucJP"
LC_MESSAGES="ja_JP.eucJP"
LC_PAPER="ja_JP.eucJP"
LC_NAME="ja_JP.eucJP"
LC_ADDRESS="ja_JP.eucJP"
LC_TELEPHONE="ja_JP.eucJP"
LC_MEASUREMENT="ja_JP.eucJP"
LC_IDENTIFICATION="ja_JP.eucJP"
LC_ALL=

> 
> 問題のHTMLファイルの中身をお見せいただくことは可能でしょうか?
> 

すみません、難しいです。

> > namazuは、2.0.13-1を利用していて、Configulationは次のようになっております。
> > > mknmz -C
> > 読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc
> > システム: linux
> > Namazu: 2.0.14
> 
> mknmz は 2.0.14 だと言いはっていますが、2.0.13 なのでしょうか?
> いずれにしても 2.0.14 にバージョンアップしてください。
>

$namazu -v 
namazu of Namazu 2.0.14
Copyright (C) 1997-1999 Satoru Takabayashi All rights reserved.
Copyright (C) 2000-2004 Namazu Project All rights reserved.
This is free software; you can redistribute it and/or modify
it under the terms of the GNU General Public License as published by
the Free Software Foundation; either version 2, or (at your option)
any later version.

This program is distributed in the hope that it will be useful,
but WITHOUT ANY WARRANTY; without even the implied warranty
of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
GNU General Public License for more details.


> > 今までは問題なくインデックス作成できましたが、インデックス作成対象を別の
> > ものに変えたら、このようなエラーが出ました。
> 
> 該当 HTML ファイルの中に ¡ というものが含まれるのでしょう。
> 今までのものには数値実態参照のものが含まれていなかったということ
> ではないかと思います。

エラー文辺りのHTMLファイルを見てみると、文字化けしたファイルでした。
このファイルは検索対象外にし、しばらく様子を見ることにします。
すみません、ありがとうございます。




Namazu-users-ja メーリングリストの案内