Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

UFT-8 の HTML ドキュメントで文字化け



ども、佐藤@自宅です。

PHPの日本語マニュアル
 http://snaps.php.net/manual/ja/manual-ja-current.tar.gz

をダウンロードして、Namazu 2.0.5 でインデックスを作りましたが、HTML
が UTF-8 のため文字化けしてしまいます。
----------------------------------------------------------------------
検索結果
参考ヒット数: [ PHP: 1820 ] 

検索式にマッチする 1820 個の文書が見つかりました。

1. install.configure.html (スコア: 391) 
著者: 不明 
日付: Sat, 23 Dec 2000 18:19:08 
PHP 繝槭ル繝・繧「繝ォ 蜑阪・繝壹・繧ク 2. 遶 . 繧、繝ウ繧ケ繝医・繝ォ
谺。縺ョ繝壹・繧ク 險ュ螳壹が繝励す繝ァ繝ウ縺ョ螳悟・縺ェ繝ェ繧ケ繝/A 
豕ィ諢 </B > 縺薙l繧峨・繧ェ繝励す繝ァ繝ウ縺ッ縲√さ繝ウ繝 
/C/doc/php/01/manual-ja/install.configure.html (65,853 bytes)
----------------------------------------------------------------------

【環境】
 ・Windows98SE + IE5.5
 ・namazu 2.0.5
 ・kakasi 2.3.2
 ・ActivePerl 5.6.0.620
 ・AN HTTPD 1.32f
 ・pdftotext 0.92(xpdf-0.92-win32-ms.zip)
 ・gzip 1.2.4
 ・AcrobatReader 4.0J

上記環境で何か不足なのでしょうか。
・Linuxでは lv を使いますが、Win32も lv が必要なのかな…
・それともHTMLの変な改行位置のせいなのか?
----------------------------------------------------------------------
<HTML
><HEAD
><TITLE
 (略)
HREF="migration.html"><META
NAME="HTTP_EQUIV"
CONTENT="text/html; charset=UTF-8"></HEAD
><BODY
----------------------------------------------------------------------

#PHPの日本語マニュアルは1800近いファイル数なので、Namazuで検索したい
#のです(^^;

佐藤 充男
satou@xxxxxxxxxxxxxx