Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Html ファイルの拡張子が ht になる



From: "Shinichi Kaneko" <kintaro@xxxxxxxxxxxxxx> さん曰く
Subject: [namazu-win32-users-ja] Re: Html ファイルの拡張子が ht になる
Message-ID: <004401bf8d74$400511a0$0200a8c0@FMV>
Date: Tue, 14 Mar 2000 14:07:36 +0900

金子>  c:\namazu\var\namazu\index\NMZ.field.uri
金子> 
金子> ですが、「.ht」になっていました。
金子>  具体的には
金子>    /D|/MyDocument/PC購入/周辺機器/ストレージバックアップの悩み.htm
金子>     /D|/MyDocument/PC購入/周辺機器/ストレージ関係.ht
金子>                                                                        ^^^

# なんか (私が見ると) ^^^ の場所がずれているけど、プロポーショナ
# ルフォントでメールを書いていらっしゃるのかな?

金子> NMZ.field.uri は手動で修正はしていません。
金子> インデックス作成時は
金子>  c:\namazu\var\namazu\index 以下をすべて削除してから
金子> 
金子> mknmz -k -O c:\namazu\var\namazu\index -U D:\MyDocument\
金子> 
金子> でindexを作成しています。

## 最初からこちらを見せていただければ、一発でわかったんですが。。。

個人的には日本語混じりの directory/file は一切使わないので考慮か
ら落ちていました。^^;;;

金子> mknmz -k -O c:\namazu\var\namazu\index -U D:\MyDocument\
                                             ~~
help より、
  -U, --no-encode-uri       URIのencodeを行わない

なのですが、field.uri に 2バイト文字(しかも、SJIS)を直接出力して
いる時点で OUT です。

# ちょっと前の窓の杜の「不・」と同じ問題ですね。
 
% mknmz -k -O c:\namazu\var\namazu\index D:\MyDocument\

とすると、例えば

'/c|/tmp/漢字/なまず.htm' => '/c|/tmp/%8A%BF%8E%9A/%82%C8%82%DC%82%B8.htm'

と encode して書き、namazu を動かしたときに

'/c|/tmp/%8A%BF%8E%9A/%82%C8%82%DC%82%B8.htm' => '/c|/tmp/漢字/なまず.htm'

と decode して表示します。

-- 
白井秀行@encode は SJIS のままだったのね。