Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 日本語のディレクトリー名とファイル名で困っています ( 自己解決)



こんにちは、作山@日本総研です。

>
>発生している現象
> wgetで収集したファイル名がshift-jisで保存される
> 為に、うまくmknmzできなかったり、Link先に
> Jumpできなかったりしている。
> (ディレクトリー名は %8Edなどのようにエンコード
> された状態で保存されているがファイル名が英字の
> 場合は、正常にJumpできる。)

とりあえず(私自身は嫌いな言葉なのですが)、何とかする事ができました。

以下のような形で正常にLink先へJumpできるように
インデックス作成が出来るようになりました。

根本原因
  wgetがShift-JIS(カナ・漢字)のファイル名がShift-JISのまま
  Solaris内に記録されてしまう。

解決策
  私の力では、wgetのソースまでは手を出し切れないので、
  wgetで取得後、ファイル名にカナ漢字が含まれているものに
  ついて、%xxのエンコード後のファイル名にRenameする
  perlを作成し、個々のファイル名をRenameするように
  しました。

  結果、namazuの検索結果上では、エンコードした%xxの
  表示で見苦しいが、正常にLink先にJumpできるように
  なりました。



以上、よろしくお願いします。
______________________________________________________________________
作山@日本総研              (Office) mailto:sakuyama.akio@xxxxxxxxx
TEL 03(5431)7839              (Home) mailto:sakuyama@xxxxxxxxxxxxxxxxxx
FAX 03(3422)1745                                   JWNTUG:JWNTUG001739