Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 日本語ファイル名の検索について (namazu-bugs-ja#199)



  とりあえず ML のみに。

<20020521053637.1D06910436@xxxxxxxxxxxxxxxx>の記事において
sakano@xxxxxxxxxxxxxさんは書きました。

>> インデックス作成の際、日本語ファイル名が分かち書きされる場合と、されない場合がある。
>> ファイルの内容に日本語が存在する場合は、日本語ファイル名も分かち書きされ、
>> ファイルの内容に日本語が存在しない場合は、日本語ファイル名は分かち書きされない模様。

  これは、ファイルの中に日本語が含まれない場合わかちがき処理をおこなわ
ないためです。

# 具体的には load_document の最後のあたりと count_words の 
# wakatize_japanese を呼ぶあたり。

  まあ直した方がいいですかね。

>> $ cat NMZ.field.uri
>> /tmp/index/../test2/%A5%D5%A5%A1%A5%A4%A5%EB%CC%BE.txt

  これは -U option を使えばで済む話かな。
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
	knok@xxxxxxxxxx / knok@xxxxxxxxxx