Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 「<」をTITLEに含む時に (namazu-bugs-ja#636)



寺西です。

# 古い話ですが。

kiyopii-h@xxxxxxxxxxxxxx wrote:
> 
> <TITLE>の中に「<」(ダブルバイト文字の"<")を含む場合、検索結果
> 画面で、文章のタイトルが表示されずにファイル名が表示されます。
...
> しかし例外があり、「<」の後ろに半角のスペースがある場合は正しく
> 解釈されます。
> たとえば、<TITLE>< ほげほげ>ほげ<TITLE>

<TITLE> < ほげほげ>ほげ<TITLE>

のように「<」の前後にスペースがある場合は、大丈夫なようです。

> 内部で「<」が「<」に変換され、タグとして認識されているのでしょうか?

NKF の -Z1 オプションにより「<」が「<」に変換され、タグの区切りと
して認識されています。
「<」の前後にスペースがある場合は、&lt; に変換されるため、タグの
区切りとはみなされず、正しく表示されるようです。

これは、最大マッチングによる誤認で、最小マッチングになるように
修正することで改善できました。(commit 済み)
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E