namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: namazu.el, bnamazu, NamazuJAVA



古川です。

>> On Fri, 10 Jul 1998 01:01:23 +0900, Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx> said:
  > DejaNews の fj.*, japan.* 版を望む今日このごろ

私も、なんとかならないかと思って試行錯誤しているのですが…


いろいろ実験してみると、今のところ、DejaNews では、

    JIS コードなどは、そのままの状態で
    EUC については、bit 7 を落として

扱っているようですね。

例えば、「高林」という語は、

    JIS コードの場合は ESC $ B 9 b N S ESC ( B
    EUC の場合は 9 b N S

としているようです。よって、$B9bNS* | 9bNS* で検索すれば、「高林」が
かなりヒットします。中間一致が無いのがつらいところですが。

# '$B9bNS' などという、意味不明の文字列を検索する、という行為に、不毛
# さを感じずにはいられませんが。


というわけで、私は、こういった変換をして、Location: ヘッダを返す cgi
を使っています。ただ、変換結果が記号になってしまうとお手あげですが。

あとは、delegate の "CHARCODE=fix" を経由させると、日本語の文字化けは
少しマシになります。

-- 

                                        ヤマハ(株)ピアノプレーヤ設計課
                                                              古川 令
                                             furukawa@xxxxxxxxxxxxxxxx