namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Addtional score.
短い昼休みなので簡単に。
Yukinori MAEDA <yuki@xxxxxxx> wrote:
>いくら10万件あるといっても、その中には有益な情報もあれば、
>MUAの操作ミスでながれてしまったメールもあるわけで、そういう
>どうでもいいメールがスコアが高くて先頭の方に出てきてしまうこ
>とがあります。
(snip)
>要は、ユーザの手を借りてより検索のヒット率をあげようというこ
>とです。
えっと、この辺の話は同じ研究室に工藤君という詳しい人がいるの
であとから訊いてみます。彼は以前に relevance feedback がどう
のこうのと力説していた気がします。
>jp.FreeBSD.ORG 専用にカスタマイズしてしまうのは簡単なんです
>が、できるだけ汎用的に作りたいですし、またフィードバックもし
>たいと思うので、こちらに投げた次第です。
そうしてもらえるとたいへんありがたいです。
>で、まずお聞きしたいのですが、こういった取り組みは今までに行
>なわれているんでしょうか? もっと良い方法があればそちらに乗り
>移りたいと思います。
いまのところありません。
>また、indexされたURI(URLでもいいですし、ファイルのパスでも良
>いのですが)から文書IDを得る方法というのはあるのでしょうか?
NMZ.field.url というファイルに URLのリストがあります。このファ
イルでは行番号がそのまま文書IDに対応しています。しかし、
NMZ.field.url は単なる行指向のテキストファイルなので、特定の
URLを探すには頭から全体を grep する必要があります。
NMZ.f と NMZ.field.* は重複したデータが多く含まれ、効率が悪
いので、今考えている v2.0 ではこれらのファイルの統合を予定し
ています。が、細かい話は何も決まっていません。
v2.0 は過去との互換性を無視して大胆に改造できるので、今回の
addtional score の件もうまく取り込めるようであれば、採用した
いと思います。開発の話は namazu-dev@xxxxxxxxxx にて。
# もしよければ Namazu の committer になりません?
p.s.
せっかくやる気が回復したのに急に忙しくなってしまいました。明
日はテストだし…。
-- Satoru Takabayashi
冷凍で売っているうどんって割にうまいのね