Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: フレーズ検索のHASH値への変換方法



>                                            千葉市中央区長洲
>                                                    藤原  誠

> #いいだしっぺなので、案を整理します。

> 【元の表現】
> [単語1を含む文書の総数 * 2][文書ID][スコア][文書ID][スコア]...

> 【寺西さん案】
> [単語1を含む文書IDとスコアのバイト数][文書ID][スコア][文書ID][スコア]...

> 【小舞案1】
> 「単語1でHITのデータ領域のBER範囲」[文書ID][スコア][文書ID][スコア]...

> もう一つ案を追加。
> 【小舞案2】
> 「単語1に関するデータ領域のバイト数」[文書ID][スコア][文書ID][スコア]...

これは可変長レコードで、

            「単語1データのレコード長」[文書ID][スコア][文書ID][スコア]...

あるいはもっと簡単に
                         「レコード長」[文書ID][スコア][文書ID][スコア]...

ではどうでしょうか ?
ただし「単語1データのレコード長」はおおよその数として、
「単語1を含む文書の総数 * 2」になる、
---
(藤原)