namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

登録されている単語のそれぞれの数を調べたいのですが



木村です。

今,INDEX化したデータに登録されているキーワードの
それぞれの個数を調べたいと思っています。
そのため、またもや分からず、止まってしまっています。

NMZ.iには[
[単語1]について[文書ID1][スコア1][文書ID2][スコア2]…
[単語2]について[文書ID1][スコア1][文書ID2][スコア2]…と
登録されていっていると、どこかで読んだ覚えがあります。

そこで、一つの文書に[単語1]が登録されているたびに[文書ID]が
増えていくようであれば、
文書IDが入ってくるたび、カウントを行えばいいのではと
考えていたのですが。
スコアも登録されるということは、1つの[文書ID]内に数個の
[単語1]があった場合、1つの[文書ID1]の[スコア1]として
登録されているのでしょうか。

また、このNMZ.iの作成場所を教えていただければうれしいです。
毎回、このようなぶしつけな質問で申し訳ありませんが
どなたか、教えてください。

------
Yo-ko Kimura
d96071@xxxxxxxxxxxxxxx