Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: phrase search



皆様はじめまして,
鈴木@名古屋大と申します.

数週間前からMLに参加させていただいております.


> 現在の、ハッシュ値を用いた手法をやめて、出現位置を普通に記録
> する方法に変えた方がいいような気がしてきました。

まさにこのこと関連して,質問したいと思っておりました.
現在コーパスと呼ばれるテキストの語学資料から
任意のキーワードを含むテキストファイルを検索する仕組み
にNamazuを利用させていただいています.

しかし,検索システムの目的として,
検索結果に「マッチした付近のテキスト」を含める必要があり,
Namazuでヒットしたファイルについて改めてキーワードでGrep検索するという
効率の悪い方法をとっているため,検索に時間がかかってしまっています.

そこで,インデックスファイルに出現位置情報があれば
よりはやく検索結果を出せるのではと思っていたのですが,
技量不足で自力で解決するのは難しく,どうしようかと
思っていたところでした.


以上のような事情から,
インデックスファイルに出現位置情報が含められれば
大きな恩恵を受けられそうなので,ぜひ期待したいと思います.

------------------------------
鈴木麗璽 -Reiji SUZUKI-
名古屋大学 大学院人間情報学研究科 AL-Lab.
reiji@xxxxxxxxxxxxxxxxxxxxxxxxx