Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: HTML ファイルで分野ごとに複合キーワ



 こんにちは、村永です。
#まだ、完全に解決したわけではありませんが、中間報告です。

福光さん曰く、
>mknmzで--html-splitのオブションを使用し、AのNAME属性単位に
>分割処理を行い
>http://www.namazu.org/doc/manual.html.ja#mknmz-option
>
>検索時には「商品名 △△顆粒」のように検索すれば
>ある程度は要望に沿えるのではないかと思います。

お返事ありがとうございました。

mknmzにそのようなオプションがあるとは知りませんでした。
教えていただいてから、いろいろ検索してみたら、過去にも同様の
メッセージがありました。大変失礼しました。

<A NAME>の利用法は、ご指摘の通りだと思います。
タグで囲んだほうが、mknmzが範囲を理解しやすいのではと
勝手に判断しました。
#考えてみれば、1つめの<A NAME>から、次の<A NAME>
#までを範囲とすればよいわけですね。


 こちらのサーバで、実際に作業を行ってみました。
namazuのバージョンは2.0.6でしたが、ついでに2.0.10にあげてみました。
システム: mips-nec-sysv4.2MP(EWS4800/430EX)
Namazu: 2.0.10 , わかち書き: kakasi です。
#バージョンアップ後に、namazurcの「わかち書きシステム」を設定し忘れ、
#一時エラーに悩みました。

準備したhtmlファイルは、
-------------------------
<A name="k00100">◆◆◆◆◆◆《商品名》◆◆◆◆◆</A>
○○錠(2mg)
<A name="k00200">◆◆◆◆◆◆《一般名》◆◆◆◆◆</A>
塩酸○○○○○○,JAN
・・・・・
-------------------------
のように整形したものを、48個準備しました。
格納場所は、
/home/medinfo/public_html/didata2/DI/di03/di00003.html
のようにしております。

インデックスの作成は、
/home/medinfo/namazu/didata2
で、mknmzを以下のように実行してみました。
--------------------------
$ mknmz --html-split  /home/medinfo/public_html/didata2/DI
検索対象のファイルを調べています...
48個のファイルがインデックス作成の対象として見つかりました
1/48 - /home/medinfo/public_html/didata2/DI/di01/di00101.html# [text/html]
    1/21 - /home/medinfo/public_html/didata2/DI/di01/di00101.html#k00100 [text/html]
    2/21 - /home/medinfo/public_html/didata2/DI/di01/di00101.html#k00108 [text/html]
    3/21 - /home/medinfo/public_html/didata2/DI/di01/di00101.html#k00111 [text/html]
・・・・・
インデックスを書き出しています...
[基本]
日付:                Mon Jul 22 18:24:56 2002
追加された文書の数:  961
サイズ (bytes):      285,019
合計の文書数:        961
追加キーワード数:    5,366
合計キーワード数:    5,366
わかち書き:          kakasi
経過時間 (秒):       176
ファイル/秒:         5.46
システム:            nec_ux
Perl:                5.006
Namazu:              2.0.10
--------------------------
#ここでは、うまくインデックスが作成されたように思えました。

現在、cgiから検索するところで少々悩んでおります。
htmlファイルに、以下のように記述すると、「<a name="k00100">」で
マークした部分だけヒットするだろうと考え、取り敢えず実行してみましたが、
---------------------------
<form method="get" action="/~medinfo/druginfo/bin/namazu.cgi">
<input type="text" name="query" size="100">
<input type="submit" name="submit" value="Search!">
<input type="hidden" name="idxname" value="k00100">
</form>
---------------------------

>検索結果
>参考ヒット数: [ (インデックスは古いフォーマットであるべきです) ] 

となってしまいました。むむむ・・・・

#<input type="hidden" name="idxname" value="k00100">
#の行を抜いたら、検索がヒットすることは確認しました。

多分、インデックスの作成で何か失敗しているのでしょう。
なんとなく、もう一歩のようなところまできたような気がします。
もう少し、がんばってみます。

何か、お気づきの点がありましたら、ご教授下さい。

----
村永文学
鹿児島大学医学部附属病院 医療情報部
Fuminori Muranaga , Medical Informatics
TEL 099-275-5171 , FAX 099-275-5177