Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Namazu 2.0.13 による一太郎インデックスの作成



村井と申します。

 Namazu 2.0.13 for Win32 ( β版) 付属のフィルタにより
一太郎ファイルのインデックス化を行ってみましたが、私の
環境(Win2000 SP4)では正しく作成されませんでしたので
ご報告します。
 (以下に一太郎12で作成した文書について検索画面の例を
  あげます。)
 なお、Namazu 2.0.12 の時も namazu 付属のフィルタを使用
して Win2000 上で一太郎ファイルのインデックス化はうまく
出来ませんでした。


○ namazu 付属のフィルタで作成した場合

-----------------------------------------------------------
参考ヒット数: [ y: 1 ]

検索式にマッチする 1 個の文書が見つかりました。

1. 坊っちゃん.jtd (スコア: 7)
著者: 不明
日付: Sun, 25 Apr 2004 15:44:27
ミマ 爍ア * > ty tyyy yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy
yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy
yyyyyyyyyyyyyyyyyyyy
file://127.0.0.1/test2/坊っちゃん.jtd (13,824 bytes)


現在のリスト: 1 - 1
ペイジ: [1]
-----------------------------------------------------------



○ jt.pl でインデックスを作成した場合
 以下は以前 小嶋様より投稿のありました jt.pl
(v 1.7.0 2002/12/06 )を使用して作成したもので、
インデックスが正しく作成されています。
 \namazu\share\namazu\filter\ の中の taro.pl taro56.pl
taro7_10.pl を削除し jt.pl を入れて実行したものです。

-----------------------------------------------------------
参考ヒット数: [ 無鉄砲: 1 ]

検索式にマッチする 1 個の文書が見つかりました。

1. 坊っちゃん.jtd (スコア: 6)
著者: x
日付: Sun, 25 Apr 2004 15:44:27
 親譲りの無鉄砲で小供の時から損ばかりしている。小学校に居る
時分学校の二階から飛び降りて一週間ほど腰を抜かした事がある。
なぜそんな無闇をしたと聞く人があるかも知れぬ。別段深い理由で
もない。新築の二階
file://127.0.0.1/test2/坊っちゃん.jtd (13,824 bytes)


現在のリスト: 1 - 1
ペイジ: [1]
-----------------------------------------------------------


 なお、通常私は一太郎用フィルタとして jt.pl
(v 1.3.1 2002/03/06) を元に

    my $para =Win32::OLE::Enum->new($jdoc->GetString);

の部分を、

    my $para =Win32::OLE::Enum->new($jdoc->GetString(2));

に変更したものを使用しています。
(罫線のあるファイルの文字を全て検索対象とするため。この辺
のいきさつは過去ログを参照下さい。)
 
 何故 jt.pl v 1.3.1 を使用しているかと言えば、それは以下の
理由によります。

・大量のファイルを処理する上で、途中で Out of memory で
終了するのを避けるため、チェックポイントを動作させるオプション
( -s )を付加してインデックスを作成。
(例えば mknmz -s -U -O c:\index c:\xxxx )
・この場合 jt.pl v 1.3.1 であれば、途中で「一太郎 起動数の
上限に達しました。確認 ヘルプ」のボックスが出て停止しまう
事が無い。

 jt.pl v 1.3.1 は1文書毎に一太郎の起動停止を行うようで、
それによりこのような結果になると思われます。開発された小嶋様の
意図に沿わない使い方で申し訳なく思っております。

 インストールされている一太郎のバージョンは12です。


動作環境
 CPU Pentium4 2.80CGHz
 メモリ 2GB
 OS  Windows 2000 Professional SP4
 Namazu  2.0.13
 Perl    5.6.1.638
 xpdf   version 3.00
 Office 2000 Professional
 一太郎12

インデックス対象
 ワード、エクセル、PPT、PDF、一太郎、TXT、HTML
最高 約46,000件(うち一太郎ファイル約7,600件)



///////////////////////////////////////////////////

  村井 俊文     E-mail:murai.t-fs@xxxxxxxxx