Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

doccat で一太郎 5,6,7 ファイルを読むためのフィルターファイルの修正



 こんにちは、西山@国土環境です。すでに既知かもしれませんが、
過去MLのログにはなかったので、とりあえず、ご報告します。
 また、誰か試していただけると助かります。また、www.namazu.orgで紹介
されています他のWindowsアプリケーションのファイルも正常にできました。
 下記の3つのファイルを修正しました。

MMagic.pm、conf.pl、taro.plです。*.orgが元のファイルです。

[root@search1 filter]# pwd
/usr/share/namazu/filter
[root@search1 filter]# diff taro.pl taro.pl.org
59,61d58
<     $magic->addFileExts('(?i)\\.jaw', 'application/x-js-taro');
<     $magic->addFileExts('(?i)\\.jbw', 'application/x-js-taro');
<     $magic->addFileExts('(?i)\\.jfw', 'application/x-js-taro');
[root@search1 filter]# cd ../pl
[root@search1 pl]# diff conf.pl conf.pl.org
10c10
< $ADDRESS = 'webmaster@xxxxxxxxxxxxxxxxxxxxxxxxx';
---
> $ADDRESS = 'webmaster@xxxxxxxxxxxxxxxxxxxxx';
31,34c31,33
<               "|.*\\.pdf|.*\\.ps" .              # PDF, PostScript
<               "|.*\\.tex|.*\\.dvi" .             # TeX, DVI
<               "|.*\\.rpm|.*\\.deb" .             # RPM, DEB
<               "|.*\\.doc|.*\\.xls|.*\\.ppt" .    # Word, Excel, PowerPoint
---
>               "|.*\\.pdf" .                      # PDF
>               "|.*\\.tex" .                      # TeX
>               "|.*\\.doc|.*\\.xls" .             # Word, Excel
36,37d34
<               "|.*\\.jfw" .                  # Ichitaro 7
<               "|.*\\.jtd" .                  # Ichitaro 8,9,10
188c185
< $CHASEN = "/usr/bin/chasen -j -F '\%m '";
---
> $CHASEN = "no -j -F '\%m '";
193c190
< $CHASEN_NOUN = "/usr/bin/chasen -j -F '\%m %H\\n'";
---
> $CHASEN_NOUN = "no -j -F '\%m %H\\n'";

[root@search1 pl]# cd /usr/lib/perl5/site_perl/5.6.0/File/
[root@search1 File]# diff MMagic.pm MMagic.pm.org
1627c1627
< >43   byte            0x15            application/x-js-taro
---
> >43   byte            0x15            application/ichitaro5
1630,1633c1630
< >43   byte            0x16            application/x-js-taro
<
< 0     string          DOC
< >43   byte            0x17            application/x-js-taro
---
> >43   byte            0x16            application/ichitaro6
[root@search1 File]#


下記の構成で、Win2000サーバの共有フォルダにある一太郎ファイル(
日本語ファイル名も含む)を読むことができました。

OS:	RedHat Linux7.1J

カーネルをカスタマイズ: 下記の部分を変更して、コンパイルしなおす
	CONFIG_SMB_FS=y
	CONFIG_SMB_NLS_DEFAULT=y
	CONFIG_SMB_NLS_REMOTE="cp932"
	CONFIG_NLS_DEFAULT="euc-jp"
	CONFIG_NLS_CODEPAGE_932=y

SAMBA: RedHat7.1J付属のrpm

namazu関連ファイル: www.namazu.orgからi386用のrpmファイルをダウンロード
	してインストール。

chasen関連ファイル: chasenのサイトからダウンロード

SAMBAとnamazu関連のrpmファイルのリスト:

namazu-2.0.5-1
namazu-devel-2.0.5-1
groff-perl-1.16.1-7
mod_perl-1.24_01-2
perl-File-MMagic-1.12-1
perl-Text-Kakasi-1.04-3
perl-5.6.0-12
perl-NKF-1.71-1
chasen-perl-2.2.6-1
perl-Search-Namazu-0.13-1
chasen-2.2.6-1
chasen-perl-2.2.6-1
chasen-devel-2.2.6-1

 今回の件で、ますますオープンソースコミニティの偉大さを
感じました。
------------------------------------------------------------
国土環境株式会社         E-mail:hideyuki@xxxxxxxxxxxxxxxxx
情報システムグループ     WWW   :http://www.metocean.co.jp/
西山 英之                TEL   :045-593-7616
                         FAX   :045-593-7628