[Namazu-win32-users-ja 1167] 返信: Re:【Nama

t_saitou @ sk.kameda.co.jp t_saitou @ sk.kameda.co.jp
2008年 6月 23日 (月) 14:33:52 JST


[@INET] yw3t-trns @ asahi-net.or.jpさんのメール
「[Namazu-win32-users-ja 1156] Re:【Namazu2.0.」について返信します。

斎藤です。MSOffice2007製品のインデックス化ということで、ご面倒をおかけしております。
ご指示いただいた中で、今回は、以下の方法で実現することにいたしました。

■ バージョンは、2.0.17のままで.....
<< (4) xdoc2txt.pl、xdoc2txt.exeにこだわらず、他の手がある?
<<    (私には、他の手を考える引き出しがありません)
<
<前述のように msofficexml.pl を使う方法があります。
<このフィルタは doc/ja/manual.html で紹介してあります。

<Namazu 2.0.18 の xdoc2txt.pl は OfficeOpenXML に対応していません。
<しかし、msofficexml.pl が OfficeOpenXML に対応していますので、
<こちらを使えるようにするのが良いかと思います。
<unzip.exe を入手し、パスの通っているところにインストールしてください。
<
<なお、CVS で管理されている現在の Namazu のソースでは、xdoc2txt.pl 
<でも、xdoc2txt.exe 1.26 以降であれば、OfficeOpenXML に対応しますし、
<msofficexml.pl も unzip.exe をインストールしなくても Archive/Zip.pm
<モジュールがインストールされていると使用できるようになっています。
<これらは Namazu 2.0.19 で反映されます。

■ UNZIP.exeは、doc/ja/manual.html で紹介されているURLでは、Win32版が取得できないようでしたので、
http://www.somacon.com/p161.php から取得させていただきました。
また、UNZIP.dllについては、
http://www.csdinc.co.jp/archiver/lib/unzip32.html#download から取得させていただきました。

■ その結果、mknmz -C によるメディアタイプは以下のように対応可能になりました。
システム: MSWin32
Namazu: 2.0.17
Perl: 5.008008
File-MMagic: 1.27
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: module_chasen -i e -j -F "%m "
和布蕪: module_mecab -Owakati -b 8192
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: C:/namazu/etc/namazu
LIBDIR: C:/namazu/share/namazu/pl
FILTERDIR: C:/namazu/share/namazu/filter
TEMPLATEDIR: C:/namazu/share/namazu/template
対応メディアタイプ:   (40)
未対応メディアタイプ: (11) 必要ツールが $path にないものには (-) を表示
  application/excel: xdoc2txt.pl
  application/gnumeric: gnumeric.pl
- application/ichitaro4: ichitaro456.pl
  application/ichitaro5: taro56.pl
  application/ichitaro6: taro56.pl
  application/ichitaro7: xdoc2txt.pl
  application/macbinary: macbinary.pl
- application/ms-visio: olevisio.pl
  application/msword: xdoc2txt.pl
  application/pdf: xdoc2txt.pl
- application/postscript: postscript.pl
  application/powerpoint: xdoc2txt.pl
  application/rtf: xdoc2txt.pl
- application/visio: olevisio.pl
  application/vnd.kde.kivio: koffice.pl
  application/vnd.kde.kpresenter: koffice.pl
  application/vnd.kde.kspread: koffice.pl
  application/vnd.kde.kword: koffice.pl
  application/vnd.oasis.opendocument.graphics: ooo.pl
  application/vnd.oasis.opendocument.presentation: ooo.pl
  application/vnd.oasis.opendocument.spreadsheet: ooo.pl
  application/vnd.oasis.opendocument.text: ooo.pl
  application/vnd.openxmlformats-officedocument.presentationml: msofficexml.pl
  application/vnd.openxmlformats-officedocument.spreadsheetml: msofficexml.pl
  application/vnd.openxmlformats-officedocument.wordprocessingml: msofficexml.pl

  application/vnd.sun.xml.calc: ooo.pl
  application/vnd.sun.xml.draw: ooo.pl
  application/vnd.sun.xml.impress: ooo.pl
  application/vnd.sun.xml.writer: ooo.pl
  application/vnd.visio: visio.pl
  application/x-apache-cache: apachecache.pl
- application/x-bzip2: bzip2.pl
- application/x-compress: compress.pl
- application/x-deb: deb.pl
- application/x-dvi: dvi.pl
  application/x-gzip: gzip.pl
  application/x-js-taro: xdoc2txt.pl
- application/x-rpm: rpm.pl
- application/x-tex: tex.pl
  application/x-zip: zip.pl
  audio/mpeg: mp3.pl
  message/news: mailnews.pl
  message/rfc822: mailnews.pl
  text/hnf: hnf.pl
  text/html: html.pl
  text/html; x-type=mhonarc: mhonarc.pl
  text/html; x-type=pipermail: pipermail.pl
  text/plain
  text/plain; x-type=rfc: rfc.pl
  text/x-hdml: hdml.pl
- text/x-roff: man.pl

※ 実際の、検索でひっかかってくることを確認できました。
  (しかし、拡張子 xlsxは、2003以前のExcelとは違い、直接開けないようで、
  いったんローカルに保存後、[開く]操作をしなくてはいけないため、
  利用者から、「面倒くさい」 などクレームが来そうです。)

以上、ご報告を兼ね、お礼申し上げます。



Namazu-win32-users-ja メーリングリストの案内