[Namazu-users-ja 1142] pdfのタイトルで検索をしたい

森田 光貴 mitsutaka-q @ umin.net
2009年 1月 26日 (月) 19:05:29 JST


森田と申します。
とある病院にて資料をサーバーへアップロードし、
それらの資料をNamazuにて検索できるように環境を構築しました。

紙媒体を取り込んだものが多いので、pdfファイルが多いのですが
pdfファイルのタイトルでの検索を行おうとしていますが
どうすればいいかわからない状態です。

以下、環境です。

・サーバー
Red Hat Enterprise Linux ES release 4 (Nahant Update 4)
Kernel 2.6.9-42.0.3.ELsmp on an x86_64

・pdfinfo -v
pdfinfo version 3.00
Copyright 1996-2004 Glyph & Cog, LLC

・mknmz -C
システム: linux
Namazu: 2.0.16
Perl: 5.006000
File-MMagic: 1.25
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no
和布蕪: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/share/namazu/pl
FILTERDIR: /home/hoge/namazu_filter
TEMPLATEDIR: /usr/local/share/namazu/template
対応メディアタイプ:   (40)
未対応メディアタイプ: (8) 必要ツールが $path にないものには (-) を表示
  application/excel: excel.pl
  application/gnumeric: gnumeric.pl
  application/ichitaro5: taro56.pl
  application/ichitaro6: taro56.pl
- application/ichitaro7: taro7_10.pl
  application/macbinary: macbinary.pl
  application/msword: msword.pl
  application/pdf: pdf.pl
- application/postscript: postscript.pl
  application/powerpoint: powerpoint.pl
- application/rtf: rtf.pl
  application/vnd.kde.kivio: koffice.pl
  application/vnd.kde.kpresenter: koffice.pl
  application/vnd.kde.kspread: koffice.pl
  application/vnd.kde.kword: koffice.pl
  application/vnd.oasis.opendocument.graphics: ooo.pl
  application/vnd.oasis.opendocument.presentation: ooo.pl
  application/vnd.oasis.opendocument.spreadsheet: ooo.pl
  application/vnd.oasis.opendocument.text: ooo.pl
  application/vnd.openxmlformats-officedocument.presentationml: msofficexml.pl
  application/vnd.openxmlformats-officedocument.spreadsheetml: msofficexml.pl
  application/vnd.openxmlformats-officedocument.wordprocessingml: msofficexml.pl
  application/vnd.sun.xml.calc: ooo.pl
  application/vnd.sun.xml.draw: ooo.pl
  application/vnd.sun.xml.impress: ooo.pl
  application/vnd.sun.xml.writer: ooo.pl
  application/vnd.visio: visio.pl
  application/x-apache-cache: apachecache.pl
  application/x-bzip2: bzip2.pl
  application/x-compress: compress.pl
- application/x-deb: deb.pl
- application/x-dvi: dvi.pl
  application/x-gzip: gzip.pl
- application/x-js-taro: taro7_10.pl
  application/x-rpm: rpm.pl
- application/x-tex: tex.pl
  application/x-zip: zip.pl
- audio/mpeg: mp3.pl
  message/news: mailnews.pl
  message/rfc822: mailnews.pl
  text/hnf: hnf.pl
  text/html: html.pl
  text/html; x-type=mhonarc: mhonarc.pl
  text/html; x-type=pipermail: pipermail.pl
  text/plain
  text/plain; x-type=rfc: rfc.pl
  text/x-hdml: hdml.pl
  text/x-roff: man.pl

・タイトルに『レベニンR等』と記載している2009012601.pdfというファイルにpdfinfoを実行
Title:          R
Creator:        PFU ScanSnap Manager 4.0.10
Producer:       Adobe PDF Scan Library 2.1
CreationDate:   Mon Jan 26 09:47:08 2009
ModDate:        Mon Jan 26 09:52:56 2009
Tagged:         no
Pages:          3
Encrypted:      no
Page size:      594 x 841.32 pts
File size:      524866 bytes
Optimized:      no
PDF version:    1.3

・Namazuにて『+date:/26 JAN 2009/』の条件式で検索されるときの表示  
1. レベニンR等 (スコア: 1) 
著者: 不明 
日付: Mon, 26 Jan 2009 09:53:52 +0900 
http://www.hogehoge.com/file/2009012601.pdf (524,866 bytes)

・Namazuにて『*レベニン*』の条件式で検索されるときの表示  
References: [ *レベニン*: 0 ] 
No document matching your query.

検索画面に表示されるのであればなんとかindexに取り込んで検索対象としたいのですが・・・
Namazuが2.0.16なのですが、サーバーの関連でupgradeできません。(借り物でして
よろしくお願いいたします。

森田


Namazu-users-ja メーリングリストの案内