[Namazu-users-ja 344] wget で取得できないファイルがある

biz biz952 @ yahoo.co.jp
2005年 3月 10日 (木) 21:51:37 JST


こんにちはbizです。
東邦はRedHatLinux9上でNamazuを使う際にwgetを行ってファイ
ルを取得しているのですが、取れないファイルがあります。

==階層間略図==
├ [Dir_1] 
│ └ [Dir_1_1] 
│ └ aaa.pdf 
│ 
├ [Dir2] 
│ └ bbb.pdf 

上図の[Dir_1_1]も含むそれ以下が取得できません。[Dir2]を
含む以下のファイルは取得できています。 
==状況==
1.ファイル形式はhtml、pdf
2.違う階層に有るdocやpdfは取得できている。
3.wgetのコマンドでは階層の制限もしていません。(実際そ
の階層と同じ階層にあるhtmlは取得できています。) 
4.aaa.pdf にリンクを張っているhtmlファイル内のコメント
タグ(<!---->)の長さを変えたり、コメントタグをなくした
ら取得できることがある。

==問題のコメントタグ周辺↓==
<!---------------------------------------------------------------------->
<TABLE>
<TR onmouseover="this.style.background='#F3F0FF'"
onmouseout="this.style.background=''"><TD>
○○○</TD><TD><A href="Dir_1_1/aaa.pdf"
target=_blank><IMG src="images/a.jpg" align=ABSMIDDLE
border=0 alt="
○○">○○</A></TD></TR>
</TABLE>

wgetのバグでしょうか?何か情報をお持ちの方がいらっしゃい
ましたらよろしくお願いいたします。

追記:参考に実行しているwgetのコマンドを以下に書きます。 
★/usr/bin/wget -m -R
.txt,.css,.js,.log,.jpg,.jpeg,.gif,.png,.bmp,.jtd,.swf,.rm,.mpg,.mp3,.cgi,.pl,.exe,.lzh,.zip,.au,.ppt,.xls,.xml,.php,.TXT,.CSS,.JS,.LOG,.JPG,.JPEG,.GIF,.PNG,.BMP,.JTD,.SWF,.RM,.MPG,.MP3,.CGI,.PL,.EXE,.LZH,.ZIP,.AU,.PPT,.XLS,.XML,.PHP
-i /home/nmzusr/wget/conf/listfile -t 1 -T 5 -nv -o
/home/nmzusr/wget/logs/wget.log


* 場違いな質問で申し訳ございません。以前このMLでwgetは
対象ではないとご指摘をいただいたのですが、表記のツールに
関しての情報はこのNamazuMLの登録している方々の知識レベル
が高いと思われますので質問させていただきました。

--環境--
OS:LinuxRedHat9(GNOME,Xwindow使用)
Apache ver1.3.33
Namazu ver2.0.14
wget  ver1.9.1


__________________________________
Let's Celebrate Together!
Yahoo! JAPAN
http://pr.mail.yahoo.co.jp/so2005/




Namazu-users-ja メーリングリストの案内