Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Text::ChaSen core dump



白井です。実験してみました。

From: knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) さん曰く
Subject: [namazu-devel-ja] Text::ChaSen core dump
Message-ID: <200003140934.SAA18488@xxxxxxxxxxxxx>
Date: Tue, 14 Mar 2000 18:34:39 JST

knok> >> mknmz(Text::ChaSen)でIndexingしようとすると core dump します。
knok> 
knok>   とりあえず、以下の script で Text::ChaSen にかけてみましたが、問題あ
knok> りませんでした。

野首さんの script だと OK なのですが、実際に mknmz したら
'Segmentaion fault' でした。

## Solaris 2.4 + perl 5.005_02 + gcc 2.95.2 + chasen 2.02
##  + Text::ChaSen 0.20

--debug をつけて中身をみたのですが、なぜか 'failedmail' を mknmz
すると

debug> @@ モジュール: mailnews.pl
debug> @@ Processing mail/news file ...
debug> // -- title --
debug> // ULIS-Lib:New Material
debug> // -- content --
debug> // 新着資料情報
debug> // 2月18日からの新着資料です。
debug> // ┌─┬──────────────────────────────────┐│項│ 内 容 ││番│ │├─┼──────────────────────────────────┤│1 │500 tips for academic librarians / Sally Brown, Bill Downey, Phil ││ │Race.-- Library Association Publishing, 1997. │├─┼──────────────────────────────────┤│2 │ACRL un

となり、これ以降

debug> 江南先生訓訳 ; 都留春雄, 釜谷武志校注.-- 平凡社, ││ │2000.-- (東洋文庫 ; 666). │└─┴──────────────────────────────────┘

まで(最後まで)が一行として扱われています。それを Chasen に一度に
渡すので破綻しているようです。
また、failedmail の最後に普通の文章をいれたところ、そこでは、ま
た、一行が一行として扱われていました。

というわけで、JIS 罫線の処理を mailnews.pl が失敗している(あるい
は意図してこうしている?)ように感じます。

## kakasi は一行でいれても大丈夫だった。

普通のメールだと

@@ モジュール: mailnews.pl
@@ Processing mail/news file ...
// 
// 
// <<<<小関 吉則 (KOSEKI Yoshinori) <kose@xxxxxxxxxxxxxxxxxx> writes:>>>>
// -- title --
// Re: Domain Name Server
// -- content --
// 先ほどから、内容がぜんぜんわからないっす。^^;;;
// MUAの乗り換えは重労働ですからね。あんまりやりたくないです。

の様にそれぞれの行で分割されますよね。

-- 
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)