Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

長い人名 (複合名字)



>                                            千葉市中央区長洲
>                                                    藤原  誠
最近、「西原口」という文字列で少し不可解なことがあったので、
簡単な例を作って試して見ました。
左端のような文字列を含む譜(jis) を 6 つ用意し、kakasi と chasen
で mknmz した index を用意しておいて 操作行(command line)
から shell 手続きを実行して見たものです。 1 2 3 とか a b c は
単に目印です。
(実は不可解なことは全部は再現しなかったので、この報告は、単にお
しゃべりだと思って見ていただけると有難いです)
   namazu 2.0.11pre1 
   kakasi 2.3.4
   ChaSen 2.2.9

【結果】
   kakasi                   
                        1      2        3         4         5         6
           (検索文字列)西原口 "西原口" "西原 口" /西原口/  /西原*/  /西原口*/ 
(一行内容↓)              
西原口さんこんにちは    -      -        o         -         o        o
西原口内さんこんにちは  -      -        o         -         o        o
これは空の方            -      -        -         -         -        -
西原口 abc              -      -        o         -         o        o
西原 口 abc             -      -        o         -         o        o
西田さん                -      -        -         -         o        -

   ChaSen 
                        a       b       c         d         e        f
           (検索文字列)西原口 "西原口" "西原 口" /西原口/  /西原*/  /西原口*/ 
(一行内容↓)              
西原口さんこんにちは    -      -        -         -         o        -
西原口内さんこんにちは  -      -        -         -         o        o
これは空の方            -      -        -         -         -        -
西原口 abc              -      -        o         -         o        o
西原 口 abc             -      -        o         -         o        o
西田さん                -      -        -         -         o        -


【感想】
1 西原口でも 2 "西原口" でも 4 /西原口/ でも
     chasen も kakasi も見つけないのは残念
3 "西原 口" とした時に、ChaSen の方の成績が悪いのは残念
/西原*/ とした時に 「西田さん」が見つかるのは何故 ?



------------ shell script -----------
#!/bin/sh
echo 1
namazu 西原口     -l index-k
echo 2
namazu "西原口"   -l index-k
echo 3
namazu "西原 口"  -l index-k
echo 4
namazu /西原口/   -l index-k
echo 5
namazu /西原\*/   -l index-k
echo 6
namazu /西原口\*/ -l index-k

echo
echo a
namazu 西原口     -l index-c
echo b
namazu "西原口"   -l index-c
echo c
namazu "西原 口"  -l index-c
echo d
namazu /西原口/   -l index-c
echo e
namazu /西原\*/   -l index-c
echo f
namazu /西原口\*/ -l index-c

---
(藤原)
http://www.ki.nu/software/namazu/tutorial/