Trieとかtcとか系列タギングとか

タブ区切りデータの三列目を取り出す

「-F」の使い方、すぐ忘れる。。。

perl -F"\t" -anle 'print $F[2]' umls2ja.tab

Trieを構築するためのライブラリTx

dartsのほうは日本語だとうまく動かない…?

TokyoCabinetのvalueのほうにstd::mapを入れたり

コンパイルのオプションがよく分からーんと思ってちょっと悩んだけど

g++ fuga.cpp -I/usr/local/include -L/usr/local/lib -ltokyocabinet -lz -lbz2 -lpthread -lm -lc -lkv -lkvpp 

としたらとりあえず通った。-lのオプションでよく分からなくなったら、 /usr/local/lib以下を見ればなんとなく分かりそうだということが分かった。

keyのほうにmapとかvectorは無理っぽい。

CRF++&YamCha

IOB2 formatというのを今頃理解した。