タブ区切りデータの三列目を取り出す
「-F」の使い方、すぐ忘れる。。。perl -F"\t" -anle 'print $F[2]' umls2ja.tab
Trieを構築するためのライブラリTx
dartsのほうは日本語だとうまく動かない…?
TokyoCabinetのvalueのほうにstd::mapを入れたり
コンパイルのオプションがよく分からーんと思ってちょっと悩んだけど
g++ fuga.cpp -I/usr/local/include -L/usr/local/lib -ltokyocabinet -lz -lbz2 -lpthread -lm -lc -lkv -lkvpp
としたらとりあえず通った。-lのオプションでよく分からなくなったら、 /usr/local/lib以下を見ればなんとなく分かりそうだということが分かった。
keyのほうにmapとかvectorは無理っぽい。
CRF++&YamCha
IOB2 formatというのを今頃理解した。