2009-07-03から1日間の記事一覧

複合名詞の周辺の情報、複合名詞の先頭と末尾の情報

この前やったSVMに使った素性は考えられる中では相当単純なものを使ったので、(悪くはなかったけど)改善の余地がありまくっている。というわけで 複合名詞の先頭の単語 複合名詞の末尾の単語 複合名詞の前後の単語 を集めてくるためのコードを書いた。条件分…

ミスの修正とか、品詞を詳しく見るとか

バイトですよっと。以前の処理ミスに気づくpneのrawテキストはこんな感じでxmlもどきっぽい感じになっている。 <キーワード> タイリングアレイ/chIP-chip/エピゲノミクス/メチル化 </キーワード> というわけで、中身だけ抜いてくるやつを以前書いていた。 専門用語の辞書…