2010-04-21から1日間の記事一覧

Dependency Parsing

CJEの勉強会に出席するのは初めて。 形態素解析、品詞タグづけ word segmentation and POS tagging 未知語検出/抽出 out-of-vocabulary detection/extraction 固有表現抽出・語彙知識獲得 NER, lexical acquisition 系列タギング・系列セグメンテーション se…

LZ78方式符号化をRubyで実装、を改良

Trieちゃんと使ったので、それなりの速度になりました。100MBくらいのテキストが40MBくらいまで縮んだかと思えば、2.8MBのテキストが2.6MBにしかならなかったりと圧縮したいテキストの性質によって圧縮率が全然違う感じでした。WEB+DB PRESS Vol.54によると…