MeCab

iconv関係でMeCabがインストールできなかった

ので、LIBSを指定するとうまくいった。 ./configure --with-charset=utf-8 LIBS='-liconv'

mac portでインストールしたMeCabはマルチスレッドでうまく動かない

雑誌のファイルから機械学習に投げるための素性作成C++のプログラムを書いているが、時間がかかりまくるのでマルチスレッドにしている。が、ローカル環境ではうまくいくのに、リモートではうまくいかないという困った事態に遭遇。gdb使って死んだところでwhe…

精度がなかなか上がらない→辞書の特徴について考える

DBCLSでバイト。指標のところは全部実装したので、ライフサイエンス辞書の単語を正解のものとして、RecallやPrecision、F値(自然言語処理のF値がなんでこういう式なのかを勉強しておかないと。。。)などを計算。が、ありえないほど精度が出なくてへこむ。テ…

RMeCabでインストールにこけるときがある

Mac10.5.6を使っていて、Rを「sourceから」インストールしていた場合 > library(RMeCab) エラー: パッケージ 'RMeCab' は universal-apple-darwin8.11.1 に対して造られました となって、使えなかった。なんでだろーと思ってバイナリのほうでインストールす…

MeCabで区切った単語を再びつなげる

先週は形態素解析なアプローチじゃなくて、特長語抽出のような感じで専門用語が取り出せないかなーとやっていた。 www.yasuhisay.info が、YamChaの使い方がよく分からない&使うツールの中身が今の自分にとってはブラックボックスすぎる、ということで形態素…

MeCabとRMeCabをインストールして、ちょっと遊んでみる

某バイトというか勉強させてもらっているところ*1でRとMeCabでほげほげするようなのでインストールするよ!!Macです。mecabと辞書のインストールMeCab - Browse Files at SourceForge.netよりmecabとmecab-ipadicをダウンロード。win用以外のは辞書が含まれて…