言語処理学会年次大会2011本会議本会議1日目

朝一のセッションで自分が発表。学会での発表は何気に初めてなので、この日は緊張して他の人の発表のときに質問とかできてなかった。結構緊張してしまっていたようで、実験のスライドの前付近で5分ちょっとしか経っていないことに気づく(発表時間は15分与えられている)。自分の前方に時計がなかったら10分で終わってしまっていた気がする...gkbr。評判分析のセッションで発表したのだが、パラレルでテキスト・データマイニングのセッション*1があっていてそっちに人が流れてしまったのか最初は人が少なかったが自分の発表の前に小休憩が入ったこともあってか割と多くの人に聞いてもらえた気がする。

自分の原稿とスライドはupしたのでそっちを参考にしてもらいたいが(原稿は4ページに収まるようにするためにフォントやらなにやらがえらく小さいということもあるし、原稿のほうも今見るとあまりよくない気もするのでスライドを参考にしてもらいたい。AAAIに書いた原稿のほうがよいと思うので、acceptされたらこっちの原稿のほうを見て欲しい)、単語の極性(ポジネガ)が分野に特有*2かどうかを考えながらモデルを考えると分野適応のようなことができそうですね、というお話。分野のラベルも明示的に扱うことでスライドに書いたような多対多の状況でもできてこの付近は新しいのではないか、というお話です。

技術的にはLDAをGibbsでやるだけなのでMLの人から見るとあんまり面白くないのかもしれないが、質疑では結構活発に手が挙がったので嬉しかった(分野の第一人者である東工大の高村さんから「面白いモデルだと思います」と言われたのはちょっとうれしかった)。とはいえ実験が足りてないというご指摘はごもっともで

転移元の中でラベルを無視&転移先の中でラベルを無視して1:1の状況で実験
転移先を増やしていくと下がっていくのはいくつか要因があるので、それを切り分けて考えれるようにデータ数をfixした状態で転移先の分野数を増やしていく

などはやるべきだと思うので、ジャーナルにするときなどにはやりたいと思います、やります、はい。

ポスター

正直あんまり聞けていなくて、一年ぶりな方々とお話していたような気がする。まあ、それはそれでいいような(ぇ。@awakiaさんや早稲田の大野さんと少しお話。MTやっている人の数に驚かされる。

若手の会

若手の懇親会。東大のNLPの人とお話したいなとか思っていたがどこにいらっしゃるかよく分からず話せなかった..。自分が主にお話していたのは東北大の井之上さん、IBMの@unnonounoさん、楽天の@mhagiwaraさんだったかな。@unnonounoさんとはリアルでお会いするのは初めて、@mhagiwaraさんとは去年の年次大会の時以来一年ぶり*3だったが、特に@mhagiwaraさんと熱い話ができてすごく楽しかった。自分がやりたいと思っている研究とそのモチベーションについてとか企業研究の難しいところ楽しいところなどなどお話させてもらったが、特に「30年後の言語処理はどうなっているか」という話(see also The Hundred-Year Language)が核心を付いたよい問だと思った。10年後も想像がつかないくらい流れの早い世の中であるが、一つ言えるのは30年後というのは間違いなく僕らが中心となっていく作っていく世の中であるということ(書いてて若干恥ずかしいが大真面目です)。制約をとっぱずした上で本質は何かについて考える、そして今からそれについて取り組む。うん。

*1:岡野原さんや坪井さん、江原さんの発表は自分も聞きたかった。松本先生もこっちの発表を聞かれていたらしい。江原さんの発表は後日昼食のときに教えてもらった。グラフラプラシアンの逆行列が重いので、SVDを使ってもっと早くしましょう&次元削減することでノイズを減らせてうれしいですよね、ということだった

*2:原稿では分野依存という言葉を使っているが

*3:自分のBlogには詳細は書いていないが、社会科見学 (4) バイドゥから世界へ - 武蔵野日記に詳細があった。さすが生駒日記!!この時はBaiduのオフィスを見学させてもらった後食事をしながらお話させてもらったのだった