読者です 読者をやめる 読者になる 読者になる

合同研@NAIST

自然言語処理

初参加かと思ったら去年も行っていたということに気がついた。今年のほうが知り合い増えているかなと思ったが、事前に知っている人は去年のほうが多かった気が(知ってる人はこない人が多かった。NAISTだから...じゃないよね?)。まあ、知り合い増やすのが目的の会というところもあるので、それはそれでいいんだろう。

招待講演

Riedelさんの講演で、"Ignorant Inference: MAP and Marginal Inference for Large Scale Graphical Models in NLP"というタイトル。内容的に興味ありそうだったのでwktkして聞いていたが、途中からほとんどついていけなくなって撃沈。あれぇぇぇ。EMNLP行ったときは英語が完全に聞き取れなくても、内容的に知っていそうな分野だったら割りとついていけたし、面白さとかも感じれたので、今回のRiedelさん発表もきっと分かるだろうと思っていたんだが...。英語は聞き取りやすい英語だったので、きっと中身のほうの理解が足りてなかったから分からなかったんだろうということで今度の吉川さんのD-Lecに期待しておこう。

別件として、これだと内容的に事前に多少知っていることしか理解できないという罠になってしまうわけなので、初めて聞くようなトピックでも理解できるように訓練していかないと死んでしまわないようにどうにかしなければ。。。

ポスター

自分としてはネタはあったものの、諸事情でポスターに出すことができなかったので今回は(も)聞く側で参加。ちょっと残念。ポスターのプログラムはこちら。

今年から(?去年はなかったような)ポスタープレビューがあったが、(発表者の半分くらいがNAISTの人なのを差し引いても)規模的に見てまわれるくらいだと思うのでなくてもいいのかなと思った。が、1日目の夜には懇親会もあったりしたので、そのときに話しかけるきっかけになるという効果もあったので、きっとそういうところも考慮されていたんだろう(たぶん)。

肝心の内容に関しては、Webのデータを使ったものやアプリケーションよりのものが多い印象だった。個人的にはもうちょっと基盤系技術に関係する発表が聞きたいなと思っていたんだが、そういう発表はai-aさんとかmasakazu-iさんとかid:smlyさんとかNAISTの人たちが発表されていた。博士課程の人で発表しているのがNAISTの人しかいないということだったらしく、基盤系の技術やっていそうな博士の人たちは今回はこられていなかったんかな。若手の会とかだとまた違うのかも。

音声ドキュメント検索

個人的に面白いなぁーと思った発表は豊橋技科大の音声ドキュメントに対する検索の関係の発表。発表を聞く前は「音声認識エンジンにかけてあとはIRの技術を使ってしまえば普通にできるんじゃね?」と思っていたが、そう簡単ではないらしい(いかに音情報の授業を聞いていなかったかが分かってしまう...)。一人の人は音素などの近さを用いたアプローチ(exact matchを主眼に置いてる)、もう一人の人は言語モデル的なものを使ったアプローチということで、両方ともやってるのは素晴しいなーと思った。あとタスク自体も面白いなと感じていて、textならgrepかけれるけど、音声や動画などは(メタデータがついていないと)実際に見ないといけなくってなかなか探すときに面倒なので、応用としてもすごい期待されるところだろうし、これから重要度が増していくところだろう。講演データを対象にしていて、(特に言語モデルを使っている人は)ドメイン依存性があって大変なようだが、頑張って欲しいなぁーと思った。

合同研とは直接関係ないが、今年の年次大会では音声ドキュメントのワークショップがあるということで結構見に行きたい(年次大会は出す予定ですよ!)。