読者です 読者をやめる 読者になる 読者になる

研究相談と自分の基準

研究 日記

6/15に研究会の担当が当たっていてそろそろ近い、ということでスタッフの方に研究相談をしにいく。今考えている研究は修論の内容にしようと思っているものだが、AAAIの時のネタとは別物。AAAIのネタにあれこれ改良をしたり、実験を追加したりすれば卒業はできるんだろうなぁとぼんやり考えていたが(甘い...?)、来年からも自然言語処理の研究を継続してやるし、自分の興味に沿って好き勝手(?)できるのは今が一番できるんだろうなぁ*1と思うと安定路線じゃつまらないと思ってAAAIのネタとは違うものに挑戦することにしたのだった。死亡フラグ。諸般の事情により8月末までにかなり仕上げておかないと卒業できない危機に陥いるので6月は相当頑張らないといけない。うひょー。

今考えてるネタは去年の年次大会のときくらいからあれこれ考え始めたもので「既存の研究ではhogehogeができていなくて(ry」という流れから内容を決めた、のではなく、「(他の誰かが、ではなく)自分は何がやりたいのか、自分はどういうことが可能になると嬉しいか」を自分に問い詰めながら決まってきたような内容(研究において手法よりも問いの重要さは決定的だと思う)。こういうのは研究室に入ってくる時点で決めているべきなのかもしれないが、いざ自分に問い詰めようとしてみると空っぽの容器を叩くような音しかしなくてなかなか悲しかったが、自分はこれまでどういうことに興味持ってきたのかなぁとかNLP全然関係ないようなところをNLPの文脈に置いてみるとどうなるかとかを考えていたらぼやぼやと見え出した(時期的に就活はいいきっかけになったかなぁと思う。就活でよかったなと思う点は分野外の人に自分の研究を分かりやすく説明することについてちゃんと考える機会ができたことと自分は何に興味を持っているかについてちゃんと考える機会ができたことの二点に尽きると思う(そういう機会がなくとも自分でやれ、というのはごもっともだと思います))。

相談に乗ってもらいながらいくつか自分の中で重要に思っているのだなぁと気づいた基準があったので書いてみる。

  1. state-of-artは(直接的には)目指さない
  2. (当たり前ながら)これまでの人の研究ではできないことをやる
  3. いい加減にやる

一つ目、state-of-artは(直接的には)目指さない。機械学習全盛期(?)にこんなことを言うと怒られるかもしれないが。結果としてstate-of-artになればそれはそれで素晴らしいことだし、結果はいいにこしたことはない。が、自分の有限のモチベーションだったり情熱を0.XX%の精度上昇のために注げるような性格ではない。有限のリソースで最大限のパフォーマンスを発揮するためには戦略的に動かないとダメかなと自分は思う。shared-taskのようなものも精度を競うような感じではあるが、例えばCoNLLとかだと(同一のデータを使って)実験をしていく過程で分かったような知見etcを参加者で共有、ディスカッションしていくというのも重要なことの一つ、というのをlabのどこかで聞いたことがあるように思うので、まあそういうことなんだと思う。

二つ目、(当たり前ながら)これまでの人の研究ではできないことをやる。上の点と関連してくるところ。精度が直接的な目標ではないと考えるとすると何が直接的な目標なのか、それがこれなのかなと思ってる。人と同じことをやっていたらそれは研究ではないし、かといって重箱の隅をつつくようなものはうれしさも減ってしまうので頭と足の使いどころである。最近id:repose論文を紹介してくれていて、内容はリコメンデーションにおいて似たようなものが推薦されすぎてしまうetcの問題を解決ために経済学の代替財や補完財の考え方を持ってくるというもの。リコメンデーションの分野は精度のupper boundが見えてきてしまったような最たる例だと(勝手に)思っているが、そういう流れの中で説得力ある説明ができるいい研究の例なのかなぁと思う。確率的生成モデルを使って研究をしている自分としてはどういうlatent structureを仮定しながらやるか、またそれをいかに説得力ある形でやっていくかが重要なんだろうな、と。

三つ目、いい加減にやる。一つ目と同様にまた怒られそう(笑)。目的を達成するためにいくつかの手段が考えられるとするなら、(必要な精度や要件を満たす中で)最小限の複雑さのものを選ぶべきだろう。この辺は今考えている研究の内容と直接絡んできそうなので、ここでは書かないでおこう。

*1:実際にはそんなことないんだろうかもしれないけど