言語処理学辞典勉強会 with M1

最近、言語学周りの勉強をし始めたというのとM1で入ってきたid:keiskS君がその付近に詳しいらしい、ということで言語処理学辞典を使って勉強会をやってみた。

デジタル言語処理学事典 〔CD‐ROM付〕

デジタル言語処理学事典 〔CD‐ROM付〕

前日に「自然言語処理の概観を掴むにはどうすればいいか*1」的な質問をしていたtakuo-h君、tweet経由で参加の@__yuyay__君も参加ということで総勢4人の小さな勉強会。GWにこんなことをやっているとは暇人w、とid:tomo_wbに言われてしまったが気にしない(彼はIJCNLPで忙しいので言う気持ちも分かるw)。自分のほうは自然言語処理と機械学習の付近の知識を(ある程度片よっているとは言え)持っているのでその辺を、id:keiskS君は言語学とかそっち方面の知識を持っているということでgive&takeな感じで。休憩挟んで13時から19時半までやっていたのでそれなりには読めたかな。ディスカッションも結構できた。こういうのは少人数のいいところですね。

今回の勉強会(というか読書会?)やったところをリストアップしてみると

  • 総説
  • 1.2 コーパス
  • 1.4 オントロジー
  • 2.9 機械学習
  • 3.1 機械翻訳
  • 3.2 情報検索
  • 4.5 統語論の基礎
  • 5.1 生成文法

という感じ。機械翻訳や情報検索のところが(基礎技術のところを先にやらなかったので)ちょっとボヤボヤしすぎたのは申し訳無かったなぁと反省。個々のトピックであれこれ議論したのはもちろんのこと

  • (一年もすると手持ちの道具の範囲内で考え出すようになってしまうので)道具持ってない今の頃に考えてたことは大事に忘れないようにしておいて欲しい
  • 機械学習は怖そうな感じだけど、中身を見てみると超いい加減なことやっていることも多いので俺がもっとちゃんとやってやるぜくらいの気持ちでやるといいんじゃないか*2

という付近を伝えようと(半分自戒で&偉そうにも)試みた。バランスよく教えるのがいいのかよく分からないですが、あれこれぶっとんでる人に色々聞いて自分の好きなスタイルを見つけるのがいいんじゃないかと思うので僕に限らず色んな人の話を聞きに行って欲しいかな(特にスタッフの人に)。

ちなみに日曜日も同じ感じでやるつもりで2部の基礎技術の付近と4章の続き5章をやると思うので、興味ある人は是非(告知しようと思っていたけど人数多くなると面倒だなと思って、最初はclosedにしました)。

*1:FSNLPでもいいんだけど、ある程度終わるのは秋から冬になるのでちょっと遅いように思う

*2:やると色々難しいんですけど