Lexical Acuisition

今日のFSNLPの勉強会はSection 8でkodai-tがLexical Acuisitionの主にverb subcategorizationについて紹介してくれた。他の章とかと比べて比較的知らないところだったので、へーっと思いながら聞いていた。subcategorizationは日本語でいうと「下位範疇化」というらしい。デジタル言語処理学事典 〔CD‐ROM付〕を参考にしながら。

verb subcategorizationはおおざっぱに言うと動詞を統語的(文法的に)にカテゴリー化したようなもの。対照的に意味的にカテゴライズ(とは違うかもしれないが)したものが選択選好(selectional preference)。

  • 下位範疇化はこの動詞はこういう構文を取りやすいというのをまとめたようなもの(例: tellだったらsubject tell object clauseのようなものをパターンとしてまとめたようなもの)
  • 選択選好はこの動詞はこういった項(目的語とか)を意味的に取りやすいといったもの

という感じになっている。こういったことが分かるとどういう風にうれしいか?ということであるが、構文解析の際にこういった「どういう構文を取りやすいか」や「どういったものを項として取りやすいか」ということが事前情報として分かっていると構文解析のときのerror reductionなどで役に立つのでうれしいらしい。他のうれしい例は...どんなのがあったっけ?

下位範疇化とかの話とは全く関係ないが、F値はなんでrecallとprecisionのharmonic meanなのかが気になっていたので質問してみたが、id:a_bickyさんがつい最近書かれていた。

あとprecisionとaccuracyのところもTAの方にも質問してみたが、こっちのほうはなんかよく分からない...。accuracyが相応わしくない状況というのは書いてあるけど、論文とかを読んでいるとaccuracyは結構使われている。じゃあ、precisionが相応わしくなくってaccuracyが相応しい状況というのがあるんじゃないかと勘繰ってしまうんだが、それがどういう状況なのかがいまいち想像できない感じであった。。。