完全に時差ボケで3時頃に起床...。今日からチュートリアルということで受付へ向かうと坪井さんがいらっしゃる。NLPのことやらMLのことやらを話していたのだが*1途中でポスターのことを聞いてみると、ポスターは全員ではないらしい、むむむ(全員宛てのメールにきていたのでてっきりそうだと思っていた。が、やはりきっちりと連絡があったわけではないらしい)。一応、各セクションから選ばれた人がポスターでも発表ということらしいですが、正直oralでお腹いっぱいです。CS研のS木さんがACLのかっこいいかばんを持っていらっしゃるので、AAAIもそういうかっこいいのをくれないかなと期待していたが言語処理学会でもらったような感じのかばんでした。かっこいいかばんがもらえるまで国際会議に挑戦し続けたい(ぇ。
今日のチュートリアルは
- SA3: Discourse Structure: Theory and Practice, Bonnie Webber, Markus Egg, and Valia Kordoni
- SP2: Human Computation: Core Research Questions and State of the Art, Luis von Ahn and Edith Law
の2つを聞く。てっきり1時間毎のチュートリアルが4つ続くんだと思っていたが、1つのチュートリアルが(休憩含めて)4時間あっていて、それが4つ並列して開催されているという形式だった。自分としては同じテーマの話を3時間くらいぶっつづけで聞くよりかは色んな話題を1時間のほうがうれしかったのだが。時系列の話は聞きたかったのだが、資料が公開されているそうなので帰ってからでも読もう。
Discourse Structureのほうは要約とかそっち方面への応用だったり、そもそもDiscourse(というもやもやしたもの)をNLP的にはどうやって扱おうとしてきたのかの歴史を知りたかったので参加。リファレンスが結構しっかりしているので、かなり参考になりそう。ただ、Discourse Structure自体の研究は2003年くらいからあまり進んでいないような印象を受けた(逆に言えば余地がかなり残されているということ)。ML寄りのNLP屋さんからするとかなりnaiveな手法が多い。最近の研究としてはPTDBがコーパスとしてできた、という付近が新しいところだろうか。各言語のDiscourse関係のリソースも挙げられている。日本語はなかったが...。各コーパスの違いとしてはfull or partitialだったり、tree形式がgraph形式かなどなどなど。チュートリアル中でも述べられていたが、アノテーターの教育コストが他のタスクと比較してもかなり高い。質疑で「Discourse Parsingとかで使えるようなtoolboxってないの?」という質問が出ていたが「No」とほぼ即答。それってどうなの...。
Human Computationのほうは時差ボケ効果と後半の人はかなり早口だったので途中でlostしてしまったorz。チュートリアルの最初の人が"Human Computation"というまんまの本を最近出したということで、会場で配っていたのでもらってきた(研究室で興味ある人は見せますので声かけてください)。
Human Computationという言葉は聞きなれないが、簡単に言うとAI(機械)と人間のinteractionで問題を解くというような分野だろうか。NLPとかの文脈だとactive learningだったりを想像してもらうと分かりやすいかもしれない。Human Computation自体の歴史は割と古いようだが、インターネットの出現によって様変わりしたようだ。Mechanical tunkなどを通して人間に問題を(部分的に?)解かせるときにどういうアルゴリズムだといいかだったり、そもそものタスクデザインの話について触れられていたように思う(細かい部分はあまり追えていないです)。MLでいうところの収束の話とかそういう議論はしづらい分野だろうが、ここしばらくはこういう研究が実用上重要ということで数も増えていくんだろうなぁと思った(セッション中もかなり人が入っていたし、今年のACLだったかICMLかでそういうセッションが開かれていたように思う。EMNLPでもシステムがそういう論文があって、あれはJavaのシステムが公開されていた)。タスクを人にやらせるときに様々な観測できない要因が絡んでくることもあって、そういうものもモデル化するためにLatent class modelという感じでグラフィカルモデルがいくつか出てきていたのでそこは聞いていたような気がするw。
以下はDiscourse Structureのほうで取った自分用のメモ。自分以外には分けが分からないと思う...。
Introduction
- discource => 複数のsentenceからなる
- state + state ... = event
- language feature(anaphoric expressionsなど)
- cue phrasesとboundary featuresが大事
- coherence relation discource relation, rhetorical relrationなどと呼ばれる
Functional Structure and Topic Structure
- どんな構造で表わすのがよさそうか
- semantic structure(dependency)
- topic structure
- 会議など音声のsegmentationなどに特に役に立つ
- texttilingやLSIのような意味的な塊の構造をうまく利用する
- 新聞、論文などの媒体によって注目すべき構造の形が違う
- functional structureがよく分かってない。topic structureとの違いは?
- functionalのほうはcue phrasesや「XXXの後にはYYYがきやすい」というような情報を使うもの、topicのほうはtexttilingやLSIのような意味的な情報を使うもの
- labeled biomadical abst
- pubmedなどにかなりある
その他
- LKK10 => discourse parsingの結果
- Marcu1999 => shift reduce based
- Discourse Structureを考えるときにfullかpartitialかは応用のときには重要
- unmarked relationとは?
- 後で調べる
- entity grid
- transitionを考えるらしい
*1:ここのBlogも読まれているようで恐縮...