これまで行なってきた研究内容です。修士のときは評判分析、社会人になってからは談話構造解析やその自動要約への応用について研究していました。
自動要約
従来の自動要約手法は、文書を文の集合として捉え、その部分集合を要約としていました。しかし、作成された要約は一貫性が欠けており、読みにくいという問題がありました。この研究では、文書が本来持つ談話構造を利用して、文書を文間の依存関係や文の重要度を反映した木として表現し、部分木を抽出することで、一貫性のある要約を生成する技術を提案しました。
- Tsutomu Hirao, Nishino Masaaki, Yasuhisa Yoshida, Jun Suzuki, Norihito Yasuda and Masaaki Nagata, Summarizing a Document by Trimming the Discourse Tree, IEEE Trans. Audio Speech and Language Processing. (論文)
- Xun Wang, Yasuhisa Yoshida, Tsutomu Hirao, Katsuhito Sudoh, Masaaki Nagata, Summarization Based on Task-oriented Discourse Parsing, IEEE Trans. Audio Speech and Language Processing. (論文)
- Yasuhisa Yoshida, Jun Suzuki, Tsutomu Hirao and Masaaki Nagata, Dependency-based Discourse Parser for Single-Document Summarization, Proc. of the Empirical Methods in Natural Language Processing. (論文)
- Tsutomu Hirao, Yasuhisa Yoshida, Masaaki Nishino, Norihito Yasuda and Masaaki Nagata, Single-Document Summarization as a Tree Knapsack Problem, Proc. of the Empirical Methods in Natural Language Processing. (論文)
談話構造解析
機械翻訳や対話処理のための基礎研究、特に中国語から英語へ機械翻訳するための基礎研究を行ないました。中国語は特に接続詞が省略されやすい言語で、中国語から英語へ翻訳するには接続詞を補うために文と文の関係を解析する(談話構造解析)必要があります。その解器の研究開発を行ないました。
- Yasuhisa Yoshida, Katsuhiko Hayashi, Tsutomu Hirao, and Masaaki Nagata, Hybrid approach to PDTB-styled discourse parsing for CoNLL-2015, In Proceedings of the Nineteenth Conference on Computational Natural Language Learning: Shared Task. (論文, スライド)
- 林克彦 平尾努 吉田康久, 永田昌明: 修辞構造木から自動変換した談話依存構造木の性質について, 言語処理学会第21回年次大会, March 2015. (論文)
- 吉田康久 鈴木潤 平尾努 永田昌明: 係り受け木に基づく談話構造の提案, 言語処理学会第20回年次大会, March 2014. (論文)
評判分析
評判分析(製品に対するレビュー文がポジティブなものかネガティブなものか自動判別するタスク)ではレビューに含まれる単語の極性(ポジティブかネガティブか)は重要な要素です。しかし、単語によっては分野によって極性が反転してしまうものも存在します。例えばunpredictableという単語はDVDのドメインではポジティブな意味になりますが(e.g. unpredictable plot)、自転車のドメインではネガティブな意味になってしまいます(e.g. unpredictable steering)。この研究では、トピックモデルを用いることで、そのような分野によって極性が変わってしまう単語とそうでない単語を考慮した学習モデルを提案し、高精度に評判分析を行なえることを示しました。
- Yasuhisa Yoshida, Tsutomu Hirao, Tomoharu Iwata, Masaaki Nagata, Yuji Matsumoto, Transfer Learning for Multiple-Domain Sentiment Analysis: Identifying Domain Dependent/Independent Word Polarity, In Proceedings of the Twenty-Fifth AAAI Conference on Artificial Intelligence, San Francisco, USA, August 2011. (論文)
- 吉田康久 平尾努 岩田具治 永田昌明 松本裕治: 分野に依存しない単語極性を考慮した評判分析のための転移学習モデル, 言語処理学会第17回年次大会, March 2011. (論文, スライド) => 言語処理学会第17回年次大会優秀発表賞受賞