2010-10-01から1ヶ月間の記事一覧

依存構文解析(MST parserとLIP)

前回の続きと今回の資料。係り受けの問題をちょっと違う見方で見てみる。 Graph-based Method Integer Linear Programming Method Span-based Method こっちは次回らしい(Eisnerアルゴリズム => この前岩立さんのチュートリアルがあった) Graph-based Method…

#69 Crouching Dirichlet, Hidden Markov Model: Unsupervised POS Tagging with Context Local Tag Generation

Taesun Moon, Katrin Erk, Jason Baldridge, Proceedings of EMNLP-2010.言語によらず単語には機能語と内容語のようなものが存在するが、教師なしpos taggingでよく使われるHMMではこのような機能語、内容語の違いを捉えられない。このモデル(CDHMMとHMM+)で…

#68 Negative Training Data can be Harmful to Text Classification

Xiaoli Li, Bing Liu and See-Kiong Ng, in Proceedings of Conference on Empirical Methods in Natural Language Processing (EMNLP-10). Oct. 9-11, 2010, MIT, Massachusetts, USA.いわゆるcovariate shift的な問題を考えている論文。covariate shiftと…

#67 Joint Training and Decoding Using Virtual Nodes for Cascaded Segmentation and Tagging Tasks

Xian Qian, Qi Zhang, Yaqian Zhou, Xuanjing Huang, Lide Wu, in Proc. of EMNLP 2010, Massachusetts, USA.Joint Learningでword segmentationとNERを一緒にやる話。既存手法にDynamic Conditional Random Fields(DCRFs)というものがあるが、Figure 1のよ…

EMNLP読み会2010

告知していたように、研究室でEMNLP読み会を開催しました。おかげ様で読み手の人数が増えたので、二回に分けてやることになりそうです(第二回目は11月に)。ai-aさんとkodai-t、joseph-iが読み手で参加してくれました、ありがとうございます(自分も一個担当)…

Eisnerアルゴリズムのチュートリアル

III期初のD-Lec。岩立さんによるEisnerアルゴリズムのチュートリアル。今日の午前に松本先生の依存構造解析とかの授業があった後なので、すごくよいタイミング。Eisnerアルゴリズムは依存構造解析を行なうためのアルゴリズムの1つで 言語に依存しない Projec…

#66 Graph-based learning for statistical machine translation

Alexandrescu, A. and Kirchhoff, K. 2009, In Proceedings of Human Language Technologies: the 2009 Annual Conference of the North American Chapter of the Association For Computational Linguistics (Boulder, Colorado, May 31 - June 05, 2009). …

統語解析入門続編

前回のメモと今回の資料。Chart Parsing どこまで進んだという解析結果と次に何がくるか top down chart法 (bottom upと比べて)新しい文法規則を展開するタイミングが違うだけ 単語の隙間にb[i, j]とかがあるのに注意 最初のきっかけが必要(例: b[0, 0]にs -…

統語解析入門

今期にあっている松本先生の計算言語学に出ている。今日からparsingの話で、最近parsingに興味があるわりに全然知識がないので出席*1。松本先生のparsingの授業を受けられる、というのもすごい話である。 資料 => http://is-education.naist.jp/Data/Syllabu…

初めての文献複写

最近Bayesian HMMとかLDAHMMとかに興味があるので、その辺の論文を漁る。Bayesian HMMをMCMCでやる論文の最初のやつを探していたが、これかな? C. P. Robert, G. Celeux and J. Diebolt, "Bayesian estimation of hidden Markov chains: a stochastic implem…

EMNLP 2010の三日目の内容

"Measuring Distributional Similarity in Context" input matrixからlatent structureを明らかにしたい(latent使うことでcontextを見る?) meaningをhidden variableにして周辺化したものを考える(語によってmeaningの数がえらい違う気が...) =>NMFを使う =>…

EMNLP 2010一日目、二日目の内容

写真ばっかり載せていると遊びに行ったと思われそうなので(w)、発表聞いてたやつのメモ。自分が聞いた発表に限るので、もっと面白い発表もあったんだろうとは思いますが、聞いた&ある程度分かったやつについてのメモ。正確性については全く保証しません。par…

EMNLP 2010一日目、二日目の写真

デジカメが行方不明だったためiPhone 3Gのしょぼいカメラでお送りします(kodai-tがデジカメ持ってたので、その写真もらったら追加するかも)。 ボストンまでの道程 会場はMIT@ボストンで、関空->サンフランシスコ->ボストンとサンフランシスコを経由。10/8が…

EMNLP 2010に参加してきます

EMNLP 2010 論文通ったわけじゃないのに行ってきます。発表しないのに行くとか何事って感じですが、NAISTの特待生の制度で聴講でも一回どこかの国際会議に参加できるという特典があるので、それで行かせてもらいます。(EMNLPかは分からないけど)来年は自分で…

ゼミナール関係のメモ

ゼミナールの出席回数。 ゼミナールI I期、II期8回 III期1回 残り4回出ればおk ゼミナールII 出席11回、残り5回出ればおk III期の間には出揃うかな あとは自分の発表が2回 ちなみに基礎科目は6単位、専門科目は16単位過不足なく履修していることをこの前確認…

研究室の勉強会が大分少なくなった?

追記始まり。さっき見たら関係認識もあるようで、言語教育、意味談話も追加され、前期よりむしろ多くなっている模様。さすが松本研。追記終わり。lab関係。I期、II期は出る勉強会を早めに絞りすぎたなと感じていたから、III期からは出る勉強会を増やそう!!と…

研究室合宿に行ってきました

バーベキュー@松本先生のお宅以来くらいの研究室での大きいイベント...かな。レイクフォレストリゾートというところでやってきました。結構山の中にあって、ぐねぐねと。。。 リゾートとついているだけあってゴルフ場とか大きめの体育館etcもあって、フリー…