2010-01-01から1年間の記事一覧

EMNLP読み会2010

告知していたように、研究室でEMNLP読み会を開催しました。おかげ様で読み手の人数が増えたので、二回に分けてやることになりそうです(第二回目は11月に)。ai-aさんとkodai-t、joseph-iが読み手で参加してくれました、ありがとうございます(自分も一個担当)…

Eisnerアルゴリズムのチュートリアル

III期初のD-Lec。岩立さんによるEisnerアルゴリズムのチュートリアル。今日の午前に松本先生の依存構造解析とかの授業があった後なので、すごくよいタイミング。Eisnerアルゴリズムは依存構造解析を行なうためのアルゴリズムの1つで 言語に依存しない Projec…

#66 Graph-based learning for statistical machine translation

Alexandrescu, A. and Kirchhoff, K. 2009, In Proceedings of Human Language Technologies: the 2009 Annual Conference of the North American Chapter of the Association For Computational Linguistics (Boulder, Colorado, May 31 - June 05, 2009). …

統語解析入門続編

前回のメモと今回の資料。Chart Parsing どこまで進んだという解析結果と次に何がくるか top down chart法 (bottom upと比べて)新しい文法規則を展開するタイミングが違うだけ 単語の隙間にb[i, j]とかがあるのに注意 最初のきっかけが必要(例: b[0, 0]にs -…

統語解析入門

今期にあっている松本先生の計算言語学に出ている。今日からparsingの話で、最近parsingに興味があるわりに全然知識がないので出席*1。松本先生のparsingの授業を受けられる、というのもすごい話である。 資料 => http://is-education.naist.jp/Data/Syllabu…

初めての文献複写

最近Bayesian HMMとかLDAHMMとかに興味があるので、その辺の論文を漁る。Bayesian HMMをMCMCでやる論文の最初のやつを探していたが、これかな? C. P. Robert, G. Celeux and J. Diebolt, "Bayesian estimation of hidden Markov chains: a stochastic implem…

EMNLP 2010の三日目の内容

"Measuring Distributional Similarity in Context" input matrixからlatent structureを明らかにしたい(latent使うことでcontextを見る?) meaningをhidden variableにして周辺化したものを考える(語によってmeaningの数がえらい違う気が...) =>NMFを使う =>…

EMNLP 2010一日目、二日目の内容

写真ばっかり載せていると遊びに行ったと思われそうなので(w)、発表聞いてたやつのメモ。自分が聞いた発表に限るので、もっと面白い発表もあったんだろうとは思いますが、聞いた&ある程度分かったやつについてのメモ。正確性については全く保証しません。par…

EMNLP 2010一日目、二日目の写真

デジカメが行方不明だったためiPhone 3Gのしょぼいカメラでお送りします(kodai-tがデジカメ持ってたので、その写真もらったら追加するかも)。 ボストンまでの道程 会場はMIT@ボストンで、関空->サンフランシスコ->ボストンとサンフランシスコを経由。10/8が…

EMNLP 2010に参加してきます

EMNLP 2010 論文通ったわけじゃないのに行ってきます。発表しないのに行くとか何事って感じですが、NAISTの特待生の制度で聴講でも一回どこかの国際会議に参加できるという特典があるので、それで行かせてもらいます。(EMNLPかは分からないけど)来年は自分で…

ゼミナール関係のメモ

ゼミナールの出席回数。 ゼミナールI I期、II期8回 III期1回 残り4回出ればおk ゼミナールII 出席11回、残り5回出ればおk III期の間には出揃うかな あとは自分の発表が2回 ちなみに基礎科目は6単位、専門科目は16単位過不足なく履修していることをこの前確認…

研究室の勉強会が大分少なくなった?

追記始まり。さっき見たら関係認識もあるようで、言語教育、意味談話も追加され、前期よりむしろ多くなっている模様。さすが松本研。追記終わり。lab関係。I期、II期は出る勉強会を早めに絞りすぎたなと感じていたから、III期からは出る勉強会を増やそう!!と…

研究室合宿に行ってきました

バーベキュー@松本先生のお宅以来くらいの研究室での大きいイベント...かな。レイクフォレストリゾートというところでやってきました。結構山の中にあって、ぐねぐねと。。。 リゾートとついているだけあってゴルフ場とか大きめの体育館etcもあって、フリー…

ベイジアンなモデルはオーダーメイド?

8月の頭からCS研にお世話になっていると書いていましたが、昨日で2ヶ月の実習が終わりました。実習中お世話になった方々、ありがとうございました。以下、ちょっとベイジアンに毒され始めた(ぉ)時期の中二病っぽい文章なので注意。内容についてはここには書…

Tsukuba.R#8が開催されました

Tsukuba.R#8 - Tsukuba.R - Seesaa Wiki(ウィキ) 今回はつくばの回(奇数回が東京、偶数回がつくば)だったのですが、筑波大ではなく産総研にてやらせてもらったそうです。@toddler2009さん、ありがとうございました。発表者のスライドでWebに上がっているも…

Polya分布のパラメータ最適化

Polya分布とは多項分布の共役事前分布にディリクレ分布を取って、ディリクレ分布のパラメータを積分消去するとPolya分布が出てくる。Latent Dirichlet Allocation(LDA)に代表されるトピックモデルでよく登場する確率分布。ガンマ関数を使って綺麗に書きくだ…

ディリクレ分布、ディガンマ関数、指数分布族、十分統計量

東京ではPRML読書会の最終回があっていたらしいですが、こちらはすごく初歩的な話。LDAのinferenceをGibbs samplingでやる話とかを紹介したので、こちらは変分ベイズでやるほう(というか元論文)を読んでいた。変分ベイズはいいんだけど、途中で出てくる (つ…

近況報告

まだまだ暑いですが、そろそろ8月も終わりですね。一ヶ月以上書いていなかったようで、近況報告でもします。色々精神的に起伏がありまして、なかなか大変な一ヶ月でしたが、とりあえず元気にはしています(夏バテとかはしていない模様)。。。今年はNTTのCS研…

経験ベイズと周辺尤度

経験ベイズは以前勉強したことがあったので、前よりは余裕を持って聞けた。 www.yasuhisay.info 「経験ベイズは何をするものか?」ということに一言で答えようとすると、「よりよいハイパーパラメータを決定するために周辺尤度最大化を用いる手法」ということ…

前向きアルゴリズム、Vitebiアルゴリズム

Viterbi書くの何回目だろ。。。週末にはバウムウェルチ(Baum-Welch)のアルゴリズムこと前向き後ろ向きアルゴリズムを書きたいところ。 www.yasuhisay.info # -*- coding: utf-8 -*- # 確率的言語モデル(東京大学出版)第4章(隠れマルコフモデル) require 'pp'…

変分ベイズ

natural conjugate priorと変分ベイズが一緒に出されてどっちも初めての人はついていけるのだろうかと思いつつ(授業的にはどっちかが分かってくれるといいなくらいだろうか)。エレベータで論生の人が「他の研究室の人たちはついていけるんだろうか」と話して…

Kindle用にPDFを取ってこさせる

pdfのtitleを適切に付けさせないと何のファイルか分けが分からなくなるのがkindleの欠点なので。 # -*- coding: utf-8 -*- require 'mechanize' require 'rss' require 'pp' agent = Mechanize.new rss = RSS::Parser.parse(ARGV.shift) prefix = "" prefix …

情報幾何学応用

セミパラメトリック推定がメインの話。双対平坦な統計モデル 2種類の接続 e接続 m接続 最尤推定はm射影をやっている モデルがExponential Familyなら一意に決まる 高次推定理論 平坦でないモデルは曲率とかの高次の項を見ないといけない emアルゴリズムセミ…

音声処理での距離尺度

R

自分用メモ。 f <- c(4, 8, 3, -3, 4, 10, 8, 7) y1 <- c(-3, 3, 0, -1, 2, 6, 3, -2) y2 <- c(-1, 6, 8, 6, 1, 3, 6, 11) # ユークリッド距離 sqrt(sum((f - y1)^2)) sqrt(sum((f - y2)^2)) # 板倉-斎藤歪み距離 1 / length(f) * sum(f - y1 + exp(y1) / ex…

月一食事会

研究室の。手巻き寿司。 腹いっぱい食べましたとさ。

情報幾何学

曲った空間を考える 局所的には線形空間と捉えられる 双対接続を用いた微分幾何学(???) 内積で、行列を挟んだものを「計量」と呼ぶ 共役勾配法の共役方向を作るときに出てきたやつ 別の基底ベクトルを導出 さっき作った行列Gの逆行列になっている そういうベ…

Kindle 2.5にバージョンアップ

で、大分使いやすくなった気がする。助教の先生のiPadに負けずに頑張ろうと思いますw。コレクションフォルダというよりは文章に対するタグっぽい感じかな。1つの文章を複数のコレクションに入れることもできるっぽい。なんでそもそもなかったのかという感じ…

色々宣伝

回しものだったり、回しものではなかったり。 サマーブートキャンプ http://is-exam-www.naist.jp/blog/2010/06/2010_3.html サマーブートキャンプ2010 NAISTのサマーブートキャンプ。うちの自然言語処理講座は検索エンジン作りと、統計的機械翻訳システムの…

長距離のモデル

yasuhiro-r中心で確率的言語モデルの勉強会があっている。言語と計算 (4) 確率的言語モデル作者: 北研二,辻井潤一出版社/メーカー: 東京大学出版会発売日: 1999/11メディア: 単行本購入: 10人 クリック: 91回この商品を含むブログ (44件) を見るちょっとヘル…

#27 OTL: A Framework of Online Transfer Learning

Peilin Zhao and Steven C.H. Hoi, The 27th International Conference on Machine Learning (ICML 2010), Haifa, Israel, 21-24 June, 2010.今熱い(?)転移学習とオンライン学習を組み合せてやってみましょうというお話。homogeneousな場合とheterogeneousな…