2010-01-01から1年間の記事一覧

課題の何か

HMM

本質的にHMMですね。 si_1 <- c(250, 260, 250) si_2 <- c(220, 240, 230) ka_1 <- c(240, 260, 230) ka_2 <- c(250, 270, 260) si <- c(240, 250, 230) ka <- c(230, 260, 250) target_cost <- function(x, y) { abs(x[1] - y[1]) + 2 * abs(x[2] - y[2]) +…

強化学習

よく分からないです><。 半教師あり学習 No Free Lunch モデルの誤りが大きな誤差を生む クラスタリングを使うこともある この辺は知ってるので、メモは略 Self-Training Co-Training Transductive SVM 強化学習 マルコフ決定過程 状態を知覚 政策で行動を…

Hypertableインストール作業3日目

大変難航しております。無駄に相当はまっている。週末と月曜の午後を使ったけど、それでもまだ入らない。バイナリが配布されているはずなんだけど、OSXのバイナリのところに置いてないし、サイトつながらないしで涙目。この辺に書いてある必要なもの取ってき…

多層パーセプトロンとSVM

http://hawaii.naist.jp/~kazushi/lec/tls/l3.pdf パーセプトロンの多層化 多層化というより、前処理というようなイメージ ニューラルネットは意識しているけど... 結合重みをランダムに生成 資料の赤のほうをランダム、青のほうはパーセプトロンで学習 汎化…

フーリエ級数展開とフーリエ変換

からまでの範囲でをフーリエ級数展開してみる(フーリエ解析 (理工系の数学入門コース 6)のp18の例)。nの次数を上げていくと元の関数に接近していくということが分かる。この図でこそ、元の関数と一致している点のほうが有限個くらいしかないように見えるが、…

超基礎事項から

それすら分かっていない状況。。。 周波数は、波動や振動の周期の逆数であり、単位は「ヘルツ」(Hz)が使われる。 波長とは、波形を描いて空間を伝わる電磁波や音波などにおいて、波形のある地点からすぐ隣の同じ位相までの距離を表すものである。 振幅(しん…

勉強しておいたほうがいい手法

増えてきているので書いとかないと忘れる。 SVD 行列関係、一回押さえておかないとあれだなぁ Hashing関係の手法 LSH、Spectral Hashing付近

フーリエ級数

この時間は機械翻訳の勉強会が入っているので、授業は取らない予定だった。が、音情報処理が予想以上に分けが分からない感じで、正直やばすぎて、分からないところはフーリエ変換とかその付近からで、基礎数学IIでその付近をやっているということを友達から…

ARモデルとか

自己回帰が音声でも出てくるとは。経済の時系列モデルでやったことあったからモデルは分かるんだが、音声の専門用語が全然分からないのが。。。演習問題はARの係数求めて、極が分かり、それからarctanとか使って、ピークがくるところを求めてすぐ終わり。

#23 Map-Reduce for Machine Learning on Muiticore

Olukotun, NIPS-2006.id:mamorukさんによる紹介。Multicore上でのMap-Reduceを機械学習でやる話。「SVMを並列でやれるようにしたよ(pSVMとかcascaded SVMとか)」とかそういうものではなく、Statistical Query modelという範疇にあるモデルのクラスでsummatio…

学習アルゴリズムの学習曲線

パーセプトロンの収束定理くらいまでかな?と思っていたらあんまり知らないような内容まであってびっくりした。アルゴリズムに対する学習曲線というものを導入し、統計力学の手法を使って解析する。次元数と例題数を無限大に飛ばすと0に行くんだが、問題はそ…

FSNLP 2.2の資料を公開します

研究室の自然言語処理の基礎勉強会でFSNLPを使っていて、今週が自分の担当のところ。2.2章の情報理論。情報理論のテストも終わったばかりということでみんなの頭の中に記憶があるときでよかったです。言語モデルのほうとかは早めにやっていたほうがいいと思…

自分用メモ

現実逃避。mecab-ipadic-2.7.0-20070801/char.defとかを見つつ。16進数とかで漢字の範囲がどこからどこまでというような内容のが入っている。この辺詳しくないので、Rubyで確認。 (0x2E80..0x2EF3).each{|c|puts [c].pack("U")} この辺を頑張れば、文字種を…

NAISTオープンキャンパスが開催されました

今日は快晴のオープンキャンパス日和、ということでNAISTオープンキャンパスが開催されました。去年はなんとかインフルエンザで、オープンキャンパスも"公式には"開催されないという形だったので人も少なかったですが、今年はめちゃくちゃ盛況。午後1時時点…

テスト勉強

あんまり分かってなくてテストで破滅しそうなので、勉強すべきところはどこかをまず見ておく(あと一週間後)。 4: チョムスキー標準形 チョムスー標準形の定義を抑える CFGをチョムスキー標準形に直す 非文脈自由文法 CFLに対するパンピングレンマ 定理の理解…

Hadoopメモ

この前やってて出てきた疑問を、id:mamorukさんに聞いて解決。ありがとうございました。 Mapperの数を指定できなかった件 指定はできるようだ。ただ、オプションに一貫性がないような。。。"-D"の場所を変えると動かなかったり。Mapperの数は指定はできるけ…

NTT CS研オープンハウスに参加

今日明日ということで、一日だけながらも参加。本当は明日の鈴木さんの半教師あり学習の講演を聞きたかったんだけど、明日はゼミナールがあるため参加できない(出席しておかないと卒業できない)。明日は何人かの方が講演を聞きに行かれるということなので、…

スタンドアローンモードではなく、複数台のサーバーで動かす

一台ではえらく簡単だったんだけど 複数台では結構つまづいた できたけどうまく理解できていない できたけど、もっと効率よくできるんじゃないか などなどあったので記録を取っておく。複数台のサーバーで(mapとかreduceを)動かすための鍵になるコマンドがあ…

Hadoop Streamingを動かしてみる

NLP.appの課題をやりたいと挙手したので(2週間後なのでテストを挟んでもきっと大丈夫なはず)、Hadoopを動かしてみる。Hadoopはmake installとかやらない感じのようで、shellに設定をちょっと書いてやる(.zshrcとかをいじりたくなければ、conf/hadoop-env.sh…

CYKアルゴリズム

前回はCFLに関してのパンピングレンマだったが、あんまり覚えてない。正則言語だと同じところを2回通って、ループができるか?というところが肝だった(気がする)が、CFLに関してのパンピングレンマだとTreeに関して同じ構造が出てくるか?が肝っぽい、というこ…

ベイズ理論

同時確率、条件付き確率からベイジアンアップデートまで。パラメトリック、ノンパラメトリック(データサイズが増えるにつれて、パラメータ数が対数オーダーで増える)のところは初めてだとたぶんわけわからないところで、ちょっと前で説明してみたけど、若干…

NAIST紹介

id:neanさんがNAISTの説明会にこられるということで、せっかくなのでNAISTを案内...するほど広い大学じゃないので(笑)、晩御飯がてら色々お話。1時から説明会があって、3時から6時くらいまで希望の研究室(2つだったかな)の話を結構聞けたようでよかったです…

離散数学第2回

19時スタート、22時過ぎ終わり。今回は「和積の原理(kodai-t)」と「命題と論理(tomoya-m => id:tomo_wb)」。さーっと流せばさーっと終わりそうだが、さーっとは終わらない(終わらない一端は自分だがw)。簡単と言えば簡単なところかもしれないけど、primitive…

対称鍵暗号系

http://is-education.naist.jp/Data/Syllabus/2010/TeachingMaterial/info-0006_1274259017.pdf 今日から暗号理論の内容。黒い感じの話が多いのであんまり好きになれないんだよなぁ、暗号理論。。。 平文 盗聴や覗き見から守りたい情報 中身が公開されたもの…

次世代モバイルプラットフォーム Android

GoogleでAndroid周りを開発されている高岡さんがお話されるゼミナールがあったので、メモ。Blogに書いていいよってことだったので。 ゼミナールI講演 モバイルデバイス向けのソフトウェアスタック OS、ミドルウェア、基本アプリケーション、開発環境 オープ…

Tsukuba.R#7の様子がgihyo.jpに!!

Tsukuba.R#7はgihyo.jpの高橋さんにustをお手伝いしてもらっていたようですが、そういうこともありまして、Tsukuba.Rの活動がgihyo.jpに掲載されています。 「Tsukuba.R#7」活動報告:レポート|gihyo.jp … 技術評論社 id:wakuteka、id:yag_ays、id:repose、…

やや実用、研究的な話題

巡回符号 シャノンの通信路符号化定理 新しいタイプの誤り訂正符号 「実用的な」線形符号の模索 符号化、誤り検出、訂正は行列演算によって実行可能 性能を向上させるためには、符号長を大きくすると有利 規模の大きい線形符号が必要 生成行列、検査行列が大…

夜な夜な作業 => 色々バイナリにしたいじゃないですか!!

Rのデータ構造をバイナリにしたいと思って、Rinternals.hをのぞく。このヘッダーファイルをのぞいている日でろくな日はない気が(ry。コーディングしていたら、3時くらいになっていて、次の日朝から授業ということを忘れていた。お腹減ったと思って、カップラ…

5単位Get!!

入学した直後に筑波で取っていた単位を認定してくださいとお願いしていて、教授会を通らないといけないということで5月の半ばまで待っていた。今日の昼に学生課に行って聞いてみたところ、ちゃんと認定してもらえてた。わーい。 筑波で取った認定してもらい…

初めての論文紹介

こっちにきてから初めての論文紹介。M1は基本的には夏前まで論文紹介が免除されているのだが(DMATHとかFSNLPとかM1だけでやるゼミは違うが)、4月にいくつか論文を読んでいたので挙手してみた。論文自体はそれほど難しいことをやっていないので、よかったのだ…