2010-05-01から1ヶ月間の記事一覧

自分用メモ

現実逃避。mecab-ipadic-2.7.0-20070801/char.defとかを見つつ。16進数とかで漢字の範囲がどこからどこまでというような内容のが入っている。この辺詳しくないので、Rubyで確認。 (0x2E80..0x2EF3).each{|c|puts [c].pack("U")} この辺を頑張れば、文字種を…

NAISTオープンキャンパスが開催されました

今日は快晴のオープンキャンパス日和、ということでNAISTオープンキャンパスが開催されました。去年はなんとかインフルエンザで、オープンキャンパスも"公式には"開催されないという形だったので人も少なかったですが、今年はめちゃくちゃ盛況。午後1時時点…

テスト勉強

あんまり分かってなくてテストで破滅しそうなので、勉強すべきところはどこかをまず見ておく(あと一週間後)。 4: チョムスキー標準形 チョムスー標準形の定義を抑える CFGをチョムスキー標準形に直す 非文脈自由文法 CFLに対するパンピングレンマ 定理の理解…

Hadoopメモ

この前やってて出てきた疑問を、id:mamorukさんに聞いて解決。ありがとうございました。 Mapperの数を指定できなかった件 指定はできるようだ。ただ、オプションに一貫性がないような。。。"-D"の場所を変えると動かなかったり。Mapperの数は指定はできるけ…

NTT CS研オープンハウスに参加

今日明日ということで、一日だけながらも参加。本当は明日の鈴木さんの半教師あり学習の講演を聞きたかったんだけど、明日はゼミナールがあるため参加できない(出席しておかないと卒業できない)。明日は何人かの方が講演を聞きに行かれるということなので、…

スタンドアローンモードではなく、複数台のサーバーで動かす

一台ではえらく簡単だったんだけど 複数台では結構つまづいた できたけどうまく理解できていない できたけど、もっと効率よくできるんじゃないか などなどあったので記録を取っておく。複数台のサーバーで(mapとかreduceを)動かすための鍵になるコマンドがあ…

Hadoop Streamingを動かしてみる

NLP.appの課題をやりたいと挙手したので(2週間後なのでテストを挟んでもきっと大丈夫なはず)、Hadoopを動かしてみる。Hadoopはmake installとかやらない感じのようで、shellに設定をちょっと書いてやる(.zshrcとかをいじりたくなければ、conf/hadoop-env.sh…

CYKアルゴリズム

前回はCFLに関してのパンピングレンマだったが、あんまり覚えてない。正則言語だと同じところを2回通って、ループができるか?というところが肝だった(気がする)が、CFLに関してのパンピングレンマだとTreeに関して同じ構造が出てくるか?が肝っぽい、というこ…

ベイズ理論

同時確率、条件付き確率からベイジアンアップデートまで。パラメトリック、ノンパラメトリック(データサイズが増えるにつれて、パラメータ数が対数オーダーで増える)のところは初めてだとたぶんわけわからないところで、ちょっと前で説明してみたけど、若干…

NAIST紹介

id:neanさんがNAISTの説明会にこられるということで、せっかくなのでNAISTを案内...するほど広い大学じゃないので(笑)、晩御飯がてら色々お話。1時から説明会があって、3時から6時くらいまで希望の研究室(2つだったかな)の話を結構聞けたようでよかったです…

離散数学第2回

19時スタート、22時過ぎ終わり。今回は「和積の原理(kodai-t)」と「命題と論理(tomoya-m => id:tomo_wb)」。さーっと流せばさーっと終わりそうだが、さーっとは終わらない(終わらない一端は自分だがw)。簡単と言えば簡単なところかもしれないけど、primitive…

対称鍵暗号系

http://is-education.naist.jp/Data/Syllabus/2010/TeachingMaterial/info-0006_1274259017.pdf 今日から暗号理論の内容。黒い感じの話が多いのであんまり好きになれないんだよなぁ、暗号理論。。。 平文 盗聴や覗き見から守りたい情報 中身が公開されたもの…

次世代モバイルプラットフォーム Android

GoogleでAndroid周りを開発されている高岡さんがお話されるゼミナールがあったので、メモ。Blogに書いていいよってことだったので。 ゼミナールI講演 モバイルデバイス向けのソフトウェアスタック OS、ミドルウェア、基本アプリケーション、開発環境 オープ…

Tsukuba.R#7の様子がgihyo.jpに!!

Tsukuba.R#7はgihyo.jpの高橋さんにustをお手伝いしてもらっていたようですが、そういうこともありまして、Tsukuba.Rの活動がgihyo.jpに掲載されています。 「Tsukuba.R#7」活動報告:レポート|gihyo.jp … 技術評論社 id:wakuteka、id:yag_ays、id:repose、…

やや実用、研究的な話題

巡回符号 シャノンの通信路符号化定理 新しいタイプの誤り訂正符号 「実用的な」線形符号の模索 符号化、誤り検出、訂正は行列演算によって実行可能 性能を向上させるためには、符号長を大きくすると有利 規模の大きい線形符号が必要 生成行列、検査行列が大…

夜な夜な作業 => 色々バイナリにしたいじゃないですか!!

Rのデータ構造をバイナリにしたいと思って、Rinternals.hをのぞく。このヘッダーファイルをのぞいている日でろくな日はない気が(ry。コーディングしていたら、3時くらいになっていて、次の日朝から授業ということを忘れていた。お腹減ったと思って、カップラ…

5単位Get!!

入学した直後に筑波で取っていた単位を認定してくださいとお願いしていて、教授会を通らないといけないということで5月の半ばまで待っていた。今日の昼に学生課に行って聞いてみたところ、ちゃんと認定してもらえてた。わーい。 筑波で取った認定してもらい…

初めての論文紹介

こっちにきてから初めての論文紹介。M1は基本的には夏前まで論文紹介が免除されているのだが(DMATHとかFSNLPとかM1だけでやるゼミは違うが)、4月にいくつか論文を読んでいたので挙手してみた。論文自体はそれほど難しいことをやっていないので、よかったのだ…

にっき

初めてのMT勉強会。もうちょっと分かるかなと思ったけど、正直どこが分からないかも分からないくらい理解できていなかった。この前Blogのコメントでid:mamorukさんに勧めてもらった資料には目を通してはいたんだが。。。このままではまずい。。。関係認識勉…

符号の性能評価

9回目。一限はお腹が減る。。。 色々な線形符号が存在 性能がよいものもあれば悪いものもあるので、性能を客観的に測れる指標が欲しい 最小ハミング距離や符号の重み分布を使った性能評価のやり方をやる ベクトル間の距離を定義してやる必要がある 常識的な…

M2の人が発表

4月から先生やスタッフの方が自分の研究の概要を話されていたが、今週からM2の先輩の発表。3人ずつ。M1の発表は7月からなので、何かしらしゃべれるようにしなければ。。。研究会は学会での質疑の練習という意味合いもあるということだったのでなるべく自分が…

線形符号と生成行列

復習 偶パリティ符号は線形符号だったら、奇パリティ符号は線形符号ではない 具体的な生成行列の生成方法の復習 p3の例。分かりやすい modに乗せて、排他的論理和で考える 先週の続き(誤り訂正符号)。 線形符号は 符号語集合がベクトル空間をなすような符号 …

#20 Large Language Models in Machine Translation

Thorsten Brants, Ashok C. Popat, Peng Xu, Franz J. Och, Jeffrey Dean, EMNLP-2007内容は結構シンプル。目的意識としては How might one build a language model that allows scaling to very large amounts of training data?(どーやってでかいデータで…

文脈自由言語とプッシュダウンオートマトン

今日から第二部。第一部でやったことの一般化になっているらしい。どう一般化になっているかはまだ分からないけど。 生成規則(るーる)を使って考える この方法を使うと正則表現のようなことができそう? 規則はrecursiveに(ちょっと違うか)定義されることもあ…

Tsukuba.R#7が開催されました&雑惑

Tsukuba.R#7 - Tsukuba.R - Seesaa Wiki(ウィキ) 参加者が40くらい(多分)で、ustreamのviewerのmaxで120越え(!!)という感じで大盛況だったんじゃないかなと思います。参加してくださった皆さんありがとうございます。研究室で聞いてたので音は聞けなかった…

B4の方を研究室案内とか

テストできなくてしょぼーんとFSNLPの予習をしていたところに、id:mamorukさんがいらっしゃって何かなーと思ったら、来年度松本研に希望のB4の方がいらっしゃるとのこと。去年も自分は二回ほど入試の前にNAISTにきて色々お話をさせてもらった&聞かせてもらっ…

情報を正確に伝える

今日から通信路符号化の話。信頼性の低い情報伝達媒体を介した情報通信を考えよう、という内容(効率化より、正確に伝えるというところにウエイトを置いてる)。 誤りが起きないようにするのがベストだが、全く起きないようにするのは現実的に困難 発想を変え…

GWなのでホソの会に参加してきた

なんだかんだでGWはリアルが充実している気が...。id:ujihisaがカナダから帰ってくるとSkypeで聞いていて、ホソの会というのがあるということだったので参加させてもらうことになった。同期にid:ujihisaの知り合いがいたので、その人も誘ってみた。学研北生…

テスト勉強

自分用メモ。ビデオアーカイブを見直しつつ、過去問を見つつ、できるようになっておかないと死亡なトピックをまとめておく。 具体的に解釈された言語 => DFA 具体的に解釈された言語 => 正則言語 NFA => DFA スライドのp51からp63に。p59からが例になってい…

にっき

前日のバーベキューが終わった後に友達の相談乗ってたら3時くらいになってて寝ようと思ったら目が冴えてきて5時くらいに寝た気がする。もそもそ起き出して、計算理論の過去問が思ってたより全然解けなくて死にたくなる。授業中理解したつもりだったが、授業…