2009-01-01から1ヶ月間の記事一覧

Rで計算速度を上げるための3つのステップ

R

現段階でへっぽこR使いのid:syou6162が思っている感じのこと。Rレベルでなるべく早くする apply familyとかouterなどなるべくベクトル単位で処理するようにする forを避ける このレベルでもものによってはかなり早くなる Cを使う 速度を上げるための方法とし…

snowパッケージを使って、並列処理をやってみた

R

卒研のプログラムも最後の段階ではかなり時間がかかるものがあった。Cで高速化したけど、それでも12時間くらいかかるというものもあった。どうにかやってもうちょっと早くしたいということで最後の手段(、並列処理に手を出してみることにした。並列処理と(同…

卒論おわた

1/26(月)に卒論提出、1/29(木)に発表ということで卒論が終わりました。今週は研究室の先輩にプレゼン&配布資料などを見てもらったりして、自分だけで書いた時より、相当かなりとーってもよくなったんですが、まあ聞かれるべきところを聞かれて研究ではそこで…

やること

卒研発表会で面白そうだった人の発表の論文&参考文献を漁る 履歴書を書く(英語で) パスポート取得 SVC関連のMLを追う 渡米用の航空チケットをgetする 先生と修士における計画について相談する 来週はまたゼミである id:reposeとブートストラップについての勉…

マルコフ連鎖の収束判定に関連するトピック

以前までのMCMCのシミュレーションでは、不変分布に収束したかと見なせるかは、時系列plotをして、変な動きをしていなければ収束しているんじゃね?という大雑把なものだった。ということで、今回はマルコフ連鎖がどういう状況ならば収束していると判定してい…

全てが終わったら書きたいこと

卒論提出後のその後から発表本番までの道程 id:syou6162が卒論を書くのに足りていた能力、足りていなかった能力 2月から何を勉強するか 新しい分野 これまでの復習 1月に色々考えた将来展望 はてなーでも分かる俺の卒論解説

俺的統計の進め方

id:wakutekaとid:HashのIntroduction to the theory of statisticsの読書会にこっそりチャットのログを見たりしながら参加しているんだけど、統計な研究室にいる俺がほぼ一年間でどういう感じで勉強を進めてきたかを書いみようと思う。新4年生も入ってくる時…

OMakeで身長が5cm(ry

しまった、もっと早く導入すればよかった。TeX勉強会で紹介しようと思う。OMake自体の説明は以下のリンク先を見てくだしあ。 OMake のための emacs mode: omake-mode.el - Oh, you `re no (fun _ → more) http://unicus.ddo.jp/omake-wiki/index.php Guide O…

危うく死ぬところだった

週末Cで高速化してなかったら死ぬところだった。理論だけじゃなくてシミュレーションでもナダラヤワトソンが真の関数にpointwiseに平均二乗収束する、ということを示すのも追加しようかと言われた。ということは、ナダラヤワトソン推定量を100回くらい計算し…

劇的に高速になった

上の続き。2変数のナダラヤワトソン推定量(乗法的カーネルを仮定しない)においてクロスバリデーションを最小にする平滑化パラメータ行列の計算はすでに終わっている。が、悲しくなるくらい遅い。n=1000で3日かかるくらいである。というわけで上のCの方法を使…

RのコードをCに書き変えてみたら1500倍くらい早くなったけど、早すぎて将来が不安

C R

昨日の続きのところ。Cでナダラヤワトン推定量*1計算させて、Rのoptimを使って計算したら早くなったっぽい気がした。でも、一変数はRだけでまともなコードがなかった(文字列evalとかのやつしか残っていなかった)ので速度比較ができなかった。これじゃ最適化…

クロスバリデーション最小化のコード関係をCで書いてみた

R C

Cで書いてどうなるかを見てみるテスト。やってみて気がついたが、サンプル数が少ないとき、epanechnikovだと分母が0の領域が出てきて微妙な感じになってしまうのでどうにかしないといけないが、面倒なので放置している。。。サンプル少ない時はガウシアンカ…

Cの勉強などなど

C

Rを読む時に必要そうなところを中心にピックアップ。C言語入門 (ASCII SOFTWARE SCIENCE Language)を参考にしつつ。構造体と配列なんちゃら型の配列というのができるらしい。Javaの型付きのArrayListみたいな感じか。 #include <stdio.h> struct pencil { int hardnes</stdio.h>…

Cを使ってRの拡張をする関係の参考リンク

R C

Rのソースコードを読むオフなどしたいなどする。Cに詳しい人がいるとよさそうですか、分かりません。 Introduction to Calling C and Fortran from R ppt注意 暇を見つつ日本語訳などしたい R-C-interface なかなか分かりやすそう 読みたいソース R-2.8.0/sr…

CでRを拡張するための方法解説

R C

解説というほどの解説でもないんだけど、日本語リソースが非常に少ないので、ちょっとは役に立つかもしれないなと思って。短かいですが、上のエントリのCの部分を中心に説明していこうかなと思います。拡張するための3つ方法Writing R Extensionsをばーっと…

CでRの拡張したら速すぎて(40〜50倍)吹いたwww

R C

昨日Gibbs Sampler Algorithmをやってみたわけだが、Rの中でfor文を書いていて必要となるサンプル数が多くなると非常につらくなってくることは目に見えている。しかも、MCMCでは初期値依存となる期間のサンプルを捨てないといけない。そういうわけでじゃんじ…

俺的MCMCまとめ

12月くらいからMCMCの勉強しだして、いくつか代表的なアルゴリズムによるサンプリングをやったのでまとめておく。 Example of Rejection Sampling - yasuhisa's blog Example of importance sampling - yasuhisa's blog Example of Metropolis Hastings Algo…

Gibbs Sampler Algorithmによって多変量正規分布からのサンプル抽出を行なう

もちろんRで。 2変数正規分布 2変数の正規分布からのサンプリングはここのをそのまままねすると B <- 2000 x1 <- rep(NA,B+1) x2 <- rep(NA,B+1) x1[1] <- -2 x2[1] <- 1 for (i in 1:B){ x1[i+1] <- rnorm(1,1+0.7*(x2[i]-2),sqrt(1-0.7^2)) x2[i+1] <- rno…

インターンに行くかもしれない

以下、全部まだ仮定の話。僕の妄想です。まだBlogでは書いてなかったけど、M1の時にインターンに行くことを考えている。が、結構早く面接などをしないといけないので、2月の終わりくらいには受けるつもりでいる。履歴書英語*1だったりする時点で泣きそうな感…

2009年の目標

一月ももう半分、卒研提出まであと二週間というところですが。。。ちなみに2008年はこんな感じでした。動きまくったという感じですね。 2008年を振り返ってみる - Seeking for my unique color. 2008がそんな感じだったので、2009はdirectionを定めていくよ…

日程関係は決まった

SVC

飛行機のチケットはまだだけど、id:satzz氏にホテルの予約をお願いし(ありがとうございます)日程が決まってきました。3/19-3/26という感じです。というわけで卒業式は出れないようです。

MCMCのための確率過程概要

確率過程の忘れっぷりにわろた。確率過程の基礎を参考にしつつ書いている。式番号、ページなどは全てこれのやつです。 吸収状態 チャップマンーコルモゴルフ方程式 45pの(2.2)。n期でiにいて、n+m期でj移っているような推移確率行列のこと。 44pからの簡単な…

Tsukuba.R#4開催するよ!!!

Tsukuba.R#4の日程が決まりましたのでお知らせします。今年度最後のTsukuba.Rだよ!!! Tsukuba.Rはつくば周辺(半径40万キロくらい)をターゲットとしたGNU RおよびR言語の勉強会です。 Rユーザーに限らず、幅広い層からの参加をお待ちしております。 今回は偶…

学類でTeX勉強会をしたい

卒論提出まであと2週間程度となりましたが、社会工学類の4年生の皆さんいかがお過ごしでしょうか(何。大部分の人がおそらくTeXりまくっていることだと思います。僕の予想として うお、こう書きたいんだけど、これどうすればいいんだ? ここやっつけでこう解決…

SVC事前ミーティングに参加した

SVC

12/31に申し込んで以来、メーリスを追うとかくらいしかできていなかったわけですが、僕にとってのSVC関係の初めての活動と言えるSVC事前ミーティングに参加してきました。最初に自己紹介があったんだけど、そのやり方も面白いと思った。閑歳さんことid:ramya…

Metropolis Hastings Algorithmの続き

前回のところではガンベル分布からの乱数が生成できないとして、独立連鎖において正規分布を使って乱数生成をやった。しかし、上の記事の通り、全区間に渡って0以上となるような分布ならとりあえずできるらしいということが分かった。なので今回は独立連鎖の…

Gibbs Sampler and Metropolis Hastings Algorithm

先輩と二人でExample of Metropolis Hastings Algorithm - yasuhisa's blog付近の続き。メトロポリスとかがどういうアルゴリズムかとかは分かった。実装もして欲しい乱数列を取得することもできた。が、なんでこれでうまく行くのかが分からない。よし、調べ…

R空気読みすぎだろwww

R

「3重forループをRで書くと遅いからなー。outer関数の多変数版ないかなー」とか思ってouterをなんとなくネストさせてみたら動いたwwwしかも、outerだから結構早いwww > outer(outer(1:5,1:5,"+"),1:5,"+") , , 1 [,1] [,2] [,3] [,4] [,5] [1,] 3 4 5 6 7 [2…

自分で書いて分かんなくなってきたwww

多変数における最小二乗クロスバリデーション評価関数を最小にするhを決定する - Seeking for my unique color.の最適化関数の付近。 mapply(に相当するもの)が3つくらいネストしたりしていますが、怖がってはいけません。 gkbrです。。。 optim(par=c(1,0.1…

卒研ゼミの1コマ

id:syou6162「休みの間に2次元(4変数)のクロスバリデーションの最適化やってきました」 先生「いいね、じゃあ春休みの終わりまでに5次元(25変数)くらいまでやってみようか」 ちょwww