2009-11-01から1ヶ月間の記事一覧

Re:forとapplyの速度比較

helpを求められたような気がしたので。 http://blog.m884.jp/2009/11/30/forとapplyの速度比較 最後に。誰かggplot2できれいにプロットしてください。そこまでする余力がありませんでした…。 書いてみました。 d <- read.table("/tmp/hoge.csv", sep="\t", h…

仮免

合格した!!なんか100点だったらしいのでQuoカードももらえた!!いや、テストの前の一時間しか勉強してないんだが。。。実技のほうはほぼノーミスでしたが、「ゆっくりすぎる」とのことでした。。。

来学期の講義

こんな感じで作ってみた。情報の学部の授業ばっかりである。 月 火 水 木 金 1 機械語序論 情報数学 2 機械語序論 情報数学 情報理論 3 先端最適化理論 4 先端最適化理論 情報理論 5 オペレーティングシステムII 6 放課後 PRML勉強会 機械語序論はなんとか頑…

みきわめ

無事終わったので、明日が修検!!

Introduction to High-Performance Computing with Rを聞いてきた

R

Rユーザー会の英語でのチュートリアル講演を聞いてきました。初立川でした。統数研が10月に立川に移転したということで、タクシーの運転手の人も警察官も「統数研」という言葉にぽかんとされてしまいました。12/5のほうに参加される方は時間にかなり余裕を持…

wmaファイルをmp3に一括変換

オーディオ(ICレコーダー/リニアPCMレコーダー/ラジオサーバー) | オリンパスというICレコーダーを使っていて、結構音拾えるし、専用のケーブルなくても充電できたりで便利に使っている。しかしながら、保存されるファイル形式がwmaなので、macでは再生…

部分文字列の組み合わせをC++で

C++

これのC++版のメモ。 MeCabで切った後の複合名詞に対して、部分文字列の組み合わせを考える - Seeking for my unique color. #include <iostream> #include <string> #include <vector> #include <boost/foreach.hpp> std::vector<std::vector<std::string> > enum_cons(std::vector<std::string> v, int n) { std::vector<std::vector<std::string> > result; uns…</std::vector<std::string></std::string></std::vector<std::string></boost/foreach.hpp></vector></string></iostream>

Dropboxから画像を集めてくる

某懇親会の画像をDropboxにおいてもらったのはいいのですが、クリックしながら収集とか死にそうだったので、ちょめちょめと書きました。 # -*- coding: utf-8 -*- require 'rubygems' require 'mechanize' require 'hpricot' agent = WWW::Mechanize.new (0.…

Nelder-Mead methodをRで実装した

最適化理論の課題提出期限が過ぎたと思うので、うpします。この辺の軌跡を書くためのコードです。 www.yasuhisay.info Nelder-Mead methodがどんな手法の説明はこの辺に書いている。一行で要約すると、ヘッセ行列、勾配ベクトルすら使わずに関数値のみで動い…

Tsukuba.R#6終了しました!!

ちょっと体調があれだったので、お昼の部やら懇親会出れなかったりして申し分けありませんでした。。。そんなわけでTsukuba.R#6終了しました。発表してくれた皆さん、聞きにきてくださった皆さんありがとうございました。特に岐阜(!!)からきてくださったid:i…

Tsukuba.R#6の発表資料

あげておきます。Keynoteをpdfで吐いてみた。 Tsukuba from syou6162 Tsukuba.pdf まあ、この辺とレイヤーで重ねていくってことですね。

ggplotはただの綺麗系graphics libraryではない

id:nozmaことかつどんさんに教えてもらいながらggplotを勉強して、Tsukuba.R#6の発表資料をせこせこと作っています(遅)。ggplotは何も考えずに使っていると「ディフォルトが綺麗な感じのパッケージなんだなー」みたいな印象で終わってしまいそうですが、ggpl…

自然言語処理特論最終回

今日は最終課題になっていた言語モデルのみんなのモデルがどれくらいのPPまでいったかというところをばっと見ていきました。自分はBack-offの実装にてこずっていたら期限が近づいていたので(おい)、線形補間法(EMアルゴリズムで係数推定)で挑みました。ただ…

バイナリデータの読み込み書き込み

C++

学習データの数がだんだんでかくなってきており、2000万サンプルくらいになってきている。こうなってくると「素性をファイルに書き出し、学習木に読み込ませる(学習はさせてない)」というプロセスすら結構時間がかかってくる。自然言語処理だとこのくらいの…

教習所にて運転

学科も始まり、車なるものを初めて運転しました。感想としては「20キロってこんなに早いのか…!」でした。スピードにも慣れないといけないということで、スピードを出してみるわけで「うおっ、出しすぎた!」と思って速度を見ていると20キロしか出ていなかった…

半教師あり学習でollを使いたいので、ollをライブラリとして使ってみる

バイトにて、岡野原さんが作られているオンライン学習をサポートした機械学習ライブラリ「oll」をめちゃくちゃ使わせてもらっている。 Google Code Archive - Long-term storage for Google Code Project Hosting. 自然言語処理のような大規模かつスパースな…

一行づつ、をstringで

R

自分用メモ。 #include <iostream> #include <fstream> #include <string> #include <vector> #include <R.h> #include <Rdefines.h> #include <Rinternals.h> extern "C" { SEXP my_scan(SEXP fn, SEXP rho) { SEXP result; std::vector<std::string> v; std::ifstream fis("/Users/syou6162/dbcls/umls/umls.txt"); std::string…</std::string></rinternals.h></rdefines.h></r.h></vector></string></fstream></iostream>

一気読みじゃなくて、一行づつ読み込んで何かしら変換をかます

R

昨日言ってたところを解決すべく、かなり久しぶりにRの拡張を書いた。Cはもう書く気になれないので、C++で書くことにした。 #include <iostream> #include <fstream> #include <string> #include <vector> #include <R.h> #include <Rdefines.h> #include <Rinternals.h> extern "C" { SEXP my_scan(SEXP fn, SEXP rho) { SEXP r</rinternals.h></rdefines.h></r.h></vector></string></fstream></iostream>…

一気読み、ではなく一行づつ

R

Rのデータ読み込みはscan、read.tableなどなどがあるが、基本的に一気に読み込む。このため、でかいファイルを読み込むときなどに非常に困る。Rubyのように file = File.open("test.txt", "r") file.each{|line| # do something } というような処理ができな…

Rでポインタ的何か

R

RのlistにめちゃくちゃでかいvectorやmatrixをつっこんでいくとRが落ちることがある。「ポインタ的何かをつっこめれば、、、」と思うこともあるけど、Rにポインタはない。と思っていたが、相当することができそうな気がしてきた。こんな感じ。 > x <- 1:1000…

SIR(重点サンプリング)を簡単な例で

木曜だと思っていたゼミが明日だということにさっき気がついてあたふたと準備をしています。。。担当している箇所はパターン認識と機械学習 下 - ベイズ理論による統計的予測の11.1.4の重点サンプリングと11.1.5のSIRです。重点サンプリングのところは去年研…

初めての企業説明会

大学会館で説明会があると聞いたので、行ってきた。いや、本当に就活するのは早くても来年なんですが。奈良にいると気軽には行けなくなりますからね。20社くらいこられていた感じだったと思いますが、色々話を聞いてて楽しそうだなーと思ったのはMixiかな。…

トピックモデル入門編

自然言語処理特論も最後の話題、トピックモデルに先週から入ってます。今日の資料はこの辺の最初の付近。 Topicに基づく統計的言語モデルの最善線 前々回までの内容は最尤推定に基づいていたものがほとんどで、(ベイズ的な流れではない)スムージングの方法の…

記憶制限準ニュートン法、最適化手法の相互の関連性、そして私が感じたこと

授業を聞いててなかなか興奮したので、これまでのおさらいとともにメモメモ。ニュートン法ニュートン法は目的関数を2次で近似したものだったが、目的関数が2次でないと、ヘッセ行列が正定値行列になるとは限らず、ニュートン方向が降下方向になる保証がない…

Liner Interpolation with EM Algorithm

線形補間法の係数をEMアルゴリズムで推定するコードがようやくちゃんと動いた。前は係数手動で決めたりしてたけど、とりあえず形にはなった。しかし、テストセットパープレキシティが14.805であり、14を切らないので、これではAは確実に取れるか分からない。…