読者です 読者をやめる 読者になる 読者になる

Rでエラーバー付きで表示

R

サンプリング系の手法とか初期値を変えると性能が結構変わる手法だとエラーバー付きで出したほうがいいんちゃう?と言われることがよくある。ということでよく書く必要があるので、テンプレを残しておく。データは適当に作ってます。 N <- 20 samples <- 1:N …

Japan.R

R

今年もRユーザー会の季節だったようでggplot2の人とかが話されていたようだが、今年は併設(?)でJapan.Rというものができていた。 FrontPage - Japan.R WIki 特に午後の部はRユーザーの交流が目的とした感じの企画があっていたようで(Tsukuba.Rからはid:wakut…

Tsukuba.R#8が開催されました

Tsukuba.R#8 - Tsukuba.R - Seesaa Wiki(ウィキ) 今回はつくばの回(奇数回が東京、偶数回がつくば)だったのですが、筑波大ではなく産総研にてやらせてもらったそうです。@toddler2009さん、ありがとうございました。発表者のスライドでWebに上がっているも…

音声処理での距離尺度

R

自分用メモ。 f <- c(4, 8, 3, -3, 4, 10, 8, 7) y1 <- c(-3, 3, 0, -1, 2, 6, 3, -2) y2 <- c(-1, 6, 8, 6, 1, 3, 6, 11) # ユークリッド距離 sqrt(sum((f - y1)^2)) sqrt(sum((f - y2)^2)) # 板倉-斎藤歪み距離 1 / length(f) * sum(f - y1 + exp(y1) / ex…

夜な夜な作業 => 色々バイナリにしたいじゃないですか!!

Rのデータ構造をバイナリにしたいと思って、Rinternals.hをのぞく。このヘッダーファイルをのぞいている日でろくな日はない気が(ry。コーディングしていたら、3時くらいになっていて、次の日朝から授業ということを忘れていた。お腹減ったと思って、カップラ…

Google Summer of Codeでacceptされました

http://socghop.appspot.com/gsoc/program/list_projects/google/gsoc2010 Google Open Source Blog: This Year’s Google Summer of Code Students Announced! Google Summer of Codeにapplyしました - Seeking for my unique color. 朝起きたらメールがきて…

closureさん、怖いです...

R

id:mickey24が解説記事を書いてくれるはずなので、正座して待ってます。iさんを早く殺してあげて欲しい。fさんに振り回されてかわいそう。。。 > f <- sapply(1:10, function(i){ function(x) { i } }) > lapply(f, function(func) (func)(3)) [[1]] [1] 10 …

Tsukuba.R#7が5/9に開催されます

Tsukuba.R#6が11月だったので大分時間が空いてしまいましたが、マイペースでやればいいんです。ということで5月9日にTsukuba.R#7が開催されます。 Tsukuba.R#7 - Tsukuba.R - Seesaa Wiki(ウィキ) 空いてた期間で色んなところで声かけたり、他のRのコミュ…

Google Summer of Codeにapplyしました

添削してもらったりしていただいたおかげでstudent proposalがそれっぽくなってきたので、サイトのほうに上げてみました(メンターの人とかじゃないと中身は見れないようですが、僕のstudent proposalはあとで公開するかも。なんか公開されてるの少ない気がす…

海外のRの情報源

R

Tokyo.Rに参加してきて、色んな人とお話させてもらったけど、結構Rを使いこなしているなぁと思う人が多いというのが第一印象だった(やってる内容とか悩んでいる問題とか)。が、悩んでいる問題を解決する術がすでに存在しているにも関わらず英語なので、その…

Tokyo.R#3の発表資料

R

第3回R勉強会@東京(Tokyo.R#03) : ATND Rは統計が得意なフィールドで、統計と言えばパラメータ推定、パラメータ推定には最適化手法がはずせないのでRにおける最適化をやるための周辺について話してきます。ところどころで脱線したりしてますがw。 Optimizat…

第3回R勉強会@東京(Tokyo.R#03)で発表してきます

R

と、予告エントリを上げることで自分を追い込むライフハック*1、のはずが引越し準備ですでに追い込まれている件について。僕は発表をしている場合なんだろうか。。。"Optimization in R"ということで、Rのoptim関数について30分くらい話すつもりです。Rの流…

C++でのオブジェクトをRで使い回す

R C++

TokyoCabinetをRから使えるようなライブラリを書くとしたら、例えばこんな感じできる。 GitHub - syou6162/RTokyoCabinet: Simple wrapper of TokyoCabinet for R. しかし、これだとgetやputをするたびにopen&closeしに行っているのでアホな感じである。TCHD…

ANYとかVIRTUALとか見つけた

R

それだけだけど。あとからどういうものか調べる。 setClass("Hoge", "ANY") setClass("Hoge", representation("VIRTUAL"))

Rcppを試してみる

R C

この前紹介したGoogle Summer of Codeのやつですが、メンターがDirk Eddelbuettelさんで、この人はRcppというパッケージを作ってる人で僕はこのパッケージを使ったことがなかったので、使ってみようじゃないかというお話。以下を参考にしつつ。 Rcpp: Seamle…

各地に広まるR Movement!!

R

この辺でTsukuba.R作るんだって言い始めて、この辺で#1をやって、筑波以外にも地域のRコミュニティができるといいなーとか発表したのはつい先日ですが、いつの間にかいくつかRのコミュニティグループができてきています。 Google グループ http://m884.jp/Os…

GPGPUとR

R

Introduction to High-Performance Computing with Rを聞いてたときに、CUDAとかOpenCLとかGPUのところだけがさっぱり分かっていなかった(相対的に)。が、昨日PFIセミナーで@nushioさんがGPGPUについてお話してくれるということでustreamで聞いていた。何に…

Rユーザー会で発表してきました

R

今回は技術的なことではなく、Tsukuba.Rの紹介、勉強会、コミュニティ活動の勧めというような感じの内容で発表してきました。顔出しNGな人の写真も含まれていたため、発表したときの資料とは若干異なりますが、まあ大体同じです。 R User Group 2009 Yoshida…

明日はRユーザー会で話します

R

Rユーザー会が開催されるよ!! - Seeking for my unique color. 前回は講演を聞くだけでしたたが、明日のは発表ということで、さっきせっせと資料を作っておりました。技術の話はしないからあれなんですが、「楽しさ」というのを伝えるのは難しいなぁ。参加さ…

Re:forとapplyの速度比較

helpを求められたような気がしたので。 http://blog.m884.jp/2009/11/30/forとapplyの速度比較 最後に。誰かggplot2できれいにプロットしてください。そこまでする余力がありませんでした…。 書いてみました。 d <- read.table("/tmp/hoge.csv", sep="\t", h…

Introduction to High-Performance Computing with Rを聞いてきた

R

Rユーザー会の英語でのチュートリアル講演を聞いてきました。初立川でした。統数研が10月に立川に移転したということで、タクシーの運転手の人も警察官も「統数研」という言葉にぽかんとされてしまいました。12/5のほうに参加される方は時間にかなり余裕を持…

Nelder-Mead methodをRで実装した

最適化理論の課題提出期限が過ぎたと思うので、うpします。この辺の軌跡を書くためのコードです。 www.yasuhisay.info Nelder-Mead methodがどんな手法の説明はこの辺に書いている。一行で要約すると、ヘッセ行列、勾配ベクトルすら使わずに関数値のみで動い…

Tsukuba.R#6の発表資料

あげておきます。Keynoteをpdfで吐いてみた。 Tsukuba from syou6162 Tsukuba.pdf まあ、この辺とレイヤーで重ねていくってことですね。

ggplotはただの綺麗系graphics libraryではない

id:nozmaことかつどんさんに教えてもらいながらggplotを勉強して、Tsukuba.R#6の発表資料をせこせこと作っています(遅)。ggplotは何も考えずに使っていると「ディフォルトが綺麗な感じのパッケージなんだなー」みたいな印象で終わってしまいそうですが、ggpl…

一行づつ、をstringで

R

自分用メモ。 #include <iostream> #include <fstream> #include <string> #include <vector> #include <R.h> #include <Rdefines.h> #include <Rinternals.h> extern "C" { SEXP my_scan(SEXP fn, SEXP rho) { SEXP result; std::vector<std::string> v; std::ifstream fis("/Users/syou6162/dbcls/umls/umls.txt"); std::string…</std::string></rinternals.h></rdefines.h></r.h></vector></string></fstream></iostream>

一気読みじゃなくて、一行づつ読み込んで何かしら変換をかます

R

昨日言ってたところを解決すべく、かなり久しぶりにRの拡張を書いた。Cはもう書く気になれないので、C++で書くことにした。 #include <iostream> #include <fstream> #include <string> #include <vector> #include <R.h> #include <Rdefines.h> #include <Rinternals.h> extern "C" { SEXP my_scan(SEXP fn, SEXP rho) { SEXP r</rinternals.h></rdefines.h></r.h></vector></string></fstream></iostream>…

一気読み、ではなく一行づつ

R

Rのデータ読み込みはscan、read.tableなどなどがあるが、基本的に一気に読み込む。このため、でかいファイルを読み込むときなどに非常に困る。Rubyのように file = File.open("test.txt", "r") file.each{|line| # do something } というような処理ができな…

Rでポインタ的何か

R

RのlistにめちゃくちゃでかいvectorやmatrixをつっこんでいくとRが落ちることがある。「ポインタ的何かをつっこめれば、、、」と思うこともあるけど、Rにポインタはない。と思っていたが、相当することができそうな気がしてきた。こんな感じ。 > x <- 1:1000…

SIR(重点サンプリング)を簡単な例で

木曜だと思っていたゼミが明日だということにさっき気がついてあたふたと準備をしています。。。担当している箇所はパターン認識と機械学習 下 - ベイズ理論による統計的予測の11.1.4の重点サンプリングと11.1.5のSIRです。重点サンプリングのところは去年研…

Nelder-Mead methodの軌跡

教習所にも通うことになったので、さっさと課題片づけておくかーと思って、Nelder-Mead methodの実装を開始。すぐ終わった。どんな方法かは下に書いた。 Nelder-Mead method - yasuhisa's blog すぐ終わった、だけどこれ多変数最適化の手法であることを考え…

Rユーザー会が開催されるよ!!

Tsukuba.R#6の開催もありますが、年度末はRのイベント盛りだくさんです!!研究集会「データ解析環境Rの整備と利用」ということで、11月27日(金)と12月5日(土)の二回に分けて開催されます。12月5日(土)のほうでは僕らがTsukuba.Rでやっている活動をLTのような…

library(plyr)のeach関数にバグがある件→作者さんに報告しました

R

複数の関数を適用した結果を返すeach関数 - Seeking for my unique color.の続き。library(plyr)のeach関数にバグというかよろしくない実装があるのをかつどんさんが見つけた。よろしくないことが起こる例としては > result <- 1:10 > each(length, mean, va…

複数の関数を適用した結果を返すeach関数

R

Rであるデータに対して、複数の処理をして、その結果をまとめて返すというのはlist関数を使うのが定石だと思うんだが、若干めんどくさいところがある。例えば無名関数でやるとこんな感じ。 > (function(x){list(mean(x), var(x))})(1:10) [[1]] [1] 5.5 [[2]…

差集合的なにか

R

集合は定義から、同じ要素は含まないわけですが、そうゆうのも許して欲しいときがある。こういう2つのベクトルがあったとき x <- c("a", "b", "c", "a", "a", "b") y <- c("c", "d", "c") Rでの差集合演算を使うともちろんこうなる。 > setdiff(x, y) [1] "a…

Rと自然言語処理

Rは コーパス言語学的なものに対しては相性がよい 一方、(言語モデルなどの)自然言語処理に対してはひたすら相性が悪い そんな気がしている。 see also CRAN Task View: Natural Language Processing

Tsukuba.R#6を開催するよ!!

いやはや、Tsukuba.R#5をやってから大分経過しております。。。 Tsukuba.R#5をやってきました - Seeking for my unique color. というわけで、Tsukuba.R#6を開催しようと思います。# 実は10月半ばに開催する予定だったんですが、大学の全学停電や学園祭シー…

初めてのEMアルゴリズム with R

混合正規分布について 混合正規分布のEMアルゴリズムによるパラメータ推定 EMアルゴリズムの単調増加性について この前はEMアルゴリズムがどんな感じのメカニズムで、どんな性質を持っているか簡単に書いた。 初めてのEMアルゴリズム - yasuhisa's blog とい…

applyの普通じゃない(?)ような使い方

R

R苦手の会で説明したんだけど、なんとなくBlogでも書いてみる。こんな風なcsvファイルがあったとする。 hoge, 2 fuga, 3 piyo, 1 これは文章中にhogeが2回、fugaが3回、piyoが1回出てきたというようなものを表わしている。ここで、このcsvの情報から単語の登…

Rosenbrockのbanana functionを共役勾配法で最適化して、可視化してみた

wikipedia:en:Rosenbrock_functionという有名らしい関数があるんですが、共役勾配法の動きを見てみるためにこの関数で遊んでみました。結果はこんな感じ。 極端すぎないパラメータだと大域的最適解に行ってくれました。コードも簡単。 f <- function(x) { x1 …

共役勾配法を実装してみた

本当は去年みたいなplotをしたいんだけど、面倒(ry。工学基礎 最適化とその応用 (新・工科系の数学)の4.6章で遊んでいる。二次関数の簡単なのをとりあえず。 f <- function(x) { x1 <- x[1]; x2 <- x[2] 3 / 2 * x1^2 + x1 * x2 + x2^2 - 6 * x1 - 7 * x2 } …

Rで疎行列を扱う

自分用メモ。 library(Matrix) setwd("/Users/syou6162/Downloads/data") x <- readMM("k1b.mtx") x[1, 1:10] x <- as(x, "CsparseMatrix")

RserveをC++から使ってみる

R C++

最近Rを使っていなさすぎて死ぬレベルなので、Rを使うことにした。ただし、C++を通して。RserveというRを叩けるTCP/IPサーバーがあるらしいので、それを使います。主にJavaで使うことを想定されているらしいですが、Javaはもう覚えていないので*1、C++で触り…

Bug fixしてもらえたった

R

ここに書いていたiterationsのパッケージ。 useR!2009で気になった発表をいくつか紹介してみる - Seeking for my unique color. こんな感じのlocaleだと動かないよ、と報告したところ > sessionInfo() R version 2.9.1 (2009-06-26) i386-apple-darwin9.7.0 …

useR!2009で気になった発表をいくつか紹介してみる

R

7/17から7/19はRubyKaigi 2009が行なわれていましたが、ほぼ同時期の7/7から7/10はuseR! 2009がフランスで行なわれていたようです。RubyKaigiは2006年から毎年開催されていますが、useR!も2004年から毎年開催されていて、RubyKaigiに負けないような規模(とい…

Tsukuba.R#5の発表資料

Rの基本データ構造をもっと理解しよう id:syou6162 自己紹介 吉田康久 id:syou6162 syouでおk Tsukuba大学のM1 Tsukuba.Rの近況(?)その1 Tsukuba.Rの活動が熊本でも知られているみたいで、ちょっと発表してきた やっちろ.Rの発表資料 - Seeking for my uniqu…

精度がなかなか上がらない→辞書の特徴について考える

DBCLSでバイト。指標のところは全部実装したので、ライフサイエンス辞書の単語を正解のものとして、RecallやPrecision、F値(自然言語処理のF値がなんでこういう式なのかを勉強しておかないと。。。)などを計算。が、ありえないほど精度が出なくてへこむ。テ…

Rによる最適化、パラメータ推定入門

パラメータの推定、でもその前に optimize関数について 補足 パラメータの推定 ベルヌーイ分布 定式化(尤度関数) 尤度関数の実装 尤度関数の最適化(パラメータ推定) 正規分布におけるパラメータ推定 まとめ パラメータの推定、でもその前に統計におけるパラ…

RMeCabでインストールにこけるときがある

Mac10.5.6を使っていて、Rを「sourceから」インストールしていた場合 > library(RMeCab) エラー: パッケージ 'RMeCab' は universal-apple-darwin8.11.1 に対して造られました となって、使えなかった。なんでだろーと思ってバイナリのほうでインストールす…

MeCabで区切った単語を再びつなげる

先週は形態素解析なアプローチじゃなくて、特長語抽出のような感じで専門用語が取り出せないかなーとやっていた。 www.yasuhisay.info が、YamChaの使い方がよく分からない&使うツールの中身が今の自分にとってはブラックボックスすぎる、ということで形態素…

やっちろ.Rの発表資料

R

会場なう。ということで、資料を置いておきます。 やっちろ.R in 熊本 id:syou6162 今日のAgenda 自己紹介 Tsukuba.Rについて 事前調査 Rのぐぐり方、効率がよい(と思われる)勉強の仕方 Rのデータ構造とそれに関する関数 ベクトル、行列、データフレーム、リ…