2010-03-01から1ヶ月間の記事一覧

NAISTの講義

NAISTのシラバスが見れるようになってた。 情報科学研究科電子シラバス なんでも講義の3割くらいが今年度から英語になるらしい。資料が英語は大丈夫だと思うんだけど、耳がたぶんついていかないよなぁと若干じゃない不安。あとレポートも英語で提出の可能性…

つくば

引越しの荷物とかもろもろを終わらせて、つくばの家を出ました。アパートには4年半くらい、つくば自体には5年いたことになります。高校までは18年間ずっと熊本にいたので、ある意味第二の故郷的な感じです。その辺は昔に何か書いていた模様。 都会と田舎の間…

海外のRの情報源

R

Tokyo.Rに参加してきて、色んな人とお話させてもらったけど、結構Rを使いこなしているなぁと思う人が多いというのが第一印象だった(やってる内容とか悩んでいる問題とか)。が、悩んでいる問題を解決する術がすでに存在しているにも関わらず英語なので、その…

Tokyo.R#3の発表資料

R

第3回R勉強会@東京(Tokyo.R#03) : ATND Rは統計が得意なフィールドで、統計と言えばパラメータ推定、パラメータ推定には最適化手法がはずせないのでRにおける最適化をやるための周辺について話してきます。ところどころで脱線したりしてますがw。 Optimizat…

第3回R勉強会@東京(Tokyo.R#03)で発表してきます

R

と、予告エントリを上げることで自分を追い込むライフハック*1、のはずが引越し準備ですでに追い込まれている件について。僕は発表をしている場合なんだろうか。。。"Optimization in R"ということで、Rのoptim関数について30分くらい話すつもりです。Rの流…

第一回GSoC作戦会議done

統合収穫祭のお昼のときに@jj0c_0jjj君もGSoCに出す人であるということが分かってたので、現在の状況とかを連絡しあったり。意外ともう日がないようである。。。あと、去年GSoCのCytoscapeのプロジェクトで出されていたid:kozo-niさんに、去年提出されたprop…

メール出したりとか

Google Summer of Code、応募はまだ始まってない(3/29から)ですが、ちまちまとTokyoCabinetのRバインディングのためのコードとかを作り始めてます。どうするといいか悩み始めたのもあるし、いい機会だからメンターの人にメールしよっと思ってメールしてみた。

Waseda.Lに参加してきた

統合収穫祭が終わった後、id:yag_aysの家に泊めてもらい、Waseda.Lに参加してきました。 Waseda.L#3 - Waseda.L - Seesaa Wiki(ウィキ) イギリスに留学しにいくという@tkf君とid:nyanp君に会いたかったので、引っ越しの準備とか忘れて参加。諸処のあれによ…

統合収穫祭で発表してきました

統合データベース講演会AJACS本郷6(通称、統合収穫祭)でDBCLSで自分がRA(Research Assistant)として一年間やってきたことを @jj0c_0jjj @wakuteka @mickey24 @yag_ays @y_benjo @iNut と一緒に発表しました(発表順)。会場にきてくださった方、ustで見ていて…

C++でのオブジェクトをRで使い回す

R C++

TokyoCabinetをRから使えるようなライブラリを書くとしたら、例えばこんな感じできる。 GitHub - syou6162/RTokyoCabinet: Simple wrapper of TokyoCabinet for R. しかし、これだとgetやputをするたびにopen&closeしに行っているのでアホな感じである。TCHD…

ANYとかVIRTUALとか見つけた

R

それだけだけど。あとからどういうものか調べる。 setClass("Hoge", "ANY") setClass("Hoge", representation("VIRTUAL"))

Rcppを試してみる

R C

この前紹介したGoogle Summer of Codeのやつですが、メンターがDirk Eddelbuettelさんで、この人はRcppというパッケージを作ってる人で僕はこのパッケージを使ったことがなかったので、使ってみようじゃないかというお話。以下を参考にしつつ。 Rcpp: Seamle…

TCとTTについて調べてみる

自分用メモ。TCとTTのことがよく分かってないので、調べよう。 TCのデータベースの種類の概要 色々データベースの特徴がある。使うデータベースによって拡張子とかも違う。ハッシュデータベースが一般的のようだ。 ハッシュデータベース 1つのkeyに対して1つ…

書類が届いていた

入学許可証とかが届いてました。4/2日から色々説明があるっぽい。バイオサイエンス専攻は4/2からTOEICのテストと学科でのテスト(?)っぽいのがあって大変そうだ。情報科学研究科で学科のテストとか今やられた日には下から数えてトップを争うだろうなあ。。。

埼玉で開発合宿をやってきました

きんとう旅館/埼玉深谷[ビジネスホテル・宴会・懐石]に行ってきました。静かだし、お風呂も24時間入れるので、(開発)合宿向けですね。メンバーはid:repose、id:yag_ays、id:mickey24、id:wakuteka、id:iNut。Rubyで色々やる人が多かった感じです。この前も…

TokyoTyrantのRubyバインディングがMacでうまく動かないのではまってた

TokyoTyrantをMacで使ってて、以下のコードを実行するとinsertもlook upもうまくいかなかった。 # -*- coding: utf-8 -*- require 'tokyotyrant' db = TokyoTyrant::RDB::new # データベースオブジェクトを生成 db.open("localhost", 1979) # データベースサ…

Google Summer of Code 2010はじまた

らしいです。去年はぴんとくるプロジェクトがなかったので、結局応募しなかったんですが、今年はぴんときた。 http://rwiki.sciviews.org/doku.php?id=developers:projects:gsoc2010:nosql_interface 昼頃にTokyoCabinetをRから使えたらいいなーとか思ってい…

言語処理学会行ってきました&明日から埼玉で開発合宿しに行きます

PRML読書会から言語処理学会の年次大会まで5日連続でつくばと東京を往復するというなかなかアレな生活をしてまして、今日は中休み。言語処理学会の期間中は色々な方にお会いできてよかったです。学会期間中はid:mamorukさんがNAISTのM1の方向けに企業訪問ホ…

Ruby1.9とTokyoCabinet

Ruby1.9でTokyoCabinetを使っていて、UTF-8な文字列をTokyoCabinetのHDB(ハッシュデータベース)につっこんでいって、getするとASCII-8BITで返ってくるということで大分はまっていた(Ruby1.9だと文字コード(String#encoding)まで一致しないと同じ文字列だと見…

PRML読書会#12に行ってきた

C.M.ビショップ「パターン認識と機械学習(PRML)」読書会(第12回) : ATND きれいにまとめてる時間がないので、あとから自分が見て分かるだけのメモ。 K-meansは混合ガウスをEMでやったときのとある極限と考えることができる ハード割り当て 図9.10の下の図…

Local Hatena Searchが紹介されてた

Local Hatena Searchはローカルにあるファイルを読み込んでブログ風に表示するソフトウェアだ。記法ははてな記法を使い、Sinatraを使ってWebブラウザ用に表示する。検索機能があるので過去のメモを掘り起こしたりするのも容易だ。 ローカルでもはてな記法で…

scanのブロックの引数

Ruby1.8からRuby1.9に変えてからGitHub - iwadon/text-hatena: A Ruby library for Hatena notationが動かなくなったので原因を調べてた。Ruby1.9だと下のようなコードはsyntax errorで死ぬんだけど、1.8だと通る。 l.scan(/([^\|]+)\|/) do |$_, *| if sub!…

Rubyとマルチバイト文字列

Ruby1.9に乗り変えようとしたら、案の定マルチバイト文字列の付近ではまっているのでメモ。初めてのRubyとか見つつ。 Ruby1.8 文字列は単なるバイト列 $KCODE対応しているメソッドは$KCODEの値によって振舞いを変えることがある String#inspectとか 正規表現…

pack&unpackの処理速度

DBとかに保存するために配列(数値が入ってる)をスカラーに圧縮したい。"joinしてsplit"するのと"packしてunpack"だと後者が絶対早いよなーとか思ったけど、どれくらい早いのか気になったので調べてみた。配列はランダムに作ったほうがいいのかな、、、と思い…

さくらインターネットでsinatraを動かそうとしたらはまった

というのはぐぐればいくらでも出てきそうな感じですが、それでもはまる僕はなんなんですかね。ということで設定とか。基本的にはSinatraをCGIでもThin等のアプリサーバでも使えるようにする書き方 - 思っているよりもずっとずっと人生は短い。と同じなんだけ…

uint8とかMiniseのコード読んだりとか

C C++

Miniseのコード読みの続き。uint8とかuint64とか出てきてなんじゃいなという感じだったので調べてみる。Minise::addFilehttp://developers.curlap.com/curl/docs/rte/6.0/ja/docs/ja/dguide/primitive.htmlによると データ型 説明 既定値 サイズ(ビット) 有…

UTF-8単位で1文字とか

Rubyならeach_charでいいんでしょうが、C++でそれと同じようなことをしようと思ったらよく分からなかったので。WEB+DB PRESS Vol.53のp108付近(検索エンジンのところ)のことをやりたかった。キモは (byte & 0xC0) == 0x80 の部分で まずUTF-8の符号方式では…

C++でUTF-8単位で一文字とか

C++

UTF-8単位で1文字とか - Seeking for my unique color.をC++で書いただけ。あとで自分で使うかもなので。 #include <iostream> #include <string> #include <vector> std::vector<std::string> split_utf8(const std::string& str) { std::vector<std::string> result; std::string tmp; bool first = true; for (</std::string></std::string></vector></string></iostream>…