2010-03-01から1ヶ月間の記事一覧
NAISTのシラバスが見れるようになってた。 情報科学研究科電子シラバス なんでも講義の3割くらいが今年度から英語になるらしい。資料が英語は大丈夫だと思うんだけど、耳がたぶんついていかないよなぁと若干じゃない不安。あとレポートも英語で提出の可能性…
引越しの荷物とかもろもろを終わらせて、つくばの家を出ました。アパートには4年半くらい、つくば自体には5年いたことになります。高校までは18年間ずっと熊本にいたので、ある意味第二の故郷的な感じです。その辺は昔に何か書いていた模様。 都会と田舎の間…
Tokyo.Rに参加してきて、色んな人とお話させてもらったけど、結構Rを使いこなしているなぁと思う人が多いというのが第一印象だった(やってる内容とか悩んでいる問題とか)。が、悩んでいる問題を解決する術がすでに存在しているにも関わらず英語なので、その…
第3回R勉強会@東京(Tokyo.R#03) : ATND Rは統計が得意なフィールドで、統計と言えばパラメータ推定、パラメータ推定には最適化手法がはずせないのでRにおける最適化をやるための周辺について話してきます。ところどころで脱線したりしてますがw。 Optimizat…
と、予告エントリを上げることで自分を追い込むライフハック*1、のはずが引越し準備ですでに追い込まれている件について。僕は発表をしている場合なんだろうか。。。"Optimization in R"ということで、Rのoptim関数について30分くらい話すつもりです。Rの流…
統合収穫祭のお昼のときに@jj0c_0jjj君もGSoCに出す人であるということが分かってたので、現在の状況とかを連絡しあったり。意外ともう日がないようである。。。あと、去年GSoCのCytoscapeのプロジェクトで出されていたid:kozo-niさんに、去年提出されたprop…
Google Summer of Code、応募はまだ始まってない(3/29から)ですが、ちまちまとTokyoCabinetのRバインディングのためのコードとかを作り始めてます。どうするといいか悩み始めたのもあるし、いい機会だからメンターの人にメールしよっと思ってメールしてみた。
統合収穫祭が終わった後、id:yag_aysの家に泊めてもらい、Waseda.Lに参加してきました。 Waseda.L#3 - Waseda.L - Seesaa Wiki(ウィキ) イギリスに留学しにいくという@tkf君とid:nyanp君に会いたかったので、引っ越しの準備とか忘れて参加。諸処のあれによ…
統合データベース講演会AJACS本郷6(通称、統合収穫祭)でDBCLSで自分がRA(Research Assistant)として一年間やってきたことを @jj0c_0jjj @wakuteka @mickey24 @yag_ays @y_benjo @iNut と一緒に発表しました(発表順)。会場にきてくださった方、ustで見ていて…
TokyoCabinetをRから使えるようなライブラリを書くとしたら、例えばこんな感じできる。 GitHub - syou6162/RTokyoCabinet: Simple wrapper of TokyoCabinet for R. しかし、これだとgetやputをするたびにopen&closeしに行っているのでアホな感じである。TCHD…
それだけだけど。あとからどういうものか調べる。 setClass("Hoge", "ANY") setClass("Hoge", representation("VIRTUAL"))
この前紹介したGoogle Summer of Codeのやつですが、メンターがDirk Eddelbuettelさんで、この人はRcppというパッケージを作ってる人で僕はこのパッケージを使ったことがなかったので、使ってみようじゃないかというお話。以下を参考にしつつ。 Rcpp: Seamle…
自分用メモ。TCとTTのことがよく分かってないので、調べよう。 TCのデータベースの種類の概要 色々データベースの特徴がある。使うデータベースによって拡張子とかも違う。ハッシュデータベースが一般的のようだ。 ハッシュデータベース 1つのkeyに対して1つ…
入学許可証とかが届いてました。4/2日から色々説明があるっぽい。バイオサイエンス専攻は4/2からTOEICのテストと学科でのテスト(?)っぽいのがあって大変そうだ。情報科学研究科で学科のテストとか今やられた日には下から数えてトップを争うだろうなあ。。。
きんとう旅館/埼玉深谷[ビジネスホテル・宴会・懐石]に行ってきました。静かだし、お風呂も24時間入れるので、(開発)合宿向けですね。メンバーはid:repose、id:yag_ays、id:mickey24、id:wakuteka、id:iNut。Rubyで色々やる人が多かった感じです。この前も…
TokyoTyrantをMacで使ってて、以下のコードを実行するとinsertもlook upもうまくいかなかった。 # -*- coding: utf-8 -*- require 'tokyotyrant' db = TokyoTyrant::RDB::new # データベースオブジェクトを生成 db.open("localhost", 1979) # データベースサ…
らしいです。去年はぴんとくるプロジェクトがなかったので、結局応募しなかったんですが、今年はぴんときた。 http://rwiki.sciviews.org/doku.php?id=developers:projects:gsoc2010:nosql_interface 昼頃にTokyoCabinetをRから使えたらいいなーとか思ってい…
PRML読書会から言語処理学会の年次大会まで5日連続でつくばと東京を往復するというなかなかアレな生活をしてまして、今日は中休み。言語処理学会の期間中は色々な方にお会いできてよかったです。学会期間中はid:mamorukさんがNAISTのM1の方向けに企業訪問ホ…
Ruby1.9でTokyoCabinetを使っていて、UTF-8な文字列をTokyoCabinetのHDB(ハッシュデータベース)につっこんでいって、getするとASCII-8BITで返ってくるということで大分はまっていた(Ruby1.9だと文字コード(String#encoding)まで一致しないと同じ文字列だと見…
C.M.ビショップ「パターン認識と機械学習(PRML)」読書会(第12回) : ATND きれいにまとめてる時間がないので、あとから自分が見て分かるだけのメモ。 K-meansは混合ガウスをEMでやったときのとある極限と考えることができる ハード割り当て 図9.10の下の図…
Local Hatena Searchはローカルにあるファイルを読み込んでブログ風に表示するソフトウェアだ。記法ははてな記法を使い、Sinatraを使ってWebブラウザ用に表示する。検索機能があるので過去のメモを掘り起こしたりするのも容易だ。 ローカルでもはてな記法で…
Ruby1.8からRuby1.9に変えてからGitHub - iwadon/text-hatena: A Ruby library for Hatena notationが動かなくなったので原因を調べてた。Ruby1.9だと下のようなコードはsyntax errorで死ぬんだけど、1.8だと通る。 l.scan(/([^\|]+)\|/) do |$_, *| if sub!…
Ruby1.9に乗り変えようとしたら、案の定マルチバイト文字列の付近ではまっているのでメモ。初めてのRubyとか見つつ。 Ruby1.8 文字列は単なるバイト列 $KCODE対応しているメソッドは$KCODEの値によって振舞いを変えることがある String#inspectとか 正規表現…
DBとかに保存するために配列(数値が入ってる)をスカラーに圧縮したい。"joinしてsplit"するのと"packしてunpack"だと後者が絶対早いよなーとか思ったけど、どれくらい早いのか気になったので調べてみた。配列はランダムに作ったほうがいいのかな、、、と思い…
というのはぐぐればいくらでも出てきそうな感じですが、それでもはまる僕はなんなんですかね。ということで設定とか。基本的にはSinatraをCGIでもThin等のアプリサーバでも使えるようにする書き方 - 思っているよりもずっとずっと人生は短い。と同じなんだけ…
Miniseのコード読みの続き。uint8とかuint64とか出てきてなんじゃいなという感じだったので調べてみる。Minise::addFilehttp://developers.curlap.com/curl/docs/rte/6.0/ja/docs/ja/dguide/primitive.htmlによると データ型 説明 既定値 サイズ(ビット) 有…
Rubyならeach_charでいいんでしょうが、C++でそれと同じようなことをしようと思ったらよく分からなかったので。WEB+DB PRESS Vol.53のp108付近(検索エンジンのところ)のことをやりたかった。キモは (byte & 0xC0) == 0x80 の部分で まずUTF-8の符号方式では…
UTF-8単位で1文字とか - Seeking for my unique color.をC++で書いただけ。あとで自分で使うかもなので。 #include <iostream> #include <string> #include <vector> std::vector<std::string> split_utf8(const std::string& str) { std::vector<std::string> result; std::string tmp; bool first = true; for (</std::string></std::string></vector></string></iostream>…