2010-01-01から1年間の記事一覧

2010年は未定義です

C++

C++の話。vectorで範囲外参照をしたときに死んでくれるならいいけど、死ななくて範囲外参照していることに気づかないことがある(あった)。atにするのもなんだかなぁと思っていたんだけど、id:mickey24に_GLIBCXX_DEBUGというのを使う方法を教えてもらった。 …

言語処理学会年次大会

発表申し込みdone。 言語処理学会第17回年次大会(NLP2011) 評判分析のセッションで出してみました(機械学習と迷ったけどせっかくの言語処理学会なので...)。研究室からの発表は3件?かな。豊橋なのが関係しているのか否か...。いずれにせよ、年次大会参加され…

ガンマ関数

C++

メモ。math.hのgamma関数はガンマ関数ではなく、ガンマ関数の値に対数を取ったもの(=lgamma)を返す。tgammaで所望のものが手に入る。なんでこんな名前になっているのか意味が分からん(歴史的な経緯なんだろうけど)。manを見たら"本当の"とか書いてあって冗談…

メソッドの動的呼び出し

自分用メモ。単語のポジネガをぱっと見で確認するのに結果を色付きで見れると便利。Rubyでそういうgemを作っている人がいたので使わせてもらう。 GitHub - defunkt/colored: Colors in your terminal. Unmaintained. require "colored" puts "this is red".r…

Stanford Pos-Taggerをサーバーで起動

Stanford Pos-Taggerを(なんとなく)使ってるんだけど、起動が遅い。どうにかならないの?と思ったらFAQに書いてあって、サーバーを立ち上げてからクライアントで接続しろとのことだったので、それの方法をメモ。まず、サーバーを起動。 cd /path/to/stanford-…

ゼミナール発表終了

「文単位の極性を考慮に入れた評判分析モデル」という題目で研究科のゼミナール発表をしてきました。今日でM1の1回目のゼミナール発表はみんな終わりかな?皆さんお疲れ様でした、早く忘年会しましょ(ry*1。さて、前日というか当日の早朝まで実験回していると…

Ruby ベストプラクティスのメモ書き

Rubyベストプラクティス -プロフェッショナルによるコードとテクニック作者: Gregory Brown,高橋征義,笹井崇司出版社/メーカー: オライリージャパン発売日: 2010/03/26メディア: 大型本購入: 9人 クリック: 307回この商品を含むブログ (48件) を見る知らんこ…

とあるモデルのMCMC

飽きもせずにGibbs Samplingとかばっかりやってますが、久しぶりにはまった。離散確率分布とかからサンプリングするのにrandとかを使ってたんだけど、これがとてもとてもとてもいけなかった。CとかC++のrandは線形合同法で実装されているとかで周期性が問題…

研究会で発表

7月の研究会、10月の合宿、今回の研究会ということで研究室全体で自分の研究(とかやりたいこと)について話すのは3回目。7月の時は「やりたいことはあるんですけど、どうやってやればいいんですかねー」みたいな感じだったけど(最初はそれでも全然問題ない)、…

コマンドメモ

watchコマンドで定期的に実行(cron使う感じなないやつ。10秒ごととか)。 watch -n 1 "ls *.out | sort -n | xargs wc -l" マシンがいくつかああるときに空いてるマシンで実験したい。どこが空いてるかを探すためのコマンド。dsh知らんかった。 % dsh -ac 'ec…

glogのmesseageを吐く場所

C++

Googleのloggingライブラリでglogというのがあって便利だなーと思って使っていたら/tmp以下のバカでかいlogファイルがたまっていることを教えてもらってあたふたしていたところ。ここを見るに"logtostderr"をtrueにしといてやればlogfileを吐く変わりにstder…

にっき

実装実装実装。火曜にDMLAで紹介した自分のモデル(made by me)をとにかく実装。「割りと簡単にできると思います(キリッ」とか言ってしまったので、なんとか水曜の研究会までに実験の初期段階までは終わらせておきたい。。。サンプリングの式が面倒な感じにな…

今日のDMLA

内容は書けないけど、大変面白かった。性質の違うデータをどうやって一緒に考えていくかとか、見た目は全然違う問題なんだけど背後に隠れている問題構造とかが似ているとかそういうのは大変面白い。

論文100本ノックの感想&独断と偏見に満ち溢れた今年読んだ中で面白かった論文紹介

100本いってないじゃん!! いつまで高見の見物してるんですか??? 目を通してるConference その他 LDA関係 LDA自体について LDAをベースにした応用モデル 形態素解析、分かち書き ノンパラベイズ その他 クラスタリング 最適化 教師なし学習 今年の1月1日から…

ろんぶん!

まともに書いたことある論文がまだ卒論しかないid:syou6162です、こんばんわ(しかも、卒論も研究というよりお勉強という感じ。黒歴史)。このままでは社会的に殺されてしまうので、年度末付近にある年次大会などなどの会議とかジャーナルに出すべくtouch main…

#73 Correlated topic models

David M. Blei and John Lafferty, In Lawrence K. Saul, Yair Weiss, and L´eon Bottou, editors, Advances in Neural Information Processing Systems 17, Cambridge, MA, 2005. MIT Press.今日のDMLAにて紹介。LDAのトピック間に相関を入れたようなモデル…

Japan.R

R

今年もRユーザー会の季節だったようでggplot2の人とかが話されていたようだが、今年は併設(?)でJapan.Rというものができていた。 FrontPage - Japan.R WIki 特に午後の部はRユーザーの交流が目的とした感じの企画があっていたようで(Tsukuba.Rからはid:wakut…

合同研@NAIST

nlpjm2010 初参加かと思ったら去年も行っていたということに気がついた。今年のほうが知り合い増えているかなと思ったが、事前に知っている人は去年のほうが多かった気が(知ってる人はこない人が多かった。NAISTだから...じゃないよね?)。まあ、知り合い増や…

OBOG来訪

松本研卒のOBOGの方がこられるということで説明会(?)に参加。就職活動的なのは初めてかと思ったが、そういえば去年大学会館でMixiとかの説明を聞いた記憶があるので初めてではなかったようだ。インターンetcで雰囲気とか多少知ってるけど、やっぱりいい研究…

HMMのスケーリング係数

HMMを実装する上で考えなければならない問題点HMMにおけるパラメータ推定はフォワードバックワードによって効率的に計算される。しかし、実際に計算機上でこのアルゴリズムを動かそうとすると気を付けなければならないことがある。再帰式 の右辺のそれぞれの…

Lexical Acuisition

今日のFSNLPの勉強会はSection 8でkodai-tがLexical Acuisitionの主にverb subcategorizationについて紹介してくれた。他の章とかと比べて比較的知らないところだったので、へーっと思いながら聞いていた。subcategorizationは日本語でいうと「下位範疇化」…

Log-normal distributionの性質

自分用メモ。 David M. Blei and John Lafferty. Correlated topic models. In Lawrence K. Saul, Yair Weiss, and L´eon Bottou, editors, Advances in Neural Information Processing Systems 17, Cambridge, MA, 2005. MIT Press. を調べる機会があって、…

grepの結果をlessで色付きで見る

世の中的には常識なんかもしれんけど、知らんかったのでメモ。 grep --color=always begin main.tex | less -R

#70 A Mixture Model with Sharing for Lexical Semantics

Joseph Reisinger and Raymond Mooney. 2010, In Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing (EMNLP '10). Association for Computational Linguistics, Morristown, NJ, USA, 1173-1182.意味談話勉強会にて…

最近買った本

最近、というか夏以降に買った本。論文ばっかり読んでいた気がしたので、あんまり買ってない気がしたけど、それなりに買っていた。デジタル言語処理学事典 〔CD‐ROM付〕作者: 言語処理学会出版社/メーカー: 共立出版発売日: 2010/06/30メディア: 単行本購入:…

OmniGraffleの図をLaTeXに貼ったときに真っ白になってしまうときの対策法

夏にインターンに行った頃から生成モデルでいくつかモデル作ったりしていた(影響されやすい性格です、ええ)こともあって、OmniGraffleを使い始めました。(KeyNoteなどで図を作っていて)グラフィカルモデルのノードにいくつもエッジが向いているような場合、…

依存構文解析(MST parserとLIP)

前回の続きと今回の資料。係り受けの問題をちょっと違う見方で見てみる。 Graph-based Method Integer Linear Programming Method Span-based Method こっちは次回らしい(Eisnerアルゴリズム => この前岩立さんのチュートリアルがあった) Graph-based Method…

#69 Crouching Dirichlet, Hidden Markov Model: Unsupervised POS Tagging with Context Local Tag Generation

Taesun Moon, Katrin Erk, Jason Baldridge, Proceedings of EMNLP-2010.言語によらず単語には機能語と内容語のようなものが存在するが、教師なしpos taggingでよく使われるHMMではこのような機能語、内容語の違いを捉えられない。このモデル(CDHMMとHMM+)で…

#68 Negative Training Data can be Harmful to Text Classification

Xiaoli Li, Bing Liu and See-Kiong Ng, in Proceedings of Conference on Empirical Methods in Natural Language Processing (EMNLP-10). Oct. 9-11, 2010, MIT, Massachusetts, USA.いわゆるcovariate shift的な問題を考えている論文。covariate shiftと…

#67 Joint Training and Decoding Using Virtual Nodes for Cascaded Segmentation and Tagging Tasks

Xian Qian, Qi Zhang, Yaqian Zhou, Xuanjing Huang, Lide Wu, in Proc. of EMNLP 2010, Massachusetts, USA.Joint Learningでword segmentationとNERを一緒にやる話。既存手法にDynamic Conditional Random Fields(DCRFs)というものがあるが、Figure 1のよ…