論文100本ノック

#8 Large Scale Semi-Supervised Learning

J. Weston. Proceedings of NATO Advanced Study Institute on Mining Massive Data Sets for Security, IOS Press.videolectureのvideoとかプレゼンの資料とか。 Large-Scale Semi-Supervised Learning - VideoLectures.NET Large Scale Semi-Supervised Le…

#7 Semi-Supervised Learning Using Gaussian Fields and Harmonic Functions

Zhu, X., Ghahramani, Z., & Lafferty, J. (2003a). ICML-03, 20th International Conference on Machine Learning. The bulk of the harmonic functions section of the tutorial is devoted to this paper. It directly addresses many aspects of the har…

#6 Seeing stars when there aren’t many stars: Graph-based semi-supervised learning for sentiment categorization

tutorialの資料があった。Amazonのカスタマーレビューのところにある☆がいくつかを当てるような問題にSSLを適用した、というもの。グラフベースの手法。この論文のmain contributionは3つあって 教師ありでやられていたことを半教師あり学習に拡張 グラフを…

#5 Learning from Labeled and Unlabeled Data using Graph Mincuts

プレゼンの資料がここに置いてあった。SSL(Semi-Supervised Learning)でグラフ理論を使ったものには Mincut Discrete Markov Random Fields and Harmonic Functions Mainfold Regularization Graph Kernels from the Spectum of Laplacian などなどがある(そ…

#4 Learning with Positive and Unlabeled Examples Using Weighted Logistic Regression

Lee, W. S. & Liu, B. In Proceedings of the Twentieth International Conference on Machine Learning (ICML (2003).この論文のmainのcontributionは2つ。 出力値が(ただの実数ではなく)確率で返ってくるので、最尤法が使える。そして凸なので最適化が容易…

#3 Building Text Classifiers Using Positive and Unlabeled Examples

Bing Liu, Yang Dai, Xiaoli Li, Wee Sun Lee and and Philip Yu. Proceedings of the Third IEEE International Conference on Data Mining (ICDM-03), Melbourne, Florida, November 19-22, 2003.この論文も正例とラベルなしデータからの学習に関する論文…

#2 Partially Supervised Classification of Text Documents

Liu, Bing and Lee, Wee Sun and Yu, Philip S. and Li, Xiaoli (2002). In Proc. 19th Intl. Conf. on Machine Learning.これも考えている問題は、少数のラベルありドキュメントと大量のラベルなし(この場合はmixed documentsって書いてあるが)文章で文章分…

#1 Text Classification from Labeled and Unlabeled Documents using EM

Kamal Nigam, Andrew McCallum, Sebastian Thrun and Tom Mitchell. Machine Learning, 39(2/3). pp. 103-134. 2000.少数のラベルありドキュメントと大量のラベルなし文章で文章分類。学習器は主にNaive Bayes(以下NBと書く)を利用している。最初はラベル付…

論文100本ノック始めます

僕も就活の面接のときに「74本論文読みました!」と言いたいので、というのは冗談で、せっかく新年になったので論文100本ノックなるものを開始してみようかと思うわけです。2010年12月31日に2010年に読んだ論文リストを書いておくと、はてダを開く度に今年読…