先日、社内で定期的に行なわれているフロントエンド会にお邪魔してきました(podcastが配信されています)。jser.infoというサイトを参照しながら雑談していたのですが、最近のフロントエンドの動向を知るという目的にはこのサイトなかなかよさそうでした。
機械学習勉強会でもランチタイムに最近の話題を見ながら雑談しているのですが、ネタになるエントリ一覧とそれに対するコメントは社外に公開して別に問題ないなと思ったので、不定期報という形で出してみることにしました。自然言語処理も自分がカバーできる範囲限られているし、自然言語処理以外の機械学習の話はかなりカバーできないので、たれこみフォームも作りました。耳寄りな情報、お待ちしております:)
論文
ブログ/勉強会資料
- 12月ということもあって、advent calendarがML&NLPに限らず盛んですね。目に付いた範囲ではこんな感じでしょうか。deep勢強い...
- ニューラルかな漢字変換 - Qiita
- IMEの専門家によるRNNによる実装の話
- 誤変換の分析のところが見所で、共起関係や品詞、トピックを扱えているように見えるところが面白い
- GitHub - yohokuno/neural_ime: Neural IME: Neural Input Method Engine
- Tucker分解の導出と実装 - でかいチーズをベーグルする
- テンソル分解の手法の1つであるTucker分解について
- メインの考え方としてはある変数以外を固定して、残っている1つの変数を潜在変数として最小二乗法で出すというもの
- EM法っぽい感じ?
- GitHub - odashi/nmtkit: Neural Network-based Statistical Machine Translation Toolkit.
- https://odashi.github.io/nmtkit/doc/test_top100.ja.html
- NMMTでビームサーチするときの探索の過程とかアライメントの結果とかが分かって面白い
- 第3回アジア翻訳ワークショップの人手評価結果の分析
- スライドの後半に違いが分かりやすい翻訳事例載っているのでオススメ
- Deep Learningによる一般物体検出アルゴリズムの紹介 - ABEJA Tech Blog
- R-CNNからSSDまで過去の手法から最近の流れがまとまっていていい感じ
- Deep Learning for Chatbots, Part 2 – Implementing a Retrieval-Based Model in Tensorflow – WildML
- Ubuntuのテクニカルサポートの対話データを使って、質問応答システムを作る。データとコードもgithubに公開されている
- Random、TFIDFくらいから始まって徐々に複雑化していっていい感じ
ビジネス
- Amazon Rekognition – 深層学習に基づいた画像分析
- Amazonが出してきた画像認識サービス
- 音声認識のプラットフォームも出してきているし、text to speechのapiも出してきている
- Apple to Start Publishing AI Research to Hasten Deep Learning - Bloomberg
- appleも研究分野参入。結構衝撃的
- バラク・オバマが伊藤穰一に語った未来への希望と懸念すべきいくつかのこと « WIRED.jp
- オバマとMITメディアラボ所長の対談。人工知能や機械学習について
学会/勉強会
Coling2016
今年は大阪で開催。
- COLING 2016
- Program - YRSNLP 2016
- NLP若手の会の国際版。Invited Talkの資料も上がっていました
- GitHub - neubig/yrsnlp-2016: Structured Neural Networks for NLP: From Idea to Code
- yrsnlp-2016/neubig16yrsnlp.pdf at master · neubig/yrsnlp-2016 · GitHub
NIPS2016
- NIPS 2016 Proceedings
- しましまのNIPS2016まとめ - Togetterまとめ
- 安定のしましまさんによるまとめ
- NIPS 2016参加報告 - Qiita
- lecun-20161205-nips-keynote.pdf - Google ドライブ
- Yann Lecun(Facebook AI Research)によるkeynote speech
- DeepMind Papers @ NIPS (Part 2) | DeepMind
- NIPS2016@バルセロナで発表されたdeepmindの論文の一覧
- Papers - Interpretable ML for Complex Systems NIPS 2016 Workshop
- Interpretableに関するワークショップ
NL研(第229回自然言語処理研究会)
- 第229回自然言語処理研究会 参加募集 | 情報処理学会 自然言語処理研究会 (NL)
- 12月21日および22日にNTT武蔵野研究開発センタで開催
- EMNLP2016およびCOLING2016の参加報告もあり
(2) [NLC] ゲーミフィケーションを利用した効率的な対話ログ収集の試み ○叶内 晨・小町 守(首都大東京)
データが集まると学習する方法はいくらでも出てきているので、データをどうやって効率よく集めていくのかというところに興味がある。
(5) [NL] 雑談対話システムの話題遷移における自然性の自動評価 ○豊嶋章宏(NAIST)・杉山弘晃(NTT)・吉野幸一郎・中村 哲(NAIST) (20) [NL] 14:30 – 15:00 単語分散表現を用いた単語アライメントによる日英機械翻訳の自動評価尺度 ○松尾潤樹・小町 守(首都大)・須藤克仁(NTT)
データ収集と合わせて解析系でないタスクの評価は今後ホットなタスクになると思ってます。
(15) [NL] 17:25 – 17:55 単語分かち書き用辞書生成システム NEologd の運用 — 文書分類を例にして — ○佐藤敏紀・橋本泰一(LINE)・奥村 学(東工大)
最近各地で使われることが多くなってきたNEologdの話もあった。
言語処理学会2017
- 言語処理学会第23回年次大会(NLP2017)
- 今年は筑波大学にて開催
チュートリアルとテーマセッション、ワークショップの内容も出ていました。
クラウドソーシング 馬場 雪乃 先生(京都大学) ニューラル機械翻訳 中澤 敏明 先生 (JST) Universal Dependencies 金山 博 先生(日本IBM東京基礎研究所) 田中 貴秋 先生(NTTコミュニケーション科学基礎研究所) 認知言語学 西村 義樹 先生(東京大学)
ニューラル機械翻訳とUniversal Dependenciesが特に気になっている。
IM飲み2016
- 入力メソッド飲み会 2016 : ATND
- im2016 · mamorlis/chaime Wiki · GitHub
- IMEに関連する色んな人が参加者にいらっしゃるので楽しそう
- IME関係者かその人からの紹介が必要らしいのでご注意を
その他
- GitHub - harvardnlp/seq2seq-attn: Sequence-to-sequence model with LSTM encoder/decoders and attention
- GitHub - Evolving-AI-Lab/synthesizing: Code for paper "Synthesizing the preferred inputs for neurons in neural networks via deep generator networks"
- キャプションからの画像生成
- NewsQA — Maluuba
- QAのデータセット。10万件以上のペアからなるらしい