ANPI_NLPと普通の日記

ANPI_NLP

labのSNSにも書いたし、Twitterでも大分情報が流れているのでここを見ている人の大部分は知っていると思うけど、ANPI_NLPについて。東日本大震災が起きて、NLPの研究者やエンジニアにできることがあるのではないかということでANPI_NLPという活動が始まっている。

現在、東北関東大震災に関して様々なところで種々の情報が飛び交っています。その中でも、特に被災された方々の安否情報は最も重要な情報であり、できるだけ正確な情報を大量に整理する必要があります。しかしながら実際は情報は大量でかつ様々なところに分散して存在しているために探しにくいだけでなく、情報を提供する側と情報を必要とする側で適切に必要な情報を共有できていないと考えられます(例えば、どちらかが人の名前を1文字間違える、平仮名と漢字との違い、ある人の安全が確認されるとその情報は電子的に残されにくい、など)。
我々は日々言語処理を専門とした研究者、技術者であり、こうした情報の解析、集約、マッチング(名寄せなど)などにも従事しています。今回、Twitterやブログ、Mixiなど、多くのCGMから個々に述べられている人の安否情報に注目し、Google社の"Google Person Finder"上のデータと照合しながら、最新の安否情報をできるだけ整理するというのが目的です。特に、安全を確認された方の情報がこうしたポータルに最終的に登録されないことが多いことから、こうした情報を共有できるように多くの情報源から分析する必要があります。
これらの活動は営利目的ではありません。このサイトも、"みんなの翻訳"の方のご好意で立ち上げていただいています。 我々は技術者として今この時点でできることを行う、必要な言語資源を協力して重複なく構築することが目的であり、それを達成することを目標にしています。
多くの言語処理技術者の方々が参画してくれればと願っています。 よろしくお願いいたします。 2011/03/15

メインページ - ANPI_NLP

Tweetに人名や場所、安否の情報かどうかetcなどをタグ付ける作業*1は一段落して、これからこの資源を活かしてもっと高レイヤーで役に立つ物を作っていこうという段階。NLP屋さんのみならず機械学習さんの力が生きてくるところだと思うので参画していただければ。

就職活動

地震の影響を受けて就活もかなり変則的になってきている。先週面接で東京に行っていたがその時はまさかこんなことになるとは予想もできなかった。ある会社からは面接の日程を2-3ヶ月遅らすという連絡もきた(もちろんこんな状況だから仕方ないことだとは思う)。よくも悪くも4月終わりくらいからは研究活動を普通に再開できるかと思っていたんだが、なかなかそうも行かないようだ...。就職氷河期etcで大変な時期にはなるだろうなと思っていたけど、思っていたよりさらに大変になりそうだ。

*1:昨日自分もタグ付け作業に参加した。600件くらいではあったが、結構時間かかるしなかなか大変であることを痛感