PodCastleに関する講演を聞いてきた

seiji-kの未踏のPMの後藤さんという方の講演があったので聞きにいく。おそらく鹿野研と思われる人が結構いたような気がする(知り合いが皆無なので分からない...)。

podcastleは見る時間によっては落ちているかも(今は落ちてた)。産総研も地震の影響を受けて結構大変らしい。

音声寄りな話でついていけるかなぁと思っていたが、技術的な話はあまりなかった。が、研究のモチベーションや研究の見せ方という意味ですごい参考になるところが多かった。デモを含めた結果の見せ方とか話す際の言葉の選び方(もっと技術的な単語があるはずだけど、敢えて使わずにとかそういうところ?)とか研究のための研究ではなくて使ってくれる人を向いているなぁという姿勢とか。さすが未踏のPMをやられている方だと感心した。あえて何か書くとすれば「認識エンジンに認識してもらいやすいしゃべり方はどういうものかを知ってもらう」という付近はあんまり同意できなかったかな。人が技術側の制約に合わせるという付近。もちろん気持ちは分からなくはないけど、使う側が技術のことを意識しないといけないっていうのはやっぱりなんだかなぁと思う(もちろん「その前に使えるもんなんだって思ってもらわないと(ry」っていうのも理解できるんだが。理想論すぎるかしら)。

「認識誤りは全部直す」というような想定だったが、検索の用途とかを考えると

  • 間違うとやばいクリティカルな単語
    • 最近とかだと地震の被災地の地名とか。地震関係のpodcastはまさに今現在進行形でやられているらしい
  • 間違ってもそう影響はないような単語

とかがあると思った*1ので、質疑でちょっと聞いてみる。そもそも(重要だけど)間違った単語とかは間違っているがゆえに認識できないじゃない、という問題があることに質問した後に気づいたが、重要そうなsentence(よりはもうちょい広い単位。paragraphのような気もするけど、音声だと区切りがよく分からんな。。。音声での色々な単位はちょっとよく分からない)はNLPの要約とかで使われる重要文抽出とかの技術を使えばできるなぁと思ったので優先順位をあれこれ考えたような認識誤り訂正のようなことは割とやりやすいのかもしれない(と個人的に思った。認識のconfidenceはすでに使おうと思えば使えるらしいけど)。産総研はNLPの人があんまりいないらしいので、我こそはと思う人は是非(ry。

*1:あと全部を全部直す気力は自分にはないなwと思ったのもある