The Self-Service Data Roadmap読書会でContinuous Integration Serviceについて発表しました

データマネジメントに対する知識を深めたり、データの利活用をより進められるようになりたいなと思って、読書会をやっています。始めてから二ヶ月くらいで、そろそろ本の終わりが見えてきました。

Chapter 13のContinuous Integration Serviceで発表の順番が回ってきたので、発表しました。

(特に機械学習の)CIのパイプラインに関する内容のパートで、現職はデータマネジメントをやっていることもあり、この領域からはしばらく離れています。が、前職ではこの辺の設計や運用を結構がっつりやっていたので振り返ってみましたが、この本に書いてある内容はそれなりにちゃんと意識 & 実行できていたなと思いました。

...というか、機械学習の本番運用はただでさえ難しいので、この辺の整備なしには怖くて運用できないという面が多々あり「できたらいいね」というよりは「ないとまずい」のラインにあるかなと思います。

  • MLOpsって単語も広まってきてる
    • 昔はどういうことに注意しないといけないか、ノウハウもあまりない状況だったが、最近はこういう本で勉強できる
  • マネージドサービスの登場で多少昔よりは楽をできる
    • MLflowなど洗練されたOSSも出てきてる

ということで、モデルを洗練させるのと同じくらいの感度でこの辺も当たり前にやっていきたいですね。