生存してます。最近色々インプットしまくることに時間を取ってる結果、アウトプットが死んでいました。記憶がまだあるうちにまとめて書いておきます。
MLCTで登壇しました
前回も登壇させてもらっていたMLCTのパネリストとして登壇させてもらいました。お声がけいただいた@hurutoriyaさんに感謝。
テーマは「アンチパターン」。SNS共有厳禁なので詳しくは書けないですが、大雑把にはこんな感じでした*1。
- 5年前はあまり当たり前でなかった機械学習の運用知見、少しずつ業界でノウハウが溜まってきている
- 特に打ち合わせしてたわけではないですが、こういう感じでやっています、というのが各社結構似ていた
- 機械学習単独の話題、というよりソフトウェアエンジニアリングを当たり前にやっていく
Mackerel Drink Up #9 Tokyoで登壇しました
Mackerelのdrinkupで最近の機能リリース3本のうちの一つということで7月末に正式リリースをしたロール内異常検知についてお話しさせて頂きました。スライドの内容としては新しい内容は特にないですが、自分がメインで作った機能がこうして世の中に出て、ユーザーさんに使ってもらってフィールドバックをもらって、という場があるのはありがたいですね。
もちろん、これまでも機能開発自体には携わってきていたわけですが、プロトタイプから大体担当していたものだけあって思い入れが結構大きいのかなと思います。OSSやSaaSで異常検知エンジンはぼちぼち出てき始めている中で、以下のようなことを考えながら作っていました。
- Mackerelの特徴をどう生かして機能をデザインするか
- ロール内異常検知単体で存在するわけではない。Mackerelというサービスの中でどういう問題を解決するものなのか、既存の機能とどう補完し合うものなのか
- 機械学習で全ての問題を解決しようとしない
- アラートや障害対応する人との関わり方。人間をどうサポートするか
- ロール内異常検知単体で存在するわけではない。Mackerelというサービスの中でどういう問題を解決するものなのか、既存の機能とどう補完し合うものなのか
- MLOps的な観点、メンテナンス性、コスト
- 詳しい内容はMachine Learning Casual Talks #10の発表内容を参照してください
首都大で非常勤講師を担当しました
学生時代からお世話になっている首都大の小町さんからお声がけいただいて、非常勤講師として講義を担当させてもらいました。一人一日 * 4日のうちの一人として担当しましたが、他の講師の方(Amazon 荒木さん @ar1 / クックパッド伊藤さん @takahi_i / PFN 小嵜さん @smly)が豪華だったのでこれはヤバイな...と思いながら頑張って資料を作っていました。
大学での講義(しかも実習)自体が初めてだったため、どれくらいうまくできたかは謎だったのですが、感想をパラパラ読ませてもらった限りではなかなか好評だったようでよかったです。とはいえ、学生さんの色んな手元環境を想定しきれていなくて本質的でないところに時間を割かせてしまったりした箇所もあったので、また機会があれば資料もブラッシュアップしていきたいなと思います。
データ基盤構築活動をやってます
今期(8月)からチーム内のデータ基盤構築をやり始めました。データ基盤、いつか関わってみたいと思ってはいたものの知識は特にない初心者でした。あれこれ勉強すべく、都内での出張タイミングで色んな勉強会に顔を出させてもらったり、社外の人や社内の経験のある人にひたすら知見を聞くということをやってました。例えばここ。
技術的なことはもちろん、データ基盤をどうやって使ってもらうかが不安だったため、どういった工夫をされているか着手前に聞けたのはとても役に立ちました。ある程度運用が上手くいき始めたらこれもどこかで発表したいですね。異常検知と違ってデータ基盤は各社やっていると思うので、目新しさはあまりないかもしれませんが...。
- チームKPIを出すための業務フロー可視化 / フロー整備
- スクリプト化 / 自動化
- 何を出すべきか、その意図は何かチーム内関係者にひたすらヒアリング
- 東京オフィスにいる人が多かったので、結構出張しまくってた
- データ分析と相性のよいカスタマーサクセス分野について勉強
- カスタマーサクセスとは何か――日本企業にこそ必要な「これからの顧客との付き合い方」
- 理解を深める上で、チーム内でCRE主導の読書会があったのもタイミングがよかった
- BigQueryを中心にデータ基盤構築を考えていたため、Embulk / Digdagを使ってデータ転送
- 最初は手動、ECSタスクとして後で自動化した
- ビッグデータを支える技術―刻々とデータが脈打つ自動化の世界 が結構よかった
- BigQueryにデータが入り始めた段階で、Data Studioを使ってプロトタイプ的なダッシュボードをいくつか作った
- 「みんなこれを見ようぜ」という完成系を一気に作る、というよりはBigQuery経由するとこういうことできますよ、というのをチームメンバーに少しでも思ってもらえれば、という意識が強い
- BigQueryだけ用意しても何ができるか分からんと思うので、各職種の人に響きそうかなと思うダッシュボードのプロトタイプをがっと作った
- 作り込み自体は必要な人がやれるように、後述しているようなサポートを意識
- Data Studioは細かいところでは微妙(ヒストグラム書けないとか)だと思いつつ、初手で運用の手間のかかるものを増やしたくなかったので採用
- 「みんなこれを見ようぜ」という完成系を一気に作る、というよりはBigQuery経由するとこういうことできますよ、というのをチームメンバーに少しでも思ってもらえれば、という意識が強い
- CREがやりたいと思っている分析をスムーズにやれるようにしたかったので、Mackerelを題材にしたSQL100本ノックを作る
- いきなり書けるようになるものではないと思うので、hangout越し/出張時にペアプロ
- どういう思考回路でそのSQLに行き着くかといったことを解説
- リブセンスさんの事例を参考にさせてもらいました
- 社内の他チームでもデータ分析をやり始めたチームがあった && 結構同じようなことをやっている / 困っていたので、社内勉強会を開始
- 参加者の半分近くがエンジニア以外の職種の方。エンジニアのみでやっていても仕方ない領域なので、ありがたい...
- これも数回回してみたらどこかにアウトプットしたい
やっていきます。
*1:このくらいの粒度での共有はOKと確認いただいてます