昔は苦手だったモブプロを今は推進する側になっていた

モブプロ

3~4年前はモブプロにめちゃくちゃ苦手意識があったんだけど、最近はなぜか(?)モブプロを推進していく旗振りをしている。モブプロの取り組み自体については今度会社のTech Blogに書く予定だけど、このエントリでは自分の心境の変化にフォーカスを当てる。人間…

#モブプログラミング

2021-06-03

ユーザー問い合わせは宝の宝庫 & データ基盤構築の魅力

ポエムデータ基盤

注意: ポエム成分多めです、自社のデータ基盤チームの話です。今日はチームの振り返り会で「ユーザー問い合わせは宝の宝庫」的な話題*1が出て、めっちゃ分かる〜となった。データ基盤チームへの問い合わせなので XXXデータセットにYYYの権限を付与してくだ…

2021-05-31

最近の砂場活動その24: Embulkでのデータ転送を差分転送にする

Embulk BigQuery

差分転送するモチベーション機械学習を使った情報推薦を行なうために、RDSのテーブルをBigQueryに定期転送しています。細かいことは気にしたくなかったので、一日一回の洗い替え(全データ送信で全部上書き)していましたが、もう少し鮮度を上げたくなりまし…

2021-05-21

最近の砂場活動その23: Cloud MonitoringでKubernetesのバッチ処理を監視する

Kubernetes

Kubernetes上で動かしているバッチ処理の監視をCloud Monitoringで行なおうと思ったのですが、素朴にやるとちょっと困りました。一工夫したので、メモを残しておきます。背景 Cloud Monitoringで素朴にバッチ監視を行なうこれだと困る...! 次のバッチが成…

2021-05-20

最近の砂場活動その22: Argo WorkflowsでGKE上の機械学習バッチのワークフローを管理する

argo Kubernetes

なぜ機械学習の典型的なワークフローはこんな感じになりがちデータの取得前処理モデルの学習新しいデータに対して予測を行なうごくまれにコケる。こけたらretryなどをして欲しいし、その辺はワークフロエンジンで面倒を見て欲しい AWS上ではAWS Step F…

2021-05-19

最近の砂場活動その21: helmを使ってKubernetesアプリケーションのデプロイを行なう

Kubernetes helm

背景 yamlを使ったマニフェストでKubernetesのデプロイの管理をずっとやっているのはしんどい繰り返し出てくる変数、環境毎(dev/stage/prod)の差分管理もっといい感じにやって欲しい helmやKustomizeなどいくつか選択肢がある業務でhelmを使うので、いい…

2021-05-18

最近の砂場活動その20: GCPのCI/CDパイプラインをCloud Buildで構築する

GCP

なぜ推薦のアプリをGKE上で動かしているが、手元からdocker imageをbuildしてpushして、deployして...とやっていたさすがにダルい... AWS関連のCI/CDはGitHub Actionsでやっているが、同じことをやっても面白くない例: 最近の砂場活動その15: CI/CDのパイ…