外部登壇は半年に一回くらいが丁度いいと思ってる人間ですが、最近は色々重なって怒涛のアウトプット月間になってしまったので、やったことをまとめてみます。
- Dataplexとdbt-osmosisを活用した「がんばらない」データカタログとメタデータ管理の運用@Data Engineering Study #22
- Elementaryを用いたデータ品質の可視化とデータ基盤の運用改善@Tokyo dbt Meetup #8
- エンジニアに至る/エンジニアになってからの様々なキャリアパス@SIAI 産学クロススクエア「ミライをつくるAI人材」
- データマネジメントを支える武器としてのメタデータ管理@datatech-jp
- データカタログ特集 データ利活用に向けたアーキテクチャ6選@Findy Tools
- データマネジメント成熟度アセスメントの実施@10X Product Blog
- 所感: アウトプットはいいぞ
Dataplexとdbt-osmosisを活用した「がんばらない」データカタログとメタデータ管理の運用@Data Engineering Study #22
データエンジニア界隈で有名な勉強会のData Engineering Studyさんからお声がけいただいたので、登壇しました。最初は「データ関連のTerraformの内容はどうですか?」と依頼されていたのですが、自分の熱量的にはdbt-osmosisのほうが高かったし、組織課題としても紹介しやすかったのでカタログやメタデータ関連の内容で話させてもらいました。
Elementaryを用いたデータ品質の可視化とデータ基盤の運用改善@Tokyo dbt Meetup #8
同僚のtakimoさんがやっているTokyo dbt Meetupで発表しました。いつも聞いてる側だったので、ようやく発表者側にも回れたのは嬉しかったですね。
データ品質の可視化について自組織の取り組みの具体例を紹介しつつ、dbtコミュニティの発表でもあったし、elementaryの技術的内容にもがっつり踏み込んで発表できたので、自分としても大分満足でした。発表後、elementaryを触り始めた人をちらほら見かけるので、聴講されていた人にも得るものがある発表できたんじゃないかなと思います。
10Xではelementaryをゴリゴリ使い倒しているだけあって、elementaryのアップデート時に苦しんだりしたのですが、業務委託でお世話になっているジャンさんにその辺の取り組みをProduct Blogにアウトプットしてもらえたのもすごくよかったな〜と思ってます。
エンジニアに至る/エンジニアになってからの様々なキャリアパス@SIAI 産学クロススクエア「ミライをつくるAI人材」
同世代でNTT CS研時代の同僚の@koh_tさんからお声がけしてもらって、パネルディスカッションで話してきました。
学部生の方を中心に50名くらい参加してくださっていたようでした。
今日は関西大学 梅田キャンパスでお話しさせていただきます!!女子学生も多くてびっくりしてる!!登壇5分前でギリ間に合った!! pic.twitter.com/w55bcN9LmW
— だむは@bgrass inc. (@damuha_) 2024年3月22日
登壇しました!仲良くなった!!(と勝手に思っている) pic.twitter.com/Imu9bxk7D3
— だむは@bgrass inc. (@damuha_) 2024年3月22日
正直、普段はキャリアパスなんで全然考えてないし、5~10年後先なんて見通せてたら宝くじ買うわって思ってるし、その時に自分が面白いって思えることに関われてたら何でもいいやって思って生きているので、登壇者として適切だったかは自分ではよく分からないところはあります。とはいえ、研究者から開発や分析など職種的にも色々移ったところがあるし、その際に何を考えていたか、どういった経験が自分の血肉となっているかなどを中心にお話させてもらいました。
データマネジメントを支える武器としてのメタデータ管理@datatech-jp
自分はdatatech-jpの運営であるものの最近イベント企画の主催などは全然できていなかったのですが、slackで@akuwanoさんがメタデータ管理のイベントを主催してくださり、せっかくなので自分も発表させてもらいました。メタデータというニッチなテーマだったのに、300人以上がオンラインに集まって聞いてもらえててすごかったですね。
「メタデータはデータの中でも大好きだし、何時間でも話せるぞ!」という人間だったので、登壇者側ですがめっちゃ楽しかったです。イベントではベンダー側の方も発表されていたので、事業会社側の自分は思いっきり具体事例をこれでもかと話すようにしてみたのですが、バランス的にもよかった気がしています。参加レポートもいくつか上がっており、それなりに参考になる話ができたかなと思います。
データカタログ特集 データ利活用に向けたアーキテクチャ6選@Findy Tools
Data Engineering Study #22での登壇を見てもらったみたいで、Findyさんからお声がけしてもらって寄稿しました。
記事内では10Xだけアーキテクチャ図が実はなかったりするのですが、BigQueryでデータ運用していれば意識しなくてもDataplexが勝手にいい感じにやってくれるくらい手間がかからず、面倒なアーキテクチャを考える必要もないよ!というのが推しポイントです。
データマネジメント成熟度アセスメントの実施@10X Product Blog
自分が10Xに入社してから約一年半が経過したのですが、一年半でデータ周りは結構よくなってきました。今後社内で取り組むべき領域や方向性をクリアにすべく、チーム内で成熟度アセスメントを行なったのでその内容をまとめて出しました。
はてなでデータエンジニア的な仕事をして働いていたときにもDMBOKを読んではいたものの、割と抽象的なことが書かれていて「これを日々の業務にどう生かせばいいんだ...?」というのがピンときていませんでした。その頃の自分を思い出しながら「こういうエントリがあったら生かし方が想像しやすくなるかな?」と思いながら、これでもかと具体例を入れて書いてみたので、DMBOKを手に取ったものの次の一手をどうすればいいか迷ってしまった方に響くといいなと思っています。
所感: アウトプットはいいぞ
特に3月末は登壇が重なっていて、終わってみると結構疲れました。最近の学びは外にアウトプットし尽くして干涸びた感じになっているので、半年くらいはもう登壇はいいかなという気持ちになってますw。とはいえ、日々の学びは小まめにアウトプットしていきたいですね。
登壇の資料を作っていると自分の頭の中も整理や言語化が進んで、新しい発見があったりするのはいいですよね。「これってアクティブメタデータってやつやん!」って後から気付いたのはまさにこういう感じでした https://t.co/6BswgoXCDq
— Yasuhisa Yoshida (@syou6162) 2024年3月28日