2025-01-01から1年間の記事一覧
背景: データ基盤の運用ではクエリのパフォーマンス最適化と向き合わないといけない機会が多い 課題: クエリ改善のヒント、実行情報は見るのが難しい 解決方法: 実行情報とクエリ最適化の紐付けをClaude Codeにさせる 工夫ポイント1: 実行情報をINFORMATION_…
背景: Data Vaultを運用し続けている事例の公開は多くない おさらい: Data Vaultとは何か データ分析基盤におけるData Vault Data Vault自体の解説記事 Data Vaultを使った開発 with dbt Data Vaultを運用してよかったこと データモデリングを強制される デ…
背景 & やりたいこと 前提 影響を受けているダッシュボードの一覧を出す 解説 ステップ1: 失敗したモデルをの一覧を出す ステップ2: 影響を受けているexposureの一覧を出す ステップ3: 連絡に必要なexposureの情報を付与する まとめ 背景 & やりたいこと dbt…
背景: LLM Agentと仕様書駆動開発 Kiroの対抗馬 spec-workflow-mcpでの仕様書駆動開発の体験がよかった 導入が簡単 まあまあ固く作られている 仕様のやり取りをするWebサーバーが立ち上がる 仕様書駆動開発の良さを感じられた まとめ 背景: LLM Agentと仕様…
背景 おさらい: bqコマンドで実行できること 基本のbq query: 思いのほか、多様な破壊的操作ができてしまう... その他の破壊的なオペレーション いかにClaude Codeが意図せぬクエリを実行できないようにするか 素朴だが面倒: クエリ実行を毎回Acceptする 危…
背景 Claude Codeを使っていると、色んな情報を合わせて見たくなります 例: Claude Codeの現在のトークンの利用状況(like ccusage) 例: 現在のディレクトリ 例: セッションID(他のターミナルで--resumeするときに必要) 例: 利用しているモデル 名(Opus or So…
背景 最近、本を読むときはClaude Codeなり、Geminiなり、NotebookLMを隣に置くことが多い 音声入力で話してmcp経由でesaにメモ取らせたり、質問して会話したり、などなど こういう形で勉強しているので、輪読会用の資料もLLM Agentと一緒に作りたくなった …
背景 NotebookLMは便利だが、音声解説のUIが使いにくい 自分用の音声ファイルをどこにホストするのか問題 不特定多数が聞けるPodcastとして公開したいわけでもない 解決方法 アイディア: Google Driveに音声ファイルを公開する PodcastのRSSフィードをどうや…
アウトプットするものが多すぎて、書きたくても書けてなかったやつが多くなってきた。簡単でもいいので書かないよりはマシの精神で書いていきます。 Findyに「知の巡りをよくするためのメタデータ管理」を寄稿しました Analytics Engineering領域に特化したA…
社内のデータ基盤チームのメンバー向けの勉強会で発表した内容を放流します*1。「Analytics Engineerのための」とは付いているものの、実際の勉強会には社内の様々な職種の方も参加してくれて、かつ以下のように業務にも役に立ったという声もあるので、割と…
背景 Claude CodeはCLAUDE.mdに書いていたとしても、結構忘れがちです 毎回Claude Codeに自分で指摘するのは疲れます... 条件をトリガーに何かを必ず実行させる仕組み、hookがClaude Codeにはあります フックリファレンス - Anthropic Claude CodeのHooksは…
背景 Claude Codeに日本語入力は色々ぶっ壊れてます しかし、これはClaude Codeが使っているライブラリの問題で、結構根が深いため直近で直る可能性は割と低そう ref: [BUG] IME input causes performance issues and duplicate conversion candidates · Iss…
背景: LLM Agentに意味のある小さい単位でコミットして欲しい 解決方法: git addを封印し、専用のカスタムスラッシュコマンドを生やす 参考: 試行錯誤の過程 背景: LLM Agentに意味のある小さい単位でコミットして欲しい Claude CodeなどのLLM Agentに対し「…
はじめに 開発背景 termfeedの特徴 キーバインド データ管理 MCPサーバー連携 RSS登録機能 使い方 開発手法と開発時間 音声入力による開発 開発時間 技術的な発見 TUIライブラリの利便性 TUIツールの応用可能性 プロトタイプ後の課題と改善 CommonJSからESMo…
3行まとめ はじめに Claude Codeのログ保存機能とその特徴 ログ分析の活用例 音声入力の課題と英語プロンプトの活用 DuckDBを用いた分析アプローチ スキーマ情報の重要性とログ分析の活用 ログの長期保存設定 まとめ 3行まとめ Claude Codeの会話ログはJSONL…
はじめに ビジネスメタデータをどこから入力するか ビジネスメタデータをどう入力するか レベル1: 機械的に埋められるもの(自動化層) レベル2: 変換処理で伝播できるもの(自動伝播層) レベル3: 人間の判断が必要なもの(手動層) 運用を継続するための実践的な…
背景 最近はコードの修正内容からcommit logの自動生成(github.copilot.chat.commitMessageGeneration.instructions)などが簡単にできるようになってきました 一方、レビュアーは以下のような情報が欲しくなる場合が多いです 修正の背景 なぜその実装方法を…
ランニングの続編です。前回は以下のエントリに書いてます。 10年前からのハーフマラソンの呪縛 10年前の2015/02/01に人生で初めてハーフマラソンに挑戦しました。結果は10km過ぎで膝を痛め、ゴールまで走り続けることはできませんでした。途中から足をひき…
3行まとめ アウトプットの速度を上げたいが、記事を書くのは時間がかかる SuperwhisperとVSCodeのCopilot Agentを組み合せて、音声からブログを書き上げるワークフローを組んだ 実際に使っているpromptを含め、真似しやすいように詳しく紹介 3行まとめ 背景:…
3行まとめ Apple Watchのランニングデータを半自動でスプレッドシートに集約する仕組みをChatGPTで作りました ChatGPTプラグインとGAS(Google Apps Script)連携で、データ分析や練習メニューを相談をしています Looker Studioでの可視化や、ChatGPTのDeep Re…
長いので3行まとめです。 最近、エンジニアリング経験の浅い方にアドバイスをする機会が増えてきたので、紹介時に使えるポインタをまとめました 何が合っているかは人によるので、正直正解はないと思いますが、少なくとも自分に効いたやり方をまとめています…
ランニングの続編です。前回は以下のエントリに書いてます。 2025年3月のランニングの記録 2月は人生で初めて月間100kmを走ることができました。後述するパーソナルランニング指導を今月は受けたのですが「最低月に100km、可能ならば月150km走るのが望ましい…
ランニングの続編です。前回は以下のエントリに書いてます。 2025年2月のランニングの記録 1月は仕事の出張や全日本卓球の観戦で東京に行ったり、帰省で熊本に帰るなどのイベントがありました。そのため、月に70kmの練習をなんとか稼ぐことができた形でした…
行ってきました。大分遅くなってしまった、仕事をしている場合じゃない...。 これまで卓球観戦は世界選手権@東京、Tリーグ、WTT Finalsと行ってましたが、全日本は初めてでした。日本の頂点を決めるに相応しい大会でした。ランク決定戦から決勝戦まで、二泊…
あまりよくある話ではないと思うんですが、アナリスト/Analytics Engineerの人にバッチ処理を書いてもらう機会がありました。基本的にはSQLを普段書かれていて*1、場合によってはTerraformを少し書くこともあるというバックグラウンドの方です。これに対して…
ランニングの続編です。 2025年1月のランニングの記録 1月は仕事の出張や全日本卓球で東京に二回行ったり、帰省で熊本に帰るなどのイベントがあることは事前に予想していたので、12月のように練習時間は取れないかもな...と思っていました。加えて、途中で風…
3行まとめ データエンジニアの界隈で日本からもっとOSSに貢献する人が増えるといいなと思ったので、自分が気を付けていることを事例多めでまとめました データエンジニアの界隈以外でも通じる内容が多いですが、データエンジニアリング文脈多めです 偉そうに…
過去のランニング歴 ランニングを復活するための準備 ストレッチで体の柔軟性を持たせる 正しい走り方を学ぶ ランニング結果の変遷 大会に出てみよう ハーフマランへのリベンジ おまけ: ランニング用で買ったもの 必須アイテム あると便利なもの 過去のラン…