AWS Batchのメトリックを収集するMackerelプラグインを作りました

AWS Batchを仕事で使うことになりそうなので、Mackerelのプラグインを作りました。Queueの状態をカスタムメトリックとして収集します。mkr plugin install mackerelio/mackerel-plugin-aws-batchでインストールしてくれ!

AWS Batchの困りどころ

全然使い込んでいるわけではないので、他にもありそうですが。AWS Batchの裏側で起動するEC2インスタンスのCPUとMemoryの組み合わせでいいものがないと、BatchがfailするわけではなくRUNNABLEという状態に行って滞留するようです。

知らないうちにQueueが溢れていると困るから監視したいなーと思ったので、プラグインを作りました。Mackerelのプラグインではないですが、同じようなことをしている先人がいらっしゃいました。

cloudwatchから直接メトリクスを取れるわけではないので、同じようにstatus毎に集計をしています。