AWS Batchを仕事で使うことになりそうなので、Mackerelのプラグインを作りました。Queueの状態をカスタムメトリックとして収集します。mkr plugin install mackerelio/mackerel-plugin-aws-batch
でインストールしてくれ!
AWS Batchの困りどころ
全然使い込んでいるわけではないので、他にもありそうですが。AWS Batchの裏側で起動するEC2インスタンスのCPUとMemoryの組み合わせでいいものがないと、BatchがfailするわけではなくRUNNABLEという状態に行って滞留するようです。
知らないうちにQueueが溢れていると困るから監視したいなーと思ったので、プラグインを作りました。Mackerelのプラグインではないですが、同じようなことをしている先人がいらっしゃいました。
cloudwatchから直接メトリクスを取れるわけではないので、同じようにstatus毎に集計をしています。