これまでインフラに関わる業務がメインでしたが、サービスの拡大、開発人員の増加に伴い、これまでにうまくいっていたことが、いかなくなることが発生しています。
例えば、リリース数が増えるため、リリースの順番待ちや、リリースした際にエラーが発生する回数が増えるなど。
このような問題に対処するため、SREチームでは以下のことを業務として行っています。
このため、やることは多岐にわたりますが自動化を優先しているため、定期作業が増えることがなく、新しい取り組みへ従事することができています。
また以下のように、具体的に目標を決め、現在足りてない箇所に優先して作業を行えるようにしています。
基本インフラはAWSのサービスで構成しています
ECSを使った一般的な構成になっています。
AWS, CGP, Terraform, GitHub Actions, CircleCI, Datadog, TypeScript, Pythonなど