t_wの輪郭

Feedlyでフォローするボタン
SRE
システムのアップデートにはN+2の冗長性が必要N+2の冗長性可用性が低いシステムは利用者の信頼を失うシステムの信頼性は平均故障時間と平均修復時間の関数平均修復時間平均故障時間あれ縮退運転開発チームは新機能のローンチのためにエラーバジェットを使いたがるエラーバジェット大規模な縮退運転「単純性という品質は、一旦失われると取り戻すことが極めて難しい」リリースエンジニアリングキャパシティは高価キャパシティプランニング運用中のシステムの変更効果的なモニタリングの出力メールによるシステム障害アラートは効果的ではない不運の輪プロビジョニング
アラート
人間が即座に対応する必要がある
チケット
人間がそのうち対応する必要がある
ロギング
記録
何もなければ読む必要はない