てぃーだブログ › ジャーナリストになりたいなぁ › Amazon Web Services

2011年04月30日

Amazon Web Services

米Amazon Web Services(AWS)は4月29日(現地時間)、21日に発生したElastic Compute Cloud(EC2)など複数サービスにわたる大規模障害について正式に謝罪し、経緯を説明した。
この障害は、米太平洋時間の4月21日午前12時47分に同社の北バージニアにあるデータセンターで発生し、修復がほぼ終わったのは24日の午後だった。同サービスを利用している米HootSuite、米foursquareをはじめとする多数の顧客のサービスが長時間にわたってダウンし、29日現在、まだダウンしたままのサービスもある。
発端は、北バージニアのデータセンターのあるAvailability Zoneでネットワーク容量をアップグレードしようとした際、Elastic Block Storage(EBS、EC2のストレージバックアップオプション)のトラフィックを誤ってキャパシティーの低いバックアップ用のEBSネットワークにルーティングしたことにある。このため多数のEBSがバックアップできなくなって再ミラーリングを繰り返し、Availability Zone全体をダウンさせた。Availability Zoneは互いに独立しているが、管理システムが独立しておらず、リクエストが殺到した際にほかのゾーンにも影響が及んで障害を大きくした。

 現在はサービスは復旧しているが、影響を受けたAvailability Zoneの0.07%のEBSがリストアできなかった。
同社は約5700語に上る長文の発表文でトラブルの原因、経緯、今後の対策について詳細に説明し、「最後になりましたが、謝罪します。私たちのサービスがお客さまのビジネスにとっていかに重要であるかを私たちは理解しています。今回の出来事から学べることをすべて吸収し、今後のサービスに反映させます」と謝罪した。

 AWSは、影響を受けたAvailability Zoneを利用している全顧客に対し、10日分のサービスクレジットを提供する。
(エンタープライズ)

Availability Zone利用者すべてに提供される、サービスクレジット
どうやらサービスが長時間の間ダウンしていたようです。
このクレジットは次回の請求時に反映されるようです。
サービス期間は10日間。



Posted by mkt at 18:56