Microsoft hat in einem Blog-Posting den mehrstündigen Ausfall seiner Cloud-Computing-Plattform Windows Azure am 13. März erklärt. Während eines routinemäßigen Updates des Betriebssystems sei es aufgrund von Netzwerkproblemen zu einer Verlangsamung des Vorgangs gekommen. Dies habe dann bei vielen Servern einen Timeout und schließlich deren Ausfall verursacht.
Der Fabric Controller (für die Verteilung von Anwendungen auf den Servern zuständig) habe dann versucht, die betroffenen Applikationen auf anderen Servern wiederherzustellen. Da dieser Prozess lange dauert, habe sich das Azure-Team entschlossen, parallel Updates des Systems durchzuführen. Schließlich seien alle Anwendungen erfolgreich wiederhergestellt worden.
Von dem Problem seien hauptsächlich Programme mit einer Instanz betroffen gewesen. Laut Microsoft gab es bei Anwendungen mit mehreren Instanzen kaum Ausfälle.
Damit sich ein solcher Ausfall nicht wiederholt, sollen die Probleme im Netzwerk beseitigt und die Algorithmen des Recovery-Prozesses überarbeitet werden. Der Softwarehersteller empfiehlt, eine Rolle mit mindestens zwei Instanzen laufen zu lassen. Man werde die Templates und den Beispielcode entsprechend ändern.
Microsoft hat seine Cloud-Computing-Plattform Windows Azure letzten Oktober auf der Professional Developers Conference eingeführt. Noch handelt es sich um eine Community Technology Preview, die keine Uptimes garantiert. Ende des Jahres soll der Dienst in den Regelbetrieb überführt werden. Derzeit läuft beispielsweise Live Mesh auf Windows Azore.
Windows Azure (Bild: Microsoft) |
Neueste Kommentare
Noch keine Kommentare zu Microsoft erklärt Ausfall von Windows Azure
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.