Categories: Cloud

Microsoft begründet mehrstündigen Azure-Ausfall mit fehlerhaftem Update

Microsoft hat in einem Blogeintrag zur jüngsten Störung seines Cloud-Diensts Windows Azure Stellung genommen. Demnach war ein Performance-Update für die Azure Storage Services dafür verantwortlich, dass der Dienst Anfang der Woche für viele Kunden fast elf Stunden lang nicht erreichbar war.

Die Störung begann laut Jason Zander, Corporate Vice President für Windows Azure, am Dienstagabend. Betroffen waren neben Kunden in den USA auch Europa und Teile Asiens. Auch der Zugang zu Xbox Live, MSN.com, Visual Studio Online und Search war demnach beeinträchtigt, weil zumindest Teile dieser Dienste auf Azure angewiesen seien.

Darüber hinaus bestätige Zander Beschwerden vieler Nutzer, wonach die Status-Site fälschlicherweise während der Störung meldete, Azure arbeite normal. Grund dafür sei, dass auch das Service Health Dashboard und das Azure Management Portal auf den Azure Storage Services aufbauten und deswegen nicht in der Lage waren, den korrekten Status der Azure-Dienste wiederzugeben.

Das Performance-Update selbst hat Microsoft nach eigenen Angaben vor der Veröffentlichung über einen Zeitraum von mehreren Wochen mit Nutzern des Azure Tables-Storage-Services getestet. Das eigentliche Problem, dass das Storage Blob Front End in eine Endlosschleife eintrat, habe man allerdings erst nach dem Einspielen des Performance-Updates bemerkt.

„Das Ergebnis war, dass das Front End keinen weiteren Traffic aufnehmen konnte, was wiederum zu den Problemen mit anderen Diensten führte, die darauf aufbauen“, sagte Zander.

Microsoft habe nach der Entdeckung des Fehlers das Update wieder zurückgezogen. Dafür sei es allerdings notwendig gewesen, das Storage Front End neu zu starten, so der Manager weiter. Der Ausfall habe so viele Nutzer betroffen, da das Update entgegen den Standardprotokollen, die eine schrittweise Einführung vorsehen, in kurzer Zeit in viele Regionen installiert worden sei.

Um künftig ähnliche Probleme zu verhindern, will Microsoft nun sicherstellen, dass die Tools zur Installation von Updates die Durchsetzung der Standardprotokolle erzwingen. Auch die Verfahren zur Wiederherstellung von Diensten sollen verbessert werden, um die für einen Neustart benötigte Zeit zu reduzieren. Die Infrastruktur des Service Health Dashboard und der zugehörigen Protokolle soll ebenfalls überarbeitet werden, damit sie künftig trotz einer Störung von Azure korrekte Informationen liefern können. Darüber hinaus arbeitet Microsoft an einem Fix für den Fehler in seinem Performance-Update.

[mit Material von Mary Jo Foley, ZDNet.com]

Tipp: Sind Sie ein Fachmann in Sachen Cloud Computing? Testen Sie Ihr Wissen – mit dem Quiz auf silicon.de.

Stefan Beiersmann

Stefan unterstützt seit 2006 als Freier Mitarbeiter die ZDNet-Redaktion. Wenn andere noch schlafen, sichtet er bereits die Nachrichtenlage, sodass die ersten News des Tages meistens von ihm stammen.

Recent Posts

Neue Backdoor: Bedrohung durch Malvertising-Kampagne mit MadMxShell

Bisher unbekannter Bedrohungsakteur versucht über gefälschte IP Scanner Software-Domänen Zugriff auf IT-Umgebungen zu erlangen.

1 Tag ago

BSI-Studie: Wie KI die Bedrohungslandschaft verändert

Der Bericht zeigt bereits nutzbare Angriffsanwendungen und bewertet die Risiken, die davon ausgehen.

2 Tagen ago

KI-Wandel: Welche Berufe sich am stärksten verändern

Deutsche sehen Finanzwesen und IT im Zentrum der KI-Transformation. Justiz und Militär hingegen werden deutlich…

2 Tagen ago

Wie ein Unternehmen, das Sie noch nicht kennen, eine Revolution in der Cloud-Speicherung anführt

Cubbit ist das weltweit erste Unternehmen, das Cloud-Objektspeicher anbietet. Es wurde 2016 gegründet und bedient…

2 Tagen ago

Dirty Stream: Microsoft entdeckt neuartige Angriffe auf Android-Apps

Unbefugte können Schadcode einschleusen und ausführen. Auslöser ist eine fehlerhafte Implementierung einer Android-Funktion.

2 Tagen ago

Apple meldet Umsatz- und Gewinnrückgang im zweiten Fiskalquartal

iPhones und iPads belasten das Ergebnis. Außerdem schwächelt Apple im gesamten asiatischen Raum inklusive China…

2 Tagen ago