Grund für IT-Ausfall bei British Airways gefunden

Ein Techniker hatte an der Stromversorgung gearbeitet, als eine Leitungsunterbrechung dafür sorgte, dass zunächst die Stromzufuhr und dann auch die Ersatzleitung - offenbar automatisch - abgeschaltet wurden.

Die Ursache für den Ausfall vieler wichtiger IT-Systeme bei British Airways vor gut einer Woche ist jetzt gefunden. Wie Willie Walsh, CEO der International Airlines Group, der Holding, unter der seit 2011 British Airways und Iberia agieren, jetzt gegenüber CNN dargelegt hat, hatte offenbar ein Techniker an der Stromversorgung gearbeitet hat, als eine Leitungsunterbrechung dafür sorgte, dass zunächst die Stromzufuhr und dann auch die Ersatzleitung – offenbar automatisch – abgeschaltet wurden. Die Stromversorgung sei dadurch unmittelbar und komplett unterbrochen gewesen.

Falscher Schalter: Ursache für IT-Ausfall bei British Airways aufgeklärt (Bild: silicon.de)

Der große Schreck führte bei den Zuständigen offenbar zu einer verständlichen aber falsche Reaktion: Der Strom wurde umgehend komplett wieder eingeschaltet, was zu einer Lastspitze führte, die wiederum Server, Steckdosenleisten und andere Verbindungen beschädigte. All diese Komponenten hätten danach ausgetauscht werden müssen.

Rund 75.000 Passagiere waren von dem Ausfall betroffen. Die beiden Londoner Flughäfen Heathrow und Gatwick waren nahezu lahmgelegt. Auch die Website und die Mobil-App von British Airways funktionierten nicht mehr vollständig und zudem fielen auch die Programme aus, mit denen die Mitarbeiter an den Flughäfen auf Informationen zugreifen und die zur Gepäckermittlung genutzt werden. Die meisten Betroffenen konnten daher nur unzureichend oder überhaupt nicht informiert werden.

Experten schätzen CNN zufolge die Kosten des Ausfalls auf 102 bis 138 Millionen Dollar. Eine externe Firma soll laut Walsh soll nun mit der Ursachenforschung beauftragt werden. „Das hätte nicht passieren sollen. Aber es passierte. Nun müssen wir sicherstellen, dass es nicht wieder passiert und uns davon erholen“, so Walsh gegenüber CNN.

Airbus A380 (Bild: British Airways)

Walsh besteht aber darauf, dass das BA-Management, das vom spanischen CEO Alex Cruz angeführt wird, „alles getan hat, was es unter den gegeben Umständen tun konnte“, wie Wie The Guardian bereits am Wochenende berichtete.

Das ist aber nach Ansicht mancher britischen Kunden nicht viel. Sie warteten tagelang auf ihr Gepäck – obwohl sie teilweise überhaupt nie geflogen waren. The Guardian berichtet von einem Fall, in dem ein Passagier 12 Stunden lang in Heathrow auf seinen Flug nach Schweden wartete. Nach fünf Tagen und zahlreichen Anrufen bei BA habe er dann am Donnerstagnachmittag eine SMS erhalten, dass sein Gepäck, samt Business-Notebook, am folgenden Tag in Stockholm abgeholt werden könne.

USV-Anbieters werden nicht müde, die Vorteile und die Notwendigkeit von unterbrechungsfreien Stromversorgungen und die Gefahren von Lastspitzen zu predigen. Sie verweisen alljährlich im Frühsommer auf die Gefahren durch Gewitter in der heißen Jahreszeit und können sogar „unerklärliche Programmfehler“ auf Spannungsschwankungen durch Zu- oder Abschalten großer Verbraucher im Netz zurückführen.

Das Absicherungskonzept bei British Airways scheint diesbezüglich zumindest lückenhaft gewesen zu sein, nach all dem, was man inzwischen weiß. Dabei gehört so etwas zu den grundlegenden Hausaufgaben beim Rechenzentrumsbau. Sie nicht gemacht zu haben nun mit einem menschlichen Versagen zu begründen, dass eben nie ganz ausgeschlossen werden könne, lässt durchaus den Verdacht aufkommen, dass Versäumnisse unter den Teppich gekehrt werden sollen.

[Mit Material von Peter Marwan, silion.de]

Tipp: Was haben Sie über Big Data abgespeichert? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Themenseiten: Rechenzentrum

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

3 Kommentare zu Grund für IT-Ausfall bei British Airways gefunden

Kommentar hinzufügen
  • Am 7. Juni 2017 um 9:22 von Frank Furter

    Stromspitzen beim Wiederanlauf
    Das ist der Grund, warum im vorigen Jahrhundert die erste Sofortmaßnahme bei Stromausfall war, ins Rechenzentrum (großer Raum mit vielen Rechnern und Perpherie) zu gehen und alle Sicherungen und Schalter an den Steckdosenleisten auszuschalten.
    Wenn der Strom wieder da war, wurden dann nach einem vorher festgelegtem Plan alle nach und nach wieder eingeschaltet.

    An so etwas denkt heute kein Mensch mehr, weil die IT „immer da“ ist.
    (siehe auch http://www.zdnet.de/88299509/generation-x-und-millennials-sind-stark-abhaengig-von-it-support)

  • Am 7. Juni 2017 um 9:43 von Antiappler

    Tja, kleine Ursache, große Wirkung.
    Was würde wohl erst für ein Schaden entstehen, der nicht durch solch einen blöden Zufall entstanden ist, sondern in gezielter Absicht?
    Da hat British Airways ganz offensichtlich was falsch gemacht.
    Bleibt zu hoffen, dass nicht nur British Airways daraus gelernt hat.

  • Am 7. Juni 2017 um 22:13 von C

    Nicht nachvollziehbar, die gegebenen Erläuterungen.

    Wenn der Strom aus Leitung-1 ausfällt, wird automatisch auf VOLL-Last bei Leitung-2 (anderer Provider, anderer Zugangsweg) gegangen, die dafür auch ausgelegt ist. Sie fällt nicht automatisch aus.

    Sind vereinzelte Systeme down, prüft man, ob die Redundanz-Systeme noch da sind und macht nicht i.d.R. alles blind wieder an.

    Zudem ist ein Abschalt-/Abschalt-Plan immer vorhanden…

    Strom-Spitzen und Überlast beim Einschalten deuten auf einen falschen Komponenten- & Kapazitäten Mix im Zeitablauf beim IT-Ausbau hin.

    Entgegen der publizierten Meinung ist das Management für solche Fehler Schuld und zuständig. Die einzige Option hier: feuern, für die Versäumnisse. Dafür kassieren doch diese Personen üppige Gehälter und Bonus, den sie nicht wert sind. Wir reden hier über BASIS-Dinge…nicht über unvorhergesehene Natur-Katastrophen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *