Googles Technologien: Von Zauberei kaum zu unterscheiden

Der Betrieb Tausender preiswerter Server mit relativ hohen Ausfallquoten ist keine einfache Aufgabe. Die üblichen Tools funktionieren in einem solchen Umfang nicht, weswegen Google diese intern entwickeln musste. Weitere Herausforderungen, die sich dem Unternehmen stellen, sind unter anderem:

Debugging: „Wegen besonderen Umständen, die zu Programmfehlern führen, sieht man in der tatsächlichen Anwendung mitunter Dinge, die man in den Testläufen niemals zu Gesicht bekam“, sagte Hölzle. „Das kann zu nicht immer einfach lösbaren, aber dennoch interessanten Problemen führen.“

Datenfehler: Eine normale IDE-Festplatte hat wohl eine Fehlerquote zwischen 1 in 10-10 und 1 in 10-15 Bits – das heißt, dass ein Millionstel eines Milliardstels der darauf geschriebenen Daten beschädigt werden könnte, ohne dass dies durch die Fehlerprüfung der Festplatte entdeckt würde. „Wenn man aber ein Petabyte von Daten hat, muss man sich langsam über diese Ausfälle Gedanken machen“, sagte Hölzle. „Man muss einfach davon ausgehen, dass mehrere Male im Monat unentdeckte Bitfehler auf der Platte vorhanden sein werden, trotz integrierter Hardwareprüfung. Deshalb geht die Prüfsummenermittlung bei GFS noch einen Schritt weiter. Auch das ist ein Umstand, mit dem wir nicht gerechnet hatten, aber solche Sachen passieren eben.“

Rechtschreibung: Google schrieb sein eigenes Rechtschreibprüfungstool und beharrt darauf, dass niemand mehr Rechtschreibfehler erkennt. Durch die im Unternehmen verfügbare Rechenleistung kann es sich leisten, dem System aufeinander bezogene Wörter beizubringen – zum Beispiel „Imperial“, „College“ und „London“. Eine einzelne CPU benötigt Jahre für diese Aufgabe, die ohne die vielen Tausend Rechner nicht zu bewältigen gewesen wäre. „Wenn man Tonnen von Daten und Tonnen von Rechenleistung hat, kann man Dinge realisieren, die auf kleineren System eben nicht funktionieren“, so Hölzle. Eines der Ziele des Unternehmens sei nun, ein besseres begriffliches Textverständnis zu entwickeln, um von einer Textfolge auf einem Begriff schließen zu können.

Energiedichte: „Beim Einsatz von PCs stellt sich ein interessantes Problem“, sagte Hölzle. „Geht man zu einem gewerblichen Rechenzentrum und schaut, was es unterstützen kann, findet man eine typische Auslegung, die pro Quadratmeter 150W bis 300W berücksichtigt. Bei 600W pro Quadratmeter sieht man, dass der Verkäufer zwar noch immer am Verkauf interessiert ist, aber der Techniker langsam in Schweiß ausbricht. Bei 900W pro Quadratmeter haben dann beide die Schmerzgrenze erreicht.“

Achtzig mittelgroße PCs in einem Rack, von denen viele Dutzend in einem Google-Rechenzentrum zu finden sind, produzieren pro Quadratmeter über 1500W. „Aus diesem Grund wechseln wir nicht zur Blade-Technologie“, so Hölzle. „Wir sitzen schon jetzt zu dicht aufeinander. Intel hat endlich erkannt, dass das ein Problem ist, und konzentriert sich nun mehr auf die Energiedichte. Es dauerte aber eine Weile, bis wir das verständlich machen konnten.“

Qualität der Suchergebnisse: Ein Großteil der Beschwerden über Google ist mit der wachsenden Präsenz gewerblicher Suchergebnisse, insbesondere von Preisvergleichsmaschinen und E-Commerce-Sites, verbunden. Hölzle verteidigt Googles Performance prompt „in jeder Hinsicht“, räumt jedoch ein, dass es ein Problem gibt, weil das Web, wie er es ausdrückt, „kommerzieller“ wird. Noch vor drei Jahren sei das Web viel ursprünglicher gewesen. „Wir haben schon an einen Button gedacht mit der Aufschrift: ‚Ich will weniger gewerbliche Ergebnisse'“, doch habe sich das Unternehmen bislang gescheut, diesen zu implementieren.

Themenseiten: IT-Business, Strategien

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

ZDNet für mobile Geräte
ZDNet-App für Android herunterladen ZDNet-App für iOS

Artikel empfehlen:

Neueste Kommentare 

1 Kommentar zu Googles Technologien: Von Zauberei kaum zu unterscheiden

Kommentar hinzufügen
  • Am 5. Februar 2005 um 10:27 von Adminator

    Örks.
    Habe fertig. Dazu fällt mir nichts mehr ein.

    Petabyte, Google File System, 1k-Abfragen pro Sekunde, 60.000 PC’s…

    …….>
    Endlich ist es soweit: Die netten vollbärtigen Physiker, die Frauenversteher, die Geeks und die Nerds übernehmen in Kürze die Weltherrschaft. @Hölzle und Co: Bitte bleibt sauber und lasst euch nicht von den Bush’s und $$$’s und all‘ den anderen Anfechtungen vom rechten Weg abbringen!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *