Der Betrieb Tausender preiswerter Server mit relativ hohen Ausfallquoten ist keine einfache Aufgabe. Die üblichen Tools funktionieren in einem solchen Umfang nicht, weswegen Google diese intern entwickeln musste. Weitere Herausforderungen, die sich dem Unternehmen stellen, sind unter anderem:
Debugging: „Wegen besonderen Umständen, die zu Programmfehlern führen, sieht man in der tatsächlichen Anwendung mitunter Dinge, die man in den Testläufen niemals zu Gesicht bekam“, sagte Hölzle. „Das kann zu nicht immer einfach lösbaren, aber dennoch interessanten Problemen führen.“
Datenfehler: Eine normale IDE-Festplatte hat wohl eine Fehlerquote zwischen 1 in 10-10 und 1 in 10-15 Bits – das heißt, dass ein Millionstel eines Milliardstels der darauf geschriebenen Daten beschädigt werden könnte, ohne dass dies durch die Fehlerprüfung der Festplatte entdeckt würde. „Wenn man aber ein Petabyte von Daten hat, muss man sich langsam über diese Ausfälle Gedanken machen“, sagte Hölzle. „Man muss einfach davon ausgehen, dass mehrere Male im Monat unentdeckte Bitfehler auf der Platte vorhanden sein werden, trotz integrierter Hardwareprüfung. Deshalb geht die Prüfsummenermittlung bei GFS noch einen Schritt weiter. Auch das ist ein Umstand, mit dem wir nicht gerechnet hatten, aber solche Sachen passieren eben.“
Rechtschreibung: Google schrieb sein eigenes Rechtschreibprüfungstool und beharrt darauf, dass niemand mehr Rechtschreibfehler erkennt. Durch die im Unternehmen verfügbare Rechenleistung kann es sich leisten, dem System aufeinander bezogene Wörter beizubringen – zum Beispiel „Imperial“, „College“ und „London“. Eine einzelne CPU benötigt Jahre für diese Aufgabe, die ohne die vielen Tausend Rechner nicht zu bewältigen gewesen wäre. „Wenn man Tonnen von Daten und Tonnen von Rechenleistung hat, kann man Dinge realisieren, die auf kleineren System eben nicht funktionieren“, so Hölzle. Eines der Ziele des Unternehmens sei nun, ein besseres begriffliches Textverständnis zu entwickeln, um von einer Textfolge auf einem Begriff schließen zu können.
Energiedichte: „Beim Einsatz von PCs stellt sich ein interessantes Problem“, sagte Hölzle. „Geht man zu einem gewerblichen Rechenzentrum und schaut, was es unterstützen kann, findet man eine typische Auslegung, die pro Quadratmeter 150W bis 300W berücksichtigt. Bei 600W pro Quadratmeter sieht man, dass der Verkäufer zwar noch immer am Verkauf interessiert ist, aber der Techniker langsam in Schweiß ausbricht. Bei 900W pro Quadratmeter haben dann beide die Schmerzgrenze erreicht.“
Achtzig mittelgroße PCs in einem Rack, von denen viele Dutzend in einem Google-Rechenzentrum zu finden sind, produzieren pro Quadratmeter über 1500W. „Aus diesem Grund wechseln wir nicht zur Blade-Technologie“, so Hölzle. „Wir sitzen schon jetzt zu dicht aufeinander. Intel hat endlich erkannt, dass das ein Problem ist, und konzentriert sich nun mehr auf die Energiedichte. Es dauerte aber eine Weile, bis wir das verständlich machen konnten.“
Qualität der Suchergebnisse: Ein Großteil der Beschwerden über Google ist mit der wachsenden Präsenz gewerblicher Suchergebnisse, insbesondere von Preisvergleichsmaschinen und E-Commerce-Sites, verbunden. Hölzle verteidigt Googles Performance prompt „in jeder Hinsicht“, räumt jedoch ein, dass es ein Problem gibt, weil das Web, wie er es ausdrückt, „kommerzieller“ wird. Noch vor drei Jahren sei das Web viel ursprünglicher gewesen. „Wir haben schon an einen Button gedacht mit der Aufschrift: ‚Ich will weniger gewerbliche Ergebnisse'“, doch habe sich das Unternehmen bislang gescheut, diesen zu implementieren.
Es ist das größte Wachstum in einem Jahr seit 2021. Unter anderem lässt das Interesse…
Magento zählt zu den führenden Shopsystemen in der Welt. Es punktet mit hoher Flexibilität und…
SteelFox gelangt über angebliche Cracks für kostenpflichtige Anwendungen auf die Rechner seiner Opfer. Betroffen sind…
Ymir nutzt fortschrittliche Verschleierungsmethoden. Sie verschlüsselt bestimmte Dateien auf einer Whitelist nicht, um einer Entdeckung…
Das weltweit erste 5-in-1-Tischladegerät mit kabelloser Qi2-Aufladung und einziehbarem Kabel.
RansomHub kann per Fernverschlüsselung über ein einziges ungeschütztes Endgerät Daten im gesamten Netzwerk verschlüsseln.