HydraBase: Facebook aktualisiert Messaging-Datenbank

Die Verfügbarkeit erhöht sich von derzeit 99,99 Prozent auf 99,999 Prozent. Das entspricht ungefähr 5 Minuten statt einer Stunde Ausfallzeit im Jahr. Das Update für Apache HBase steht kurz vor der Einführung.

Facebook hat in einem Blogbeitrag HydraBase vorgestellt, ein Update für die nicht relationale Datenbank Apache HBase, in der es Nutzernachrichten speichert. Die Einführung von HydraBase steht demnach unmittelbar bevor. Es soll die Ausfallzeit von Facebook Messages auf etwa 5 Minuten im Jahr reduzieren.

Facebook-Log-in

HBase nutzt das Hadoop Distributed File System (HDFS). Es ist bei Facebook Grundlage für Messages, Analytics, ein internes Monitoring-System, die neue Geolokalisierungsfunktion „Freunde in der Nähe“, den Suchindex, die Analyse von Streaming-Daten und Data Scraping für die internen Data Warehouses.

Fünf Minuten Ausfall im Jahr entsprechen einer Verfügbarkeitsquote von 99,999 Prozent. Aktuell ist Facebooks HBase-Installation erst bei 99,99 Prozent – fast eine Stunde im Jahr.

Die wichtigste Verbesserung durch HydraBase ist laut Facebook, dass es verteilte Standby-Server möglich macht. Die Entwickler beschreiben das aktuelle System: „Wenn ein Server für eine Region ausfällt, migrieren alle auf diesem Server gehosteten Regionen auf einen anderen Server der Region, was einer automatischen Ausfallsicherung entspricht.“ Dies bedeute aber Verzögerungen, weil die Dateien in HBase migriert werden müssen. HydraBase hingegen „entkoppelt logische und physikalische Replikation“.

„Statt jede Region mit einem einzigen Server abzudecken, wird in HydraBase jede Region auf einer Reihe Server gehostet. Wenn ein Regionsserver ausfällt, gibt es für diese Region bereits Standby-Server, die bereit sind, einzuspringen. Diese Standby-Regionsserver können über verschiedene Racks oder sogar Rechenzentren verteilt sein, sodass sie Verfügbarkeit über mehrere Ausfallbereiche hinweg bieten.“

Konzept von HydraBase (Diagramm: Facebook)

Facebook erklärt auch, wie sich die verteilten Server für eine Region organisieren: „Der Satz Server für eine Region bildet ein Quorum. Jedes Quorum hat einen Anführer, der sich um Lese- und Schreibanfragen durch Clients kümmert. Innerhalb eines Quorums ist jeder Server entweder im aktiven Modus oder im Beobachtungsmodus. Aktive Server schreiben in HDFS, aktualisieren und komprimieren Daten. Server im Beobachtungsmodus replizieren nur, können aber die Rolle des Anführers übernehmen, falls dieser ausfällt.“

[mit Material von Liam Tung, ZDNet.com]

Tipp: Wie gut kennen Sie Soziale Netzwerke? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Themenseiten: Datenbank, Facebook, Software, Soziale Netze

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu HydraBase: Facebook aktualisiert Messaging-Datenbank

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *