HydraBase: Facebook aktualisiert Messaging-Datenbank

Facebook hat in einem Blogbeitrag HydraBase vorgestellt, ein Update für die nicht relationale Datenbank Apache HBase, in der es Nutzernachrichten speichert. Die Einführung von HydraBase steht demnach unmittelbar bevor. Es soll die Ausfallzeit von Facebook Messages auf etwa 5 Minuten im Jahr reduzieren.

HBase nutzt das Hadoop Distributed File System (HDFS). Es ist bei Facebook Grundlage für Messages, Analytics, ein internes Monitoring-System, die neue Geolokalisierungsfunktion „Freunde in der Nähe“, den Suchindex, die Analyse von Streaming-Daten und Data Scraping für die internen Data Warehouses.

Fünf Minuten Ausfall im Jahr entsprechen einer Verfügbarkeitsquote von 99,999 Prozent. Aktuell ist Facebooks HBase-Installation erst bei 99,99 Prozent – fast eine Stunde im Jahr.

Die wichtigste Verbesserung durch HydraBase ist laut Facebook, dass es verteilte Standby-Server möglich macht. Die Entwickler beschreiben das aktuelle System: „Wenn ein Server für eine Region ausfällt, migrieren alle auf diesem Server gehosteten Regionen auf einen anderen Server der Region, was einer automatischen Ausfallsicherung entspricht.“ Dies bedeute aber Verzögerungen, weil die Dateien in HBase migriert werden müssen. HydraBase hingegen „entkoppelt logische und physikalische Replikation“.

„Statt jede Region mit einem einzigen Server abzudecken, wird in HydraBase jede Region auf einer Reihe Server gehostet. Wenn ein Regionsserver ausfällt, gibt es für diese Region bereits Standby-Server, die bereit sind, einzuspringen. Diese Standby-Regionsserver können über verschiedene Racks oder sogar Rechenzentren verteilt sein, sodass sie Verfügbarkeit über mehrere Ausfallbereiche hinweg bieten.“

Facebook erklärt auch, wie sich die verteilten Server für eine Region organisieren: „Der Satz Server für eine Region bildet ein Quorum. Jedes Quorum hat einen Anführer, der sich um Lese- und Schreibanfragen durch Clients kümmert. Innerhalb eines Quorums ist jeder Server entweder im aktiven Modus oder im Beobachtungsmodus. Aktive Server schreiben in HDFS, aktualisieren und komprimieren Daten. Server im Beobachtungsmodus replizieren nur, können aber die Rolle des Anführers übernehmen, falls dieser ausfällt.“

[mit Material von Liam Tung, ZDNet.com]

Tipp: Wie gut kennen Sie Soziale Netzwerke? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

KI-gestütztes Programmieren bringt IT-Herausforderungen mit sich

OutSystems-Studie: 62 Prozent der Befragten haben Sicherheits- und Governance-Bedenken bei Softwareentwicklung mit KI-Unterstützung.

2 Tagen ago

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…

6 Tagen ago

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…

6 Tagen ago

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

6 Tagen ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

6 Tagen ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

1 Woche ago