API-Fehler legt Google-Dienste weltweit lahm

Ein fehlerhaftes Update für das API-Verwaltungssystem führt dazu, dass externe API-Anfragen abgelehnt werden. Die Störung ist für die meisten Betroffenen nach drei Stunden behoben.

Google macht eine fehlerhaftes Update für sein API-Management-System für die weltweite Störung seiner Dienste in der vergangenen Woche verantwortlich. Das Update führte dazu, das externe API-Anfragen vermehrt abgelehnt wurden, was letztlich dazu führte, dass Dienste von Drittanbietern betroffen waren, die auf Google Cloud basieren.

Googles Status-Website zufolge begannen die Störungen am vergangenen Donnerstag und dauerten rund drei Stunden an. Dienste wie Gmail, Drive und Chat waren vorübergehend nur eingeschränkt verfügbar. Aber auch Dienste die Spotify, Snapchat und Discord meldeten Ausfälle.

Die Einschränkungen traten unter anderem in Südafrika, Taiwan, Südkorea, Indien, Australien, Italien, Deutschland, Kanada und den USA auf. „Bei mehreren Google Cloud- und Google Workspace-Produkten traten vermehrt 503-Fehler bei externen API-Anfragen auf, was Auswirkungen auf die Kunden hatte“, teilte Google mit.

„Eine erste Analyse ergab, dass das Problem durch ein ungültiges automatisches Quoten-Update in unserem API-Verwaltungssystem verursacht wurde, das weltweit verteilt wurde und dazu führte, dass externe API-Anfragen abgelehnt wurden“, so Google weiter. „Zur Wiederherstellung haben wir die fehlerhafte Quotenprüfung umgangen, was in den meisten Regionen eine Wiederherstellung innerhalb von 2 Stunden ermöglichte.“

Allerdings sei die Datenbank mit den Quotenrichtlinien in der Region us-central1 überlastet worden, was zu einer wesentlich längeren Wiederherstellung in dieser Region geführt habe. „Bei einigen Produkten gab es mäßige Restauswirkungen für bis zu einer Stunde, nachdem das primäre Problem entschärft worden war, und einige wenige Produkte erholten sich erst danach.“

Um derartige Störungen künftig zu verhindern, kündigte Google Änderungen bei seiner API-Verwaltungsplattform an. Unter anderem soll verhindert werden, dass die Plattform wegen ungültiger oder beschädigte Daten ausfällt. Zudem sollen Tests und Prüfungen für bestimmte Metadaten sowie die Fehlerbehandlung im System verbessert werden.

Silicon - IT Deep Dive
sponsorisé
Silicon Podcast: Warum Zero Trust zur Unternehmenskult…

Themenseiten: API, Ausfall, Cloud-Management, Google

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu API-Fehler legt Google-Dienste weltweit lahm

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *