Categories: MiddlewareSoftware

Oracle erweitert Autonomous Data Warehouse

Die neue Version des Oracle Autonomous Data Warehouse (ADW) ist nicht mehr nur ein eigenständiger Data-Warehouse-Datenbankdienst, sondern ein umfassenderer Service, der Self-Service-Funktionen für die Aufnahme, das Laden, die Transformation, die Katalogisierung und die Modellierung von Daten unterstützt.

Oracles Schritt liegt ganz auf der Linie einiger Konkurrenten, wie Microsoft mit Azure Synapse Analytics und SAP mit Data Warehouse Cloud, die ihre Cloud-Data-Warehouses ebenfalls zu End-to-End-Services ausgebaut haben. Aber es unterscheidet sich deutlich von anderen wie AWS, Snowflake und Google, die eher portfolioorientierte oder Best-of-Breed-Partnerstrategien verfolgen.

Wie der Name schon sagt, baut das Autonomous Data Warehouse von Oracle auf der Autonomous Database auf. Und bis jetzt war der Hauptanspruch auf Ruhm die Tatsache, dass die Autonomous Database die einzige Datenbank war und immer noch ist, die Automatisierung und maschinelles Lernen kombiniert, um das System vollständig selbstfahrend zu machen. Nach drei Jahren im Einsatz hat Oracle Ergebnisse bekannt gegeben, wie z.B. dass 85% aller Bugs automatisch gefunden werden und oft im Keim erstickt werden, bevor die Kunden sie überhaupt bemerken, und dass eine selbstfahrende Datenbank letztlich billiger und effizienter zu betreiben ist. Mit dem neuen Release verlagert Oracle den Schwerpunkt von den TCO unter dem Strich auf den Geschäftsnutzen.

Oracle hat selbstfahrende Autos oft als Metapher verwendet, um zu erklären, was seine autonome Datenbank ist. Mit dem neuen Release des Autonomous Data Warehouse ändert Oracle das Thema. Das Unternehmen zielt auf ein breiteres Publikum als die übliche IT-Zielgruppe ab: Geschäfts- und Datenanalysten, Datenwissenschaftler und Entwickler in den Fachabteilungen. Anders als die IT-Abteilung sind sie nicht so sehr darauf bedacht, wie billig die Datenbank zu betreiben ist; sie interessieren sich dafür, wie sie ihre Arbeit als Analysten, die an Geschäftsproblemen arbeiten, erledigen können.

Der erweiterte Service umfasst Drag-and-Drop-Datenladen, Datenbereinigung, Datentransformation, Datenmodellierungstools und AutoML-Tools für Business-Analysten und Citizen Data Scientists. Außerdem enthält er einen rudimentären Datenkatalog für die Datenerkennung. Der Katalog beschränkt sich derzeit auf die Anzeige von Tabellenmetadaten und die Nachverfolgung der Abstammung und wird mit zukünftigen Versionen schrittweise erweitert.

Der Service erstreckt sich nicht auf Self-Service-Visualisierung – das ist die Domäne von Oracle Analytics Cloud oder Drittanbietern wie Tableau, Qlik oder Spotfire – aber er umfasst Integrationen und bietet auch einige grundlegende Visualisierungen sowie einige durch maschinelles Lernen geführte Discovery-Funktionen.

Ein gutes Beispiel für den Fokus auf Benutzerfreundlichkeit ist die Datenladefunktion. Bei vielen konkurrierenden Cloud-Data-Warehousing-Diensten wären Zeilen von SQL-Code erforderlich, um Tabellen zu erstellen und dann Daten in sie zu laden. Im Autonomous Data Warehouse ermöglicht ein webbasiertes visuelles Datenladetool (basierend auf Oracle Data Integrator), dies durch Drag-and-Drop-Funktionen zu bewerkstelligen, die Daten aus externen Dateien oder Datenbankquellen laden; diese können aus der Oracle Cloud Infrastructure (OCI), lokalen Systemen oder anderen öffentlichen Clouds stammen. Sobald die Datei oder die Datenbanktabelle ausgewählt wurde, prüft das System die Daten, schlägt Spaltennamen vor, ermöglicht dem Anwender eine Vorschau dieser Daten und erstellt die Datenbanktabelle nach der Freigabe automatisch.

Es gibt eine ähnliche Funktion zum Erstellen von „Geschäftsmodellen“ oder materialisierten Ansichten von Daten, die eine geführte Erfahrung beim Erstellen von Fakten, Dimensionen und Kennzahlen bietet. Eine Variante des Data Profiling wiederum zeigt zugrundeliegende Muster, Anomalien und Ausreißer in den Daten auf, die Möglichkeiten zum Drill-Down aufzeigen, um verborgene Erkenntnisse zu entdecken. Und alle Ergebnisse können in jedem SQL-basierten BI-Visualisierungstool oder -Service visualisiert werden, z. B. in der Oracle Analytics Cloud oder anderen Angeboten von Drittanbietern.

Auch für maschinelles Lernen gibt es mehrere Wege. Datenwissenschaftler können über integrierte Zeppelin-Notebooks arbeiten und SQL- oder Python-Code schreiben, aber für weniger ambitionierte Datenexperten gibt es auch AutoML-Funktionen, die sie bei der Auswahl, Konfiguration und dem Einsatz von ML-Modellen anleiten. Der Anwender erstellt ein Experiment, wählt die Datenquelle(n), und dann bietet das AutoML-Tool eine geführte Erfahrung, identifiziert Merkmale, vergleicht mehrere Algorithmen nebeneinander, zeigt ein Leaderboard der Ergebnisse an und empfiehlt, welcher Algorithmus am besten geeignet ist.

Mit den offengelegten RESTful-APIs können Entwickler wiederum Anwendungen erstellen, indem sie Tools wie das Low-Code/No-Code-Tool APEX von Oracle verwenden, das als Teil des Autonomous Data Warehouse gebündelt ist.

Der Cloud-Data-Warehousing-Bereich gliedert sich in zwei Pole. Auf der einen Seite stehen Dienste, die weitgehend datenbankzentriert sind, wie Amazon Redshift, Google Cloud BigQuery und Snowflake. Diese als eigenständige Angebote zu bezeichnen, sagt nicht alles, denn im Falle von AWS und Google gibt es Integrationen mit anderen Diensten in ihren Portfolios wie Streaming, ML, Visualisierung und anderen Datenbanken. Snowflake verfolgt, wie wir letzte Woche festgestellt haben, eine eher partnerzentrierte Strategie, positioniert sich aber gleichzeitig auch als Datenmarktplatz.

ADW passt zum anderen Pol – Cloud-Data-Warehousing-Dienste, die eigenständig genutzt werden können, aber auch den Schwerpunkt auf End-to-End-Erfahrungen legen. Die besten Beispiele sind Azure Synapse Analytics, das das frühere Azure SQL Data Warehouse um die Datenpipelining- und Datentransformationsfunktionen von Azure Data Factory erweitert, sowie duale SQL- und Spark-Ausführungsengines zur Ausführung gegen Datenbanktabellen und Azure Data Lake Storage (ADLS) gen 2. Power BI für die Visualisierung und Azure Machine Learning können direkt aus Synapse aufgerufen werden, obwohl sie formal nicht dazugehören. Umgekehrt erweitert die SAP Data Warehouse Cloud die Erfahrung in Richtung Self-Service-Visualisierung und integriert die Funktionen der SAP Analytics Cloud. Funktional ist das Angebot von Oracle näher an Azure Synapse dran, obwohl ADW derzeit zwar SQL-Zugriff auf den Data Lake bietet, aber keine Spark-Operationen unterstützt.

Die Hintergrundgeschichte von Oracles Angebot ist die Autonomous Database, eine selbststeuernde Plattform, die einzigartig für Oracle bleibt. Die Autonomous Database basiert auf Exadata und hat sich aus der Automatisierung entwickelt, die Oracle schon seit Jahren in seine Datenbank einbaut.

Mit der Einführung von Oracle Database 18c wurde die autonome Datenbank auf einem Fundament der Automatisierung aufgebaut – wir haben fast 20 diskrete Automatisierungsfunktionen gezählt, die Oracle im Laufe der Jahre eingebaut hat. Sie reichen bis in die 9c-Generation vor weit über einem Jahrzehnt zurück und behandeln Funktionen wie Speicherverwaltung, Speicherverwaltung, Tablespace Undos, Speicherindizierung und so weiter. Darüber liegt der selbststeuernde Teil, bei dem maschinelles Lernen auf Cluster-Provisionierung, Patching, Testen, Änderungsmanagement, Fehlerbehandlung und andere Funktionen angewendet wird. Während ein Teil der Automatisierung, wie z. B. das Patchen, Aktualisieren und Bereitstellen, den meisten Cloud Managed Database Services gemein ist, wird die Automatisierung der „Knöpfe“, an denen Datenbankadministratoren (DBAs) im übertragenen Sinne drehen, um die Ressourcen zu optimieren, von der Datenbank übernommen.

Bisher hat Oracle die Autonome Datenbank wegen ihrer niedrigen TCO beworben – mit dem Leitgedanken, dass ein Ansatz des maschinellen Lernens letztlich effektiver ist als Menschen, die ständig die Steuerung übernehmen. Es hat Garantien gegeben, Redshift preislich zu unterbieten. Oracle hat zahlreiche Benchmarks durchgeführt – vor allem gegen Amazon Redshift – und behauptet, dass seine Leistung und die Kosten überlegen sind.

Aber mit der neuen Version richtet Oracle seine Aufmerksamkeit auf das Geschäft, indem es bessere, abgerundete Erfahrungen schafft. Business-Anwender interessieren sich vielleicht nicht direkt für die Vorteile der autonomen Datenbank; sie wollen einfach eine Datenbank, die ihnen anständige SLAs für ihre Abfragen und Modelle bietet, zum richtigen Preis. Sie wollen mehr Selbstbedienung. Mit APEX betritt Oracle Neuland — Benutzerfreundlichkeit und Selbstbedienung, für die es traditionell nicht bekannt war. Die neueste Version des Autonomous Data Warehouse markiert einen weiteren Schritt in diese Richtung.

ANZEIGE

Kollaborationsplattform Slack: Effizient arbeiten – egal von wo

Vor COVID-19 war Remote-Work für viele Unternehmen fast undenkbar. Heute haben sie erkannt, dass es sehr gut funktionieren kann, wenn die Rahmenbedingungen stimmen. Erfahren Sie in diesem Webinar, wie Sie mit der Kollaborationslösung Slack auf die veränderten Arbeitsbedingungen optimal reagieren können.

ZDNet.de Redaktion

Recent Posts

Microsoft nennt weitere Details zu kostenpflichtigen Patches für Windows 10

Erstmals liegen Preise für Verbraucher vor. Sie zahlen weniger als Geschäftskunden. Dafür beschränkt Microsoft den…

2 Stunden ago

Microsoft verschiebt erneut Copilot Recall

Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…

20 Stunden ago

GenKI im Job: Mitarbeitende schaffen Tatsachen

Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.

22 Stunden ago

97 Prozent der Großunternehmen melden Cyber-Vorfälle

2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…

23 Stunden ago

„Pacific Rim“-Report: riesiges, gegnerisches Angriffs-Ökosystem

Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…

1 Tag ago

DeepL setzt erstmals auf NVIDIA DGX SuperPOD mit DGX GB200-Systemen

NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.

1 Tag ago