Google hat ein Framework für die Analyse von Sätzen natürlicher Sprache und ein zugehöriges Plug-in speziell für die englische quelloffen gemacht. Da ein Programm zum Verständnis natürlicher Sprache Parser heißt, nennt es die Komponente fürs Englische Parsey McParseface. Das Framework heißt SyntaxNet.
SyntaxNet nutzt die Technik künstlicher neuronaler Netze, wie Google sie in TensorFlow implementiert hat. Der veröffentlichte Code ermöglicht es Entwicklern, durch Selbstlernmechanismen neue SyntaxNet-Modelle zu entwickeln. Durch Parsey McParseface können sie englische Texte auch umgehend zu analysieren beginnen.
Google schreibt, SyntaxNet sei die Grundlage interner Systeme, um gesprochene Sprache zu verstehen, darunter die Sprachsteuerung von Google Now. Und Parsey McParseface nutze konkret Algorithmen für Maschinelles Lernen, um die grammatische Funktion jedes Worts und Wortblocks eines Satzes zu verstehen.
Interview mit Samsungs SSD-Spezialist Marcel Binder
Im Interview mit ZDNet erläutert Marcel Binder, Technical Product Manager Marketing bei Samsung, die Vorteile durch den Einsatz von SSDs. Dabei geht er auch auf aktuelle Schnittstellen, Speicherdichten sowie Samsung V-NAND-Technik ein.
„Eines der Hauptprobleme, die das Parsen so herausfordernd machen, ist die bemerkenswerte Mehrdeutigkeit der menschlichen Sprache“, heißt es in einem Blogbeitrag. „Es ist nicht ungewöhnlich, wenn ein Satz mittlerer Länge – etwa mit 20 oder 30 Wörtern – hunderte, tausende oder gar zehntausende mögliche syntaktische Strukturen haben kann. Ein Parser für natürlich Sprache muss irgendwie all diese Möglichkeiten durcharbeiten und aus dem Kontext die plausibelste Struktur ermitteln.“
Laut Google schafft Parsey McParseface bei der Analyse englischer Nachrichtentexte 94 Prozent Treffergenauigkeit. Das sei zwar nicht perfekt, aber doch für eine ganze Reihe Anwendungsfälle gut genug. Ohne korrekte Analyse könne ein Computer nicht richtig auf eine Sprachanweisung reagieren. Die Erfolgsquote von Menschen beim parsen von Sätzen schätzt Google auf 96 bis 97 Prozent.
Das Machine-Learning-System TensorFlow setzt Google auch in Webanwendungen wie Fotos und Suche ein. Im November 2015 wurde es unter Apache-2.0-Lizenz freigegeben. Google erhofft sich davon, mehr Entwickler zu gewinnen – und eine weitere Verbreitung der Technik. TensorFlow lässt sich sowohl auf Desktops und Servern als auch auf Mobilgeräten einsetzen. Seit Version 0.8 vom April 2016 lässt sich die Trainingssoftware für Maschinenlernen auf „hunderten Maschinen“ parallel betreiben, um die Rechenzeit im Idealfall von Wochen auf Stunden zu verkürzen. Zudem können Entwickler TensorFlow seither auf eigener Hardware laufen lassen.
[mit Material von Natalie Gagliordi, ZDNet.com]
Tipp: Kennen Sie die größten Technik-Flops der IT-Geschichte? Überprüfen Sie Ihr Wissen – mit 14 Fragen auf silicon.de.
Neueste Kommentare
Noch keine Kommentare zu Google macht Parser für die englische Sprache quelloffen
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.