Bislang waren dafür hunderte Kameraperspektiven oder Laborbedingungen notwendig. Jetzt können die darzustellenden Objekte in ihrer natürlichen Umgebung aufgenommen werden. Anwendungsgebiete sehen die Forschenden beim autonomen Fahren (Bild) oder auch beim Erhalt historischer Denkmäler.
In den letzten Jahren sind neuronale Methoden für kamerabasierte Rekonstruktion sehr beliebt geworden. Diese benötigen allerdings meist hunderte von Kameraperspektiven. Auf der anderen Seite gibt es klassische photometrische Verfahren, die zwar aus wenigen Perspektiven hochpräzise Rekonstruktionen auch aus Objekten mit einer geringen Oberflächentextur berechnen, die aber typischerweise nur in kontrollierten Laborumgebungen funktionieren.
Daniel Cremers, Professor für Bildverarbeitung und Künstliche Intelligenz an der TUM hat gemeinsam mit seinem Team eine Methode entwickelt, die beide Verfahren verbindet. Die Forschenden kombinieren dafür ein neuronales Netz der Oberfläche mit einem genauen Modell des Beleuchtungsprozesses, das die Abnahme des Lichts mit der Entfernung zwischen Objekt und Lichtquelle berücksichtigt.
Dabei kann aus der Helligkeit in den Bildern bestimmt werden, wie die Oberfläche zum Licht ausgerichtet und wie weit sie von der Lichtquelle entfernt ist. „So gelingt es uns, aus wenigen Daten Objekte deutlich präziser nachzubilden, als es bei vorherigen Verfahren möglich war. Für unsere Rekonstruktionen können wir das natürliche Umfeld verwenden und auch Objekte mit nur einer geringen Oberflächentextur nachbilden“, sagt Daniel Cremers.
Das Verfahren könne zum Beispiel genutzt werden, um historische Denkmäler zu erhalten oder Museumsobjekte zu digitalisieren. Werden diese zerstört oder verfallen mit der Zeit, sei es mithilfe von Fotos möglich, diese zu rekonstruieren und wahrheitsgetreu wiederaufzubauen, so Cremers weiter.
Neuronale kamerabasierte Rekonstruktionsverfahren entwickeln die Forschenden auch für das autonome Fahren. Hier wird die Umgebung mit einer Kamera gefilmt. Das autonome Auto kann dabei die Umgebung in Echtzeit nachbilden, ein dreidimensionales Szenenverständnis entwickeln und auf Grundlage dessen Entscheidungen treffen. Das Verfahren basiert auf neuronalen Netzen, die für einzelne Bilder eines Videos 3D-Punktwolken der Welt vorhersagen, die dann zu einem großskaligen Modell der durchfahrenen Straßen fusioniert werden.
Bankhaus Metzler und Telekom-Tochter MMS testen, inwieweit Bitcoin-Miner das deutsche Stromnetz stabilisieren könnten.
Mit 1,7 Exaflops ist El Capitan nun der dritte Exascale-Supercomputer weltweit. Deutschland stellt erneut den…
Der deutsche Hyperscaler erweitert sein Server-Portfolio um vier Angebote mit den neuen AMD EPYC 4004…
Beim Online-Gaming kommt es nicht nur auf das eigene Können an. Auch die technischen Voraussetzungen…
Fast jedes zweite Unternehmen bietet keinerlei Schulungen an. In den übrigen Betrieben profitieren oft nur…
Huawei stellt auf der Connect Europe 2024 in Paris mit Xinghe Intelligent Network eine erweiterte…