Bislang waren dafür hunderte Kameraperspektiven oder Laborbedingungen notwendig. Jetzt können die darzustellenden Objekte in ihrer natürlichen Umgebung aufgenommen werden. Anwendungsgebiete sehen die Forschenden beim autonomen Fahren (Bild) oder auch beim Erhalt historischer Denkmäler.
In den letzten Jahren sind neuronale Methoden für kamerabasierte Rekonstruktion sehr beliebt geworden. Diese benötigen allerdings meist hunderte von Kameraperspektiven. Auf der anderen Seite gibt es klassische photometrische Verfahren, die zwar aus wenigen Perspektiven hochpräzise Rekonstruktionen auch aus Objekten mit einer geringen Oberflächentextur berechnen, die aber typischerweise nur in kontrollierten Laborumgebungen funktionieren.
Daniel Cremers, Professor für Bildverarbeitung und Künstliche Intelligenz an der TUM hat gemeinsam mit seinem Team eine Methode entwickelt, die beide Verfahren verbindet. Die Forschenden kombinieren dafür ein neuronales Netz der Oberfläche mit einem genauen Modell des Beleuchtungsprozesses, das die Abnahme des Lichts mit der Entfernung zwischen Objekt und Lichtquelle berücksichtigt.
Dabei kann aus der Helligkeit in den Bildern bestimmt werden, wie die Oberfläche zum Licht ausgerichtet und wie weit sie von der Lichtquelle entfernt ist. „So gelingt es uns, aus wenigen Daten Objekte deutlich präziser nachzubilden, als es bei vorherigen Verfahren möglich war. Für unsere Rekonstruktionen können wir das natürliche Umfeld verwenden und auch Objekte mit nur einer geringen Oberflächentextur nachbilden“, sagt Daniel Cremers.
Das Verfahren könne zum Beispiel genutzt werden, um historische Denkmäler zu erhalten oder Museumsobjekte zu digitalisieren. Werden diese zerstört oder verfallen mit der Zeit, sei es mithilfe von Fotos möglich, diese zu rekonstruieren und wahrheitsgetreu wiederaufzubauen, so Cremers weiter.
Neuronale kamerabasierte Rekonstruktionsverfahren entwickeln die Forschenden auch für das autonome Fahren. Hier wird die Umgebung mit einer Kamera gefilmt. Das autonome Auto kann dabei die Umgebung in Echtzeit nachbilden, ein dreidimensionales Szenenverständnis entwickeln und auf Grundlage dessen Entscheidungen treffen. Das Verfahren basiert auf neuronalen Netzen, die für einzelne Bilder eines Videos 3D-Punktwolken der Welt vorhersagen, die dann zu einem großskaligen Modell der durchfahrenen Straßen fusioniert werden.
Laut CAM-Studie sehen 40 Prozent der Autofahrer vernetzte Fahrzeuge mit Software-Updates als Bedrohung an.
Wahlen in mehr als 60 Ländern und rund 2 Milliarden potenziellen Wählern, ist ein gefundenes…
Sie verfallen spätestens nach einer Stunde. Firefox 131 enthält zudem Fixes für 13 Anfälligkeiten, die…
Mobile Malware-Kampagne richtet sich gezielt gegen Banking-Apps.
Betroffen ist das Update KB5043145 für Windows 11 23H2 und 22H2. Es löst unter Umständen…
Sie erlaubt eine nicht autorisierte Ausweitung von Benutzerrechten. Microsoft stuft die Anfälligkeit bisher nicht als…