Google sponsert deutsches Open-Source-OCR-Projekt

Ocropus möchte die Entwicklung von Texterkennungstechnologien vorantreiben

Google hat seine Unterstützung für ein Open-Source-Projekt namens Ocropus bekannt gegeben. Das von Professor Thomas Breuel vom Deutschen Forschungsinstitut für künstliche Intelligenz (DFKI) in Kaiserslautern geleitete Projekt will die Entwicklung von Texterkennungstechnologien vorantreiben und selbst ein hochwertiges OCR-System programmieren.

Die von Ocropus entwickelte Texterkennungssoftware basiert auf zwei verschiedenen Technologien: zum einen auf einem Erkennungsverfahren für Handschriften, das Mitte der 90er Jahre vom US-Bundesamt für Statistik entwickelt wurde, und zum anderen auf einer neuen Methode für Layout-Analysen. In einer späteren Version soll zudem die von Hewlett-Packard entwickelte OCR-Engine Tesseract eingebunden werden.

Google und das Ocropus-Team wollen bereits in Kürze eine erste Technologiedemo der Software auf der Projekt-Homepage veröffentlichen. Sie wird unter der Apache-Lizenz zur Verfügung gestellt werden. Die erste Alpha-Version von Ocropus soll noch im dritten Quartal erscheinen.

Themenseiten: Google, Open Source, Software

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu Google sponsert deutsches Open-Source-OCR-Projekt

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *