Google hat seine Unterstützung für ein Open-Source-Projekt namens Ocropus bekannt gegeben. Das von Professor Thomas Breuel vom Deutschen Forschungsinstitut für künstliche Intelligenz (DFKI) in Kaiserslautern geleitete Projekt will die Entwicklung von Texterkennungstechnologien vorantreiben und selbst ein hochwertiges OCR-System programmieren.
Die von Ocropus entwickelte Texterkennungssoftware basiert auf zwei verschiedenen Technologien: zum einen auf einem Erkennungsverfahren für Handschriften, das Mitte der 90er Jahre vom US-Bundesamt für Statistik entwickelt wurde, und zum anderen auf einer neuen Methode für Layout-Analysen. In einer späteren Version soll zudem die von Hewlett-Packard entwickelte OCR-Engine Tesseract eingebunden werden.
Google und das Ocropus-Team wollen bereits in Kürze eine erste Technologiedemo der Software auf der Projekt-Homepage veröffentlichen. Sie wird unter der Apache-Lizenz zur Verfügung gestellt werden. Die erste Alpha-Version von Ocropus soll noch im dritten Quartal erscheinen.
Neueste Kommentare
Noch keine Kommentare zu Google sponsert deutsches Open-Source-OCR-Projekt
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.