Categories: Sicherheit

Neues Tool stoppt Spam und rettet die Bücher der Welt

Recaptcha verbindet Spam-Abwehr mit einem nützlichen Projekt: der Digitalisierung von Büchern. Eine Gruppe von Programmierern der Carnegie Mellon University hat diesen neuartigen Dienst entwickelt. Das Projekt ist eine Abwandlung der weit verbreiteten Captcha-Technologie (Completely Automated Public Turing test to tell Computers and Humans Apart), die Spam in E-Mails und auf Blogs filtert. Captcha ermittelt, ob das System mit einem Menschen oder einer Maschine kommuniziert. Meistens muss man dazu ein auf einem Bild mit Störungen dargestelltes Wort richtig eingeben.

Recaptcha wandelt diesen lästigen Vorgang in einen produktiven Dienst um: Nutzer müssen gescannte Wörter aus Büchern eingeben, die der Computer nicht erkannt hat. Der Recaptcha-Dienst ist über eine Programmierschnittstelle einer Webseite erhältlich. Die Software-Plugins für die Schnittstelle sind Open Source und werden bei Google gehostet.

Recaptcha lässt sich auch nutzen, um E-Mail-Adressen vor Spam zu schützen. „Damit kann man nicht nur die Spam-Probleme lösen, sondern gleichzeitig helfen, die geschriebene Geschichte der Menschheit zu bewahren“, erklärt Ben Maurer, Leiter des Projektes und Student an der Carnegie Mellon University in seinem Blog. Seit dem Start des Projektes am Dienstag nutzen es bereits 150 Webseiten. „An nur einem halben Tag wurden mithilfe von Recaptcha 8000 Wörter digitalisiert“, schwärmt Luis von Ahn, Professor an der Carnegie Mellon University. Dies ist ein neues Beispiel dafür, wie das Internet kollektive Ressourcen nutzbar machen kann.

Recaptcha ist in der Lage, Unmengen von Wörtern in kurzer Zeit zu digitalisieren. Von Ahn schätzt, dass bisher pro Tag rund 60 Millionen Captcha-Eingaben getätigt werden. Der neue Dienst gibt dem Nutzer zwei Wörter vor: Das erste stammt aus einem herkömmlichen Captcha-Test, und das zweite ist ein unbekanntes Wort, das die Scansoftware nicht richtig erkannt hat. Mit einer richtigen Eingabe des Benutzers wird gleichzeitig das unbekannte Wort erkannt. Zurzeit bedarf es der identischen Eingabe durch drei verschiedene Nutzer, damit das Wort freigegeben wird.

Das Recaptcha-Projekt digitalisiert Bücher für das Internet Archive. Das Projekt baut eine digitale Bibliothek mit kulturellem Material auf und konserviert Schnappschüsse historischer Webseiten.

Von Ahns Spezialität ist „Human Computation“. Darunter versteht er Technologien, die die Rechenfähigkeiten von Menschen genutzt werden. Zwei seiner Projekte waren Online-Spiele, in denen die User Bilder beschriften, die die Rechner nicht identifizieren können. Google hat diese Technologie lizenziert und bietet sie nun als Google Image Labeler an, um seine Bildersuche zu verbessern.

Auch Microsoft Research hat seine eigene Version der Captcha-Technologie. Das Assira-Projekt allerdings zeigt Bilder von Hunden und Katzen, keine Wörter.

ZDNet.de Redaktion

Recent Posts

KI-gestütztes Programmieren bringt IT-Herausforderungen mit sich

OutSystems-Studie: 62 Prozent der Befragten haben Sicherheits- und Governance-Bedenken bei Softwareentwicklung mit KI-Unterstützung.

4 Stunden ago

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…

3 Tagen ago

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…

4 Tagen ago

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

4 Tagen ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

4 Tagen ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

5 Tagen ago