So lassen sich auch in C# Wörter mit Soundex kodieren

Der Code für die Implementierung dieser Regeln in C# sieht folgendermaßen aus:

Ein interessanter Nebeneffekt dieses Regelsatzes ist, dass der ausgegebene Wert davon abhängt, welches Wort man zuerst eingibt.

Zur Veranschaulichung dienen die beiden Wörter „Brad“ und „Zach“. Eine Eingabe in die Difference-Funktion mit der Reihenfolge „Difference(„Brad“, „Zach“)“ ergibt den Wert 1. Werden sie jedoch in der Reihenfolge „Difference(„Zach“, „Brad“)“ eingegeben, erhält man den Wert 2.

Das liegt daran, dass die zweite Codierung auf Zeichen aus der ersten Codierung überprüft wird und eben nicht die erste Codierung auf Zeichen aus der zweiten. Da die SQL Difference-Funktion jedoch genau die gleichen Ergebnisse liefert, lässt sich der oben erstellte Regelsatz unverändert beibehalten.

Performance und Sprachanpassung

Bei den hier gezeigten Soundex– und Difference-Funktionen handelt es sich offensichtlich nicht gerade um Leichtgewichte. Doch immerhin benötigt die obige C#-Implementierung von Soundex nur eine halbe Sekunde, um etwa 100.000 durchschnittlich lange Namen zu kodieren. Mit SQL dauert dasselbe knapp über eine Sekunde.

Wer hauptsächlich deutsche Begriffe nach ihrem Klang auswerten und vergleichen will, sollte eine Soundex-Weiterentwicklung implementieren: das Kölner Verfahren. Es ist beispielsweise auch in SAP verfügbar.

Page: 1 2 3

ZDNet.de Redaktion

Recent Posts

Open-Source-Malware auf Rekordniveau

Alarmierender Anstieg von Open-Source-Malware / Seit 2019 haben Sonatype-Analysen mehr als 778.500 bösartige Pakete aufgedeckt

1 Woche ago

Bayerische KI-Agentur bietet KI-KOMPASS

Das KI-Werkzeug "BAIOSPHERE KI-KOMPASS" soll Unternehmen den Einstieg in KI erleichtern.

1 Woche ago

Cloudflare: Weltweiter Internettraffic wächst 2024 um 17,2 Prozent

Das Wachstum konzentriert sich wie im Vorjahr auf das zweite Halbjahr. Google dominiert bei den…

1 Woche ago

Adobe stopft kritische Löcher in Reader und Acrobat

Sie ermöglichen eine Remotecodeausführung. Angreifbar sind Acrobat DC, 2024 und 2020 sowie Reader DC und…

1 Woche ago

Dezember-Patchday: Microsoft schließt Zero-Day-Lücke

Die öffentlich bekannte und bereits ausgenutzte Schwachstelle erlaubt eine Rechteausweitung. Betroffen sind alle unterstützten Versionen…

1 Woche ago

Quantencomputer: Google meldet Durchbruch bei Fehlerkorrektur

Der neue Quantenchip Willow löst eine Herausforderung, an der seit 30 Jahren gearbeitet wird. Google…

1 Woche ago