So lassen sich auch in C# Wörter mit Soundex kodieren

Der Code für die Implementierung dieser Regeln in C# sieht folgendermaßen aus:

Ein interessanter Nebeneffekt dieses Regelsatzes ist, dass der ausgegebene Wert davon abhängt, welches Wort man zuerst eingibt.

Zur Veranschaulichung dienen die beiden Wörter „Brad“ und „Zach“. Eine Eingabe in die Difference-Funktion mit der Reihenfolge „Difference(„Brad“, „Zach“)“ ergibt den Wert 1. Werden sie jedoch in der Reihenfolge „Difference(„Zach“, „Brad“)“ eingegeben, erhält man den Wert 2.

Das liegt daran, dass die zweite Codierung auf Zeichen aus der ersten Codierung überprüft wird und eben nicht die erste Codierung auf Zeichen aus der zweiten. Da die SQL Difference-Funktion jedoch genau die gleichen Ergebnisse liefert, lässt sich der oben erstellte Regelsatz unverändert beibehalten.

Performance und Sprachanpassung

Bei den hier gezeigten Soundex– und Difference-Funktionen handelt es sich offensichtlich nicht gerade um Leichtgewichte. Doch immerhin benötigt die obige C#-Implementierung von Soundex nur eine halbe Sekunde, um etwa 100.000 durchschnittlich lange Namen zu kodieren. Mit SQL dauert dasselbe knapp über eine Sekunde.

Wer hauptsächlich deutsche Begriffe nach ihrem Klang auswerten und vergleichen will, sollte eine Soundex-Weiterentwicklung implementieren: das Kölner Verfahren. Es ist beispielsweise auch in SAP verfügbar.

Page: 1 2 3

ZDNet.de Redaktion

Recent Posts

Digitalisierung! Aber wie?

Mehr Digitalisierung wird von den Unternehmen gefordert. Für KMU ist die Umsetzung jedoch nicht trivial,…

6 Tagen ago

Meta meldet Gewinnsprung im ersten Quartal

Der Nettoprofi wächst um 117 Prozent. Auch beim Umsatz erzielt die Facebook-Mutter ein deutliches Plus.…

1 Woche ago

Maximieren Sie Kundenzufriedenheit mit strategischem, kundenorientiertem Marketing

Vom Standpunkt eines Verbrauchers aus betrachtet, stellt sich die Frage: Wie relevant und persönlich sind…

1 Woche ago

Chatbot-Dienst checkt Nachrichteninhalte aus WhatsApp-Quellen

Scamio analysiert und bewertet die Gefahren und gibt Anwendern Ratschläge für den Umgang mit einer…

1 Woche ago

Microsoft stellt kleines KI-Modell Phi-3 Mini vor

Seine Trainingsdaten umfassen 3,8 Milliarden Parameter. Laut Microsoft bietet es eine ähnliche Leistung wie OpenAIs…

1 Woche ago

Google schließt kritische Sicherheitslücke in Chrome

Sie erlaubt eine Remotecodeausführung außerhalb der Sandbox. Betroffen sind Chrome für Windows, macOS und Linux.

1 Woche ago