Prüfsumme

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Prüfsumme

    Hallo zusammen,

    habe folgendes Problem: In einer DB stehen Kunden inkl. kompletter Adresse. Nun möchte ich prüfen, ob eine Person in dieser DB drinsteht (so eine Art Blacklist). Nun kann man ja eine Strasse mit oder ohne Leerzeichen schreiben, beim Vornamen noch das Initial vom zweiten Namen dazu usw. usw. ein normales Query fällt also weg.

    Wie stelle ich es am Besten an, dass ich trotzdem relativ sicher sagen kann, ob die Person in der DB steht oder nicht?

    Hatte gedacht, dass ich vielleicht so eine Art Prüfsumme erstelle und wenn sich diese mehr als z.B. 80% gleichen ist das die Person...

    Wie könnte man da rangehen??

    DANKE!!

    schönes WE
    strauberry

  • #2
    Nuja, was mir auf Anhieb einfallen würde wäre die Zeichen über die gesamte Adresse auszuzählen und mit den anderen Adressen abzugleichen. Wenn man da z.b "str." bei der berechnung der summen immer als "straße" mitrechnet sollte man schon ne gute näherung bekommen.

    Zusätzlich könnte man um das n bissl gescheit abzusichern bei mehr als z.b. 90% übereinstimmung der Buchstabenhäufigkeiten noch nach gemeinsamen substrings in der adresse suchen...

    Aber das is sicher keine 100% verlässliche Variante, aber das was mir so auf die schnelle eingefallen ist...

    good luck
    smoop
    ... who cares ...

    Kommentar


    • #3
      es gibt auch funkktionen dafür, aber frag mich grad nicht nach dem namen. Such mal in der Richtung.

      Möglichkeit wäre auch die Volltextsuche, was aber in diesem Fall äher ungeeignet ist.

      Kommentar


      • #4
        Original geschrieben von TobiaZ
        es gibt auch funkktionen dafür, aber frag mich grad nicht nach dem namen.
        du denkst vermutlich an sowas wie soundex oder levenshtein.

        aber die sind m.W. eher auf englischsprachige begriffe optimiert, und deshalb in anderen sprachgebieten mit vorsicht anzuwenden.
        I don't believe in rebirth. Actually, I never did in my whole lives.

        Kommentar


        • #5
          sondex weniger, aber letzteren würde ich jetzt damit in verbindung bringen

          Kommentar


          • #6
            Wer die Wahl hat, hat die Qual

            http://manuals.phpforum.de/php/funct...milar-text.php
            http://manuals.phpforum.de/php/function.levenshtein.php

            Was bedeutet denn diese Komplexität? Wie kann man das interpretieren?

            Hier nochmal ein anschauliches Beispiel:

            http://www.selfphp.info/funktionsref...evenshtein.php

            Was ist eure Meinung dazu ?

            Kommentar


            • #7
              Der klare Nachteil bei den von dir genannten Funktionen ist, dass sie PHP-Funktionen sind. Das macht den Vergleich innerhalb eines Mysql-Selectes eher schwierig.

              Kommentar


              • #8
                Hm, diese Blacklist umfast vielleicht irgendwann mal 100 Datensätze. Wie lange dauert es, die alle in ein Array zu laden und dann "durchzuschleifen"?

                Sollte eigentlich recht schnell gehen, oder ?

                Kommentar

                Lädt...
                X