Dupletten in einer n:m-Verknüpfungstabelle aufspühren?

**CHnuschti** · 05.09.2002, 19:12

alles BS

**CHnuschti** · 05.09.2002, 21:53

Bei dir sollte es
GROUP BY r1.s_id
heissen.

Dennoch, ich hab diese Query bei mir probiert; Resultat=> es werden sämtliche Datensätze der Table gefunden

Sachen gibts.
mfg

**Troublegum** · 05.09.2002, 23:14

Du kannst über die beiden Felder einen Unique key legen, dann sind doppelte Einträge nicht möglich.

**hOk** · 05.09.2002, 23:29

Jippie,
vielen Dank, jetzt bin ich um einiges Schlauer,

denn MySQL meldete:
Duplicate entry '1486-37896' for key 1

bei:
ALTER TABLE rel_seite_wort ADD PRIMARY KEY(s_id, w_id)

dann:
Tabelle loeschen und neu indizieren, mal
sehen ob es klappt.

vielen Dank, und netten Gruß an euch beide, Holger

PS.: Die Abfrage würde mich natürlich immer noch
interessieren.

**Troublegum** · 05.09.2002, 23:35

Wieso Tabelle löschen und neu indizieren ?

Lösche die doppelten Eintrag '1486-37896' und dann nochmal ALTER TABLE rel_seite_wort ADD PRIMARY KEY(s_id, w_id)

**hOk** · 06.09.2002, 00:11

Jup, stimmt doch ich muss ja
den Fehler finden der den
doppelten Eintrag verursacht,
auch echt eklig...;-)

mfg, Holger

**hOk** · 06.09.2002, 13:01

Hi, habe jetzt den Fehler gefunden:

Sonderzeichen haben das Problem verursacht.

Das Wort: "eintrag" war einmal normal geschrieben,
und ein anderes mal mit so einem komischen: "i".

PHP hat diese Wörter als verschieden betrachtet,
und wollte daher das zweite Wort in die Indizierung
aufnehmen.

MySQL hat hingegen, zumindest in der Select-Abfrage,
die beiden Wörter als identisch betrachtet, so dass
das zweite Wort zu _unrecht_ in die Indizierung auf-
genommen wurde.

Bei Groß- und Kleinschreibung kannte ich dieses
Verhalten von MySQL, aber bei Sonderzeichen noch
nicht.

Wenn man den Spalten das Attribut binary spendiert,
müsste die Unterscheidung klappen, oder?

viele nette Grüße, Holger

**Troublegum** · 06.09.2002, 21:01

binary würde ich nicht empfehlen, denn du willst ja keine Unterscheidung zwischen Groß- und Kleinschreibung - das bei einer Suche meiner Meinung nach nicht so sinnvoll.

Meine Idee wäre:
Die Sonderzeichen könntest du aus den Wörtern per Regex einfach löschen, sowohl vor dem Indizieren als auch vor dem Suchen danach.
So stören dann z.b. Punkte, Kommatas oder auch solche komischen i-s wie du sie nennst nicht mehr.

**hOk** · 07.09.2002, 15:20

Ja, vielen Dank,
dass werde ich mal probieren.
netten Gruß, hOk

Dupletten in einer n:m-Verknüpfungstabelle aufspühren?