Suche optimale Indizierung

**onemorenerd** · 20.01.2007, 12:40

Ich rekapituliere: Du hast 40 Tabellen, mit Femdschlüsselbeziehungen untereinander.
Um n:m-Relationen abbilden zu können, braucht man eine "Vermittlertabelle". Du hast aber nicht für jede Relation eine solche, sondern nur eine einzige.

Das kann ja nicht gut gehen! Es drängeln sich alle Queries, die eine n:m-Relation abfragen auf dieser Tabelle. Bei schreibenden Queries wird das Locking zum Eiertanz.
Gleichzeitig ist die Tabelle sicher sehr groß. Wenns nicht grad ne Heap-Tabelle ist oder komplett in den RAM passt, wird viel Zeit für Paging und Verdrängung verbraten.

Warum machst du es nicht wie üblich mit einer Relationstabelle pro Relation? Damit verteilen sich alle Queries auf alle Tabellen und jede für sich so klein, dass die Indizes leicht zu pflegen sind.

btw: http://dev.mysql.com/EXPLAIN

**rockie667** · 20.01.2007, 15:36

okay, hab ich kapiert... werd ich mittelfristig auch umstellen...

leider muss ich aber ne halbwegs kurzfristige lösung finden, mit der ich mir helfen kann, bis ich die tabellenstruktur bzw. den quellcode entsprechend geändert hab.

würde nur gerne wissen, wie du in diesem fall die indizes setzen wüdest...

dankeschön nochmal
hans

**onemorenerd** · 20.01.2007, 15:57

Die Spalte ID ist vermutlich ein PK. Aber die ganze Spalte ist überflüssig. Entweder löschen oder zumindest keinerlei Key drauf setzen. Nimm also den PK mal weg und dann schau mit EXPLAIN, welche Keys ratsam wären - das hängt schließlich von deinen Queries ab, da kann man keine generelle Empfehlung geben.

Aber eines kann ich mit Sicherheit sagen: Alle Spalten die *_id heißen sowie reverse und alias sollten offensichtlich numerischen Typs sein! Das würde schon mal einiges an Performance bringen.

Allerdings erfordert es Änderungen am Code und wenn das momentan nicht möglich ist, dann leg einfach noch ein paar Riegel RAM nach, optimiere die MySQL-Konfiguration oder zieh notfalls mit der DB auf eine Maschine mit richtig Dampf.

**rockie667** · 20.01.2007, 18:53

dank dir schon mal - den ram werd ich gleich mal von zwei auf vier gigabyte erhöhen. alle spalten auf int-typ umstellen wird im quellcode etwas aufwändiger werden. hab leider nicht viel zeit, um eine schnelle lösung hinzukriegen... wenn ich keine andere lösung finde, muss es ja irgendwie gehen...

aber mal eine ganz dumme frage. gibts nicht evtl. ne möglichkeit, alle anfragen an die tabelle zunächst mysql-intern auf andere tabellen umzuileiten? so dass ich evtl. abhängig vom alias (ich hab bislang 13 aliase) die anfrage an eine andere tabelle schicken kann? würde dann also die tabelle in 13 einzelteile zerlegen... ich hab noch nie in mysql programmiert, deshalb kenne ich da nicht die möglichkeiten, um evtl. das problem darüber zu lösen. das wäre die lösung all meiner probleme...

ich hoffe, du weisst in etwa, was ich meine. anfrage kommt an die tabelle, und dann ist in der db ein weiterleitungsmechanismus hinterlegt, der in abhängigkeit vom alias-feld die anfrage woanders hin schickt. mag sich jetzt für dich vielleicht naiv anhören, aber ich denke, mysql bietet bestimmt unendlich viele möglichkeiten, von denen ich noch keinen blassen schimmer hab...

gruss
hans

**onemorenerd** · 20.01.2007, 23:29

Ne, sowas wie mod_rewrite für MySQL gibts imho nicht.

**rockie667** · 21.01.2007, 11:45

würdest du eine möglichkeit darin sehen, in ADOdb einzugreifen und daselbst etwa in der methode Execute den übergebenen sql-string abzufragen und ggf zu manipulieren?

also etwa so, dass, falls der string die tabelle relations enthält, abhängig vom alias der tabellenname verändert wird? dass also, falls das feld alias etwa den wert 'personendaten' hat, nicht die tabelle relations sondern die tabelle relations_personendaten abgefragt wird.

dann wäre zunächst eine brauchbare lösung gefunden, da ich dann die grosse relationentabelle in 13 kleinere tabellen splitten könnte. in obiger abfrage könnte man auch die strings durch die entsprechenden int-werte ersetzen - wäre also eine zentrale position, an der man diese entscheidende anpassung projektweit vornehmen könnte, ohne den sonstigen quellcode mühsam und zweitraubend anpassen zu müssen...

bitte: mir ist klar, dass es natürlich äusserst heikel ist, im ADOdb-quellcode rumzufummeln. aber da würde ich nun mal grad ne gute (vermutlich die einzige) möglichkeit sehen, um das problem zu lösen.

**onemorenerd** · 21.01.2007, 13:21

Klar ist das eine Möglichkeit, aber zuerst sollte sicher sein, dass wirklich nur dieses Projekt die ADODB-Schnittstelle verwendet.

Dann würde ich eine Zeit lang alle Queries loggen, die durch ADODB gehen. Das kannst du dir natürlich sparen, wenn du schon genau weißt, was du wie umzuschreiben hast und dass du dabei nicht übers Ziel hinaus schießt.

Suche optimale Indizierung