Vernünftige Indizes

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Vernünftige Indizes

    Hallo!

    Ich habe in meiner Anwendung eine Query, die bei ca 2000 Ergebnissen knapp 8 Sekunden braucht. Das ist zu lang, oder?

    Hier die Query:

    PHP-Code:
    SELECT user_pets2.iduser_pets2.nameuser_pets2.owner
    user_pets2.level
    FROM online
    user_pets2
    WHERE user_pets2
    .battle_status =0
    AND online.userid user_pets2.owner
    AND user_pets2.owner !=43042
    AND user_pets2.current_hp user_pets2.max_hp 0.5
    AND user_pets2.adoption '0'
    AND user_pets2.hunger '2'
    AND user_pets2.level =2
    ORDER BY last_visit ASC 
    *last_visit ist Teil von der Tabelle online*

    Ich habe versucht, das Problem über Indizes anzupacken. Dazu habe ich einen Index in der Tabelle "online" für die Spalte "userid" erstellt und in der Tabelle einen Index für alle Spalten, die in der WHERE-Klausel auftauchen.
    Explain mit der Query sagt folgendes:

    id select_type table type possible_keys key key_len ref rows Extra
    1 SIMPLE user_pets2 ALL enemys NULL NULL NULL 3327 Using where; Using temporary; Using filesort
    1 SIMPLE online ALL online_users NULL NULL NULL 5297 Range checked for each record (index map: 0x2)

    Die Anzahl rows und die Werte NULL deuten doch darauf hin, dass die Indizes nicht optimal oder gar nicht genutzt werden?
    Wie kann ich also diese Query optimieren?
    Wie erzeuge ich einen Index über beide Tabellen?

    Danke für die Hilfe!

  • #2
    Re: Vernünftige Indizes

    Original geschrieben von alex2iceman
    Die Anzahl rows und die Werte NULL deuten doch darauf hin, dass die Indizes nicht optimal oder gar nicht genutzt werden?
    Ja

    Wie erzeuge ich einen Index über beide Tabellen?
    Gar nicht.



    Wie du die Indizes setzen musst, hängt davon ab, wie die Daten in der Tabelle verteilt sind.
    Bei der Tabelle user_pets2 sollte ein Index über die Spalten battle_status, owner, adoption, hunger, und level. Die Reihenfolge ist davon abhängig, wie die Daten verteilt sind. Als Richtlinie, sollten die Spalten, die möglichst verschiedene Werte über alle Datensätze aufweisen, nach vorne in den Index.
    Die Bedingung
    Code:
    AND user_pets2.current_hp > user_pets2.max_hp * 0.5
    ist ganz fürchterlich, weil sie die Berechnung über alle Datensätze benötigt. max_hp ist immer > 0 ?! Wenn ja könntest du die Ungleichung nach
    Code:
    AND user_pets2.current_hp / user_pets2.max_hp > 0.5
    abändern. Das an sich ist nicht besser, du kannst dann aber aus dem Wert der bei der Division heraus kommt, eine weitere Spalte machen (welche natürlich bei jedem UPDATE von einer der beiden Spalten aktualisiert werden muss) und darüber dann den Index legen - so kriegst du die Berechnung aus dem Query, was zusätzlich schneller gehen sollte.
    Bei der Tabelle online sollte auf die Spalte userid ein Index.

    Danach könnte man als i-Tüpfelchen noch ausprobieren, bei user_pets2 dem eben erstellen großen Index als letzte Spalte erneut owner anzuhängen (oder owner einfach ans Ende setzen). Erneut EXPLAIN und mit der vorigen Ausgabe vergleichen (ich erwarte davon aber nicht zu viel~).
    Als weiterer Test dem Index userid der online-Tabelle noch die Spalte last_visit anhängen - danach erneut ein Explain - eventuell hilft das gegen filesort und use temporary

    Generell ist der Query aber eher aufwändig, weil die WHERE-Bedingungen auf die eine Tabelle, und das order by nach einer anderen Tabelle gemacht wird. Das ist potentiell eher schlecht~

    Ein netter Guide zum übersichtlichen Schreiben von PHP/MySQL-Code!

    bei Klammersetzung bevorzuge ich jedoch die JavaCoding-Standards
    Wie man Fragen richtig stellt

    Kommentar


    • #3
      Danke für die Antwort.

      Mit der Verteilung der Daten in der Tabelle meinst du die Reihenfolge der Spalten in der Tabelle (Strukturansicht von oben nach unten?)?

      Also wenn battle_status vor adoption kommt, dann sollte das im Index auch so sein?
      Und mit den verschiedenen Werten verstehe ich das so, dass die Inhalte unähnlich sind? Sorry, aber ich muss mich noch in die Begrifflichkeiten einarbeiten, daher die Fragen.

      Zu den Werten: die Spalten adoption und battle_status haben immer nur 0 oder 1. Huger liegt zwischen 1 und 10, also sind die Werte sehr ähnlich und müssen nicht so sorgsam danach sortiert werden(?).

      max_hp ist >100, aber was macht das für einen Unterschied, ob man ein Mal oder ein Geteilt in der Where-Klausel hat?

      Wie ist das gemeint, dem Index die Spalte nochmal owner hinzuzufügen? Wenn die Spalte also zwei mal im Index an unterschiedlichen Stellen vorhanden ist, macht das etwas aus?

      Finde ich alles sehr interessant, werde mal die Vorschläge durcharbeiten. Danke soweit.

      Kommentar


      • #4
        Original geschrieben von alex2iceman
        Mit der Verteilung der Daten in der Tabelle meinst du die Reihenfolge der Spalten in der Tabelle (Strukturansicht von oben nach unten?)?
        Wie du die Indizes setzen musst, hängt davon ab, wie die Daten in der Tabelle verteilt sind.[...]Als Richtlinie, sollten die Spalten, die möglichst verschiedene Werte über alle Datensätze aufweisen, nach vorne in den Index.
        Also wenn battle_status vor adoption kommt, dann sollte das im Index auch so sein?
        Nein

        Und mit den verschiedenen Werten verstehe ich das so, dass die Inhalte unähnlich sind?
        Ja

        Zu den Werten: die Spalten adoption und battle_status haben immer nur 0 oder 1. Huger liegt zwischen 1 und 10, also sind die Werte sehr ähnlich und müssen nicht so sorgsam danach sortiert werden(?).
        Es geht nicht um ähnlich, es geht um gleich.
        Ein Index über eine Spalte, wo 50% der Datensätze eine 0 und 50% der Datensätze eine 1 haben, ist immer schlechter als einer, wo 1/3tel der Datensätze eine 0, 1/3tel der Datensätze eine 1 und 1/3tel der Datensätze eine 2 drin stehen haben; einfach weil bei einem Vergleich (spalte=1) beim ersten Index 50% der Tabelle in Frage kommen, beim zweiten aber nur ein Drittel. Bei 50% an in Frage kommenden Datensätzen macht MySQL eventuell eh einen Full-Select aus dem Query, weil er schlichtweg schneller sein kann

        max_hp ist >100, aber was macht das für einen Unterschied, ob man ein Mal oder ein Geteilt in der Where-Klausel hat?
        Das an sich ist nicht besser, du kannst dann aber aus dem Wert der bei der Division heraus kommt, eine weitere Spalte machen (welche natürlich bei jedem UPDATE von einer der beiden Spalten aktualisiert werden muss) und darüber dann den Index legen - so kriegst du die Berechnung aus dem Query, was zusätzlich schneller gehen sollte.
        Und du kannst einen Index über die Spalte legen. Über Ergebnisse kannst du in MySQL keinen Index legen (Postgresql könnte das zum Beispiel)

        Wie ist das gemeint, dem Index die Spalte nochmal owner hinzuzufügen? Wenn die Spalte also zwei mal im Index an unterschiedlichen Stellen vorhanden ist, macht das etwas aus?
        Eventuell ja, sofern das überhaupt geht, deshalb schrieb ich ja: Ausprobieren.

        Ein netter Guide zum übersichtlichen Schreiben von PHP/MySQL-Code!

        bei Klammersetzung bevorzuge ich jedoch die JavaCoding-Standards
        Wie man Fragen richtig stellt

        Kommentar


        • #5
          ich sehe schon die Sache bedarf mehr Aufklärung.

          Das Problem ist also, wenn ich das richtig erkannt habe, dass die Spalten zu gleich von der Wertigkeit her sind und dass der Index wahrscheinlich gar nicht viel schneller sein wird als die Tabelle selbst...zumindest bei den nullen und einsen.

          Danke für die Tipps!

          Kommentar


          • #6
            Nicht alles gelesen, der Thread gehört dem GhostGambler.

            Aber mal nen vernünftigen LEFT JOIN versucht?

            Kommentar


            • #7
              Original geschrieben von alex2iceman
              Das Problem ist also, wenn ich das richtig erkannt habe, dass die Spalten zu gleich von der Wertigkeit her sind und dass der Index wahrscheinlich gar nicht viel schneller sein wird als die Tabelle selbst...zumindest bei den nullen und einsen.
              Wenn bei EXPLAIN der Index in der possible-key-Spalte drin ist, ja, wenn nicht, hast du irgendwas am Index falsch, sodass MySQL den gar nicht in Betracht zieht.


              btw. ich persönlich denke du hast am Index was falsch.


              OffTopic:
              Original geschrieben von TobiaZ
              Nicht alles gelesen, der Thread gehört dem GhostGambler.

              Aber mal nen vernünftigen LEFT JOIN versucht?
              Du bist zu gütig
              btw. left join war voll am Thema vorbei
              Zuletzt geändert von ghostgambler; 22.09.2007, 10:23.

              Ein netter Guide zum übersichtlichen Schreiben von PHP/MySQL-Code!

              bei Klammersetzung bevorzuge ich jedoch die JavaCoding-Standards
              Wie man Fragen richtig stellt

              Kommentar


              • #8
                OffTopic:
                Hatt auch nicht wirklich geglaubt. dass du das übersehen hättest.

                Kommentar

                Lädt...
                X