Query: letztes Element, dass sich von vorletzten unterscheidet

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Query: letztes Element, dass sich von vorletzten unterscheidet

    Hallo,
    ich habe folgende Tabelle:
    Code:
    ID | REF_ID | TIME | VALUE
    ---+--------+------+-------
    0  |   1    |  12  | 101 
    1  |   1    |  13  | 102
    2  |   1    |  14  | 103
    3  |   2    |  6   | 54
    4  |   2    |  7   | 54
    Was ich versuche: Eine Liste der Einträge pro REF_ID zu finden, bei denen sich in letzter Zeit VALUE unterscheidet.
    Sprich es gibt hier nur zwei Gruppen, auf die man achten muss: REF_ID 1 und 2.
    Ich hole mir die Einträge über ORDER BY TIME DESC (LIMIT 2) und habe somit die aktuellsten Einträge gruppiert durch REF_ID.

    Bei dem Beispiel wären das ID 1 und 2 für REF_ID 1
    und ID 3 und 4 für REF_ID 2.

    Was ich jetzt prüfen müsste, ist ob VALUE != VALUE für 1 und 2, respektive 3 und 4 ist.
    In PHP kann ich dies relativ einfach prüfen und sehe, dass 3 und 4 wegfallen, weil diese gleich sind.
    Was ich nicht hin bekomme, ist dies im query unterzukriegen.
    SQL Injection kitteh is...

  • #2
    Hallo,

    das sollte mit einem Self Left Join zu machen sein.

    Gruß,

    Amica
    [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
    Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
    Super, danke!
    [/COLOR]

    Kommentar


    • #3
      Hallo,
      interessant. Ich habe es jetzt mit einem self-join und mittlerweile auch mit einem sub-query gelöst bekommen (zumindest hoffe ich das)

      Ich muss mal die beiden Lösungen benchmarken. Habe überhaupt kein Gefühl, welche Art schneller ist
      SQL Injection kitteh is...

      Kommentar


      • #4
        Self Joins sind in der Regel schneller, als unkorrelierte Unterabfragen und definitiv viel schneller als korrelierte Unterabfragen. Letztere sollte man kategorisch vermeiden.
        [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
        Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
        Super, danke!
        [/COLOR]

        Kommentar


        • #5
          Ok, das ist unerwartet. Ich hab gerade den self-join:
          PHP-Code:
          SELECT *
          FROM `watchedvaluewwatchedvalue w2
          WHERE w
          .value <> w2.value
          GROUP BY w
          .REF_ID
          ORDER BY w
          .timestamp DESC 
          ausgeführt.
          Dafür habe ich 10 verschiedene einträge für REF_ID und ca 42.000 einträge in der watchedvalue Tabelle angelegt.
          Auf value, REF_ID und timestamp ist ein non-unique index gelegt worden.

          Die Workbench kommt seit drei Minuten aus dem Query nicht raus.

          Edit: Das ist eigentlich Mist, was ich da mache. Ich vergleiche alle Werte mit allen. Wie bekomme ich denn den self-join auf nur die ersten beiden Elemente eingegrenzt, an die ich über ORDER BY timestamp DESC komme?
          SQL Injection kitteh is...

          Kommentar


          • #6
            Das ist ein Theta-Style Join. Ich sprach aber von einem Left Join:

            Code:
            SELECT *
            FROM `watchedvalue` w1
            LEFT JOIN watchedvalue w2
                ON w2.ref_id = w1.ref_id AND w2.time > w1.time
            LEFT JOIN watchedvalue w3
                ON w3.ref_id = w2.ref_id AND w3.time > w2.time
            WHERE w3.id IS NULL AND w2.id IS NOT NULL
                AND w2.value != w1.value;
            [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
            Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
            Super, danke!
            [/COLOR]

            Kommentar


            • #7
              Hallo,
              ok, Missverständnis, ich hab self join gegoogelt und nur halbgare theta joins mit kartesischem Produkt gefunden.

              Im Nachhinein erinnere ich mich auch wieder an die Datenbankvorlesung.

              Dein Join hat jedoch nach 6 Minuten ein Timeout vom mysql Server gehabt.

              Ich bin mir nicht sicher, aber ich habe die Vermutung dass jeweils ein Query pro REF_ID effizienter sein kann, als joins.
              Ich muss pro REF_ID nur die letzten beiden Einträge sortiert nach timestamp holen und vergleichen. Wenn ich den ORM umgehe, spare ich mir sogar das hydrate der Treffer in Objekte und etwas Ausführungszeit.

              Wird mein Problem denn in der Regel mit einem großen Self-Query gelöst, oder durch schnellere Einzelqueries?

              Ich fürchte auf dem Gebiet habe ich nicht hinreichende Erfahrungen
              SQL Injection kitteh is...

              Kommentar

              Lädt...
              X