Frage: Caching

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Frage: Caching

    Moin Leute,

    ich hätte da mal wieder eine Frage.

    Ich habe ein etwas größeres Projekt, mit momentan etwa 10.000 kurzen Artikeln.

    Nun stelle ich mir die Frage inwiefern es sinnvoll ist dort die ein oder andere Sache zu cachen. Dazu folgende Fragen:

    1.) Ist der Festplattenzugriff um das Cachefile zu lesen aufwändiger als eine MySQL-Abfrage ( einfaches SELECT ) und anschließendes Ausgeben der Daten ?

    2.) Bei 10.000 Einträgen hieße das auch 10.000 Cachefiles. Wenn die alle im Cache-Ordner liegen, verschlechtert das dann die Performance des Cache-File-Lesens nennenswert, oder ist das Wurscht ?

    3.) Ich hab dynamische Elemente im Layout, hieße also es würden pro statische Seite 3 Cache-Files ins Layout eingebunden. Heißt also 3 Festlpattenzugriffe. Lohnt sich das dann noch ?

    Ich danke für jeden Tip, Link, oder Hinweis zu dem Thema.

    Gruß,
    nohfreak
    Mein aktuelles Projekt: Hausaufgaben Datenbank für kostenlose Hausaufgaben

  • #2
    Ich würds einfach mal benchmarken.

    Dann würde ich mal hinterfragen ob du überhaupt Handlungsbedarf siehst.

    Wenn du ohnehin ne Verbindung zur DB aufbauen musst und es sich um eine DB auf localhost handelt, würde ich mir die mühe des cachens sparen.

    Aber wie gesagt, ausprobieren. Pauschal kann man sowas selten sagen und eine Vermutung bringt dich auch nicht wirklich weiter...

    Kommentar


    • #3
      Dann mal ganz blöd gefragt:

      Wie überprüft man sowas am besten ?
      Interessant wäre ja die Geschwindigkeit für den Seitenaufbau und ach der Memory-Verbrauch.

      Hat da jemand grad zufällig nen Link zu ner guten Erklärung bei der Hand ?
      Mein aktuelles Projekt: Hausaufgaben Datenbank für kostenlose Hausaufgaben

      Kommentar


      • #4
        Wurde hier zufällig erst vor wenigen Minuten ansatzweise behandelt.

        Kommentar


        • #5
          Ah, okay.
          Also schneller is es auf jeden Fall mit dem Cachen.
          Ich hab jez noch nich alle 10.000 Dateien generiert, aber eine Hand voll Versuche ergab folgendes:

          Seiten Aufbau
          OHNE Cache: 0.067888
          MIT Cache: 0.001706

          Scheint sich also von der Geschwindigkeit her schon zu lohnen.
          Ich muss jez erstmal weg, morgen früh generier ich mal alle Cache-Dateien und probiers dann nochmal, Ergebnis kommt dann hier rein.
          Mein aktuelles Projekt: Hausaufgaben Datenbank für kostenlose Hausaufgaben

          Kommentar


          • #6
            Mm, sind die mySQL-Tabellen auch ordentlich Indiziert?

            Kommentar


            • #7
              Alle 10000 Dateien wirst du sicher nicht generieren müssen. Es reicht bestimmt aus, eine Antwort zu einer Anfrage zu cachen, also den Cache erst on Demand zu erstellen und dann bei der erneuten Anfrage nur zu überprüfen, ob der Cache noch aktuell ist, zum Beispiel neuer als eine Stunde.

              Kommentar


              • #8
                Original geschrieben von pekka
                Mm, sind die mySQL-Tabellen auch ordentlich Indiziert?
                Jo, sind sie. Die Daten werden über den Primary-Key geholt. Es wird aber noch über einen FULLTEXT-INDEX eine Liste mit 10 ähnlichen Einträgen erstellt.

                Die Werte oben sind übrigens in Milisekunden, nicht in Sekunden.

                Alle 10000 Dateien wirst du sicher nicht generieren müssen. Es reicht bestimmt aus, eine Antwort zu einer Anfrage zu cachen, also den Cache erst on Demand zu erstellen und dann bei der erneuten Anfrage nur zu überprüfen, ob der Cache noch aktuell ist, zum Beispiel neuer als eine Stunde.
                Also, eine Antwort zu einer Anfrage habe ich ja schon ausprobiert, ist ca. 40x Schneller den Cache abzurufen, als die Daten aus der DB zu holen. Was ich ja eigentlich rausfinden will ist ja, ob es Einfluss auf die Geschwindigkeit hat, wenn viele Cache-Dateien vorhanden sind.

                Mehr als 200 Cachedateien pro Minute zu erstellen krieg ich mit ner Schleife leider nicht hin, daher hab ichs nun gradmal mit 600 Dateien getestet. Da wird noch kein Bischen Speed eingebüßt.

                Ich denk ich werd die Cache-Version nehmen. Ich danke für die Tips.

                Gruß,
                nohfreak
                Mein aktuelles Projekt: Hausaufgaben Datenbank für kostenlose Hausaufgaben

                Kommentar


                • #9
                  Mehr als 200 Cachedateien pro Minute zu erstellen krieg ich mit ner Schleife leider nicht hin, daher hab ichs nun gradmal mit 600 Dateien getestet. Da wird noch kein Bischen Speed eingebüßt.
                  Genau das ist ja das Problem. Den Cache nicht immer aktuell halten sondern erst bei Anfrage speichern, so dass eine weitere zeitnahe gleiche Anfrage aus dem Cache beantwortet werden kann.

                  Kommentar


                  • #10
                    Ja, so mach ich das ja im Live-Betrieb. Ich wollte nur zum testen mal alle da haben, um zu sehen ob das Nachteile hat, wenn da irgendwann 10.000 Cache-Files gleichzeitig im Ordner sind.
                    Mein aktuelles Projekt: Hausaufgaben Datenbank für kostenlose Hausaufgaben

                    Kommentar


                    • #11
                      Ja, so mach ich das ja im Live-Betrieb. Ich wollte nur zum testen mal alle da haben, um zu sehen ob das Nachteile hat, wenn da irgendwann 10.000 Cache-Files gleichzeitig im Ordner sind.
                      Ok, 10k Dateien sollte man in der Regel nicht in das gleiche Verzeichnis legen. Das kannst du aber einfach umgehen, indem du Unterverzeichnisse erstellst, die nach dem ersten Buchstaben der Cache-Datei benannt sind und die Dateien dort entsprechend eingeordnet sind.

                      Kommentar


                      • #12
                        Mal so als Frage, was genau meint Ihr mit cashing und wie funktioniert das?

                        Kommentar


                        • #13
                          Mal so als Frage, was genau meint Ihr mit cashing und wie funktioniert das?
                          Vielleicht einfach mal googlen? Der Wikipedia-Artikel bietet zum Beispiel Auskunft.

                          Kommentar


                          • #14
                            Also ich mache hier ein output-Caching. Das heißt ich speichere die Ausgabe meines Scriptes in einer Datei. So muss bei der nächsten Anfrage nicht wieder das Script neu ausgeführt werden, sondern es wird direkt der Inhalt der Cache-Datei zurückgegeben.

                            Das hat den Vorteil, dass es deutlich schneller ist, da man keine Datenbankanfragen senden muss. Bzw. deutlich weniger.

                            Ich benutze allerdings das Zend Framework. Wie das da z.B. geht hab ich hier mal beschrieben.
                            Mein aktuelles Projekt: Hausaufgaben Datenbank für kostenlose Hausaufgaben

                            Kommentar


                            • #15
                              Original geschrieben von nohfreak
                              Also ich mache hier ein output-Caching. Das heißt ich speichere die Ausgabe meines Scriptes in einer Datei. So muss bei der nächsten Anfrage nicht wieder das Script neu ausgeführt werden, sondern es wird direkt der Inhalt der Cache-Datei zurückgegeben.

                              Das hat den Vorteil, dass es deutlich schneller ist, da man keine Datenbankanfragen senden muss. Bzw. deutlich weniger.

                              Ich benutze allerdings das Zend Framework. Wie das da z.B. geht hab ich hier mal beschrieben.
                              Ok, also muss man irgendwo bestimmen, ob die Datein noch aktuell sind oder ob neue Dateien erstellt werden müssen. Dann würde das nur Sinn machen bei Inhalten die sich nicht im Minuten Takt ändern oder?

                              Kommentar

                              Lädt...
                              X