Reguläre Ausdrücke

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Reguläre Ausdrücke

    Hallo,

    hab meine Schwierigkeiten damit und will aus einer Seite den Preis auslesen, dieser steht so im Quelltext

    <td class="da12-kaufpreis">125.000,00 EUR</td>

    und ich will nur die 125.000,00 haben.
    Habs hiermit versucht aber blieb leider erfolglos.

    PHP-Code:
    preg_match('/<td class=\"da12-kaufpreis\">(.*?) EUR<\/td>/'$code$preis);
    echo 
    $preis[1]; 
    Jemand ne idee?

  • #2
    Hallöchen,

    Wenn es so in der Variable $code steht, klappt es

    PHP-Code:
    $code '<td class="da12-kaufpreis">125.000,00 EUR</td>';
     
    preg_match('/<td class=\"da12-kaufpreis\">(.*?) EUR<\/td>/'$code$preis);
    echo 
    $preis[1]; 

    Kommentar


    • #3
      Ich würde zum Testen mal $code = preg_quote() oder $code = addslashes() auf den eingelesenen String anwenden, damit der wie der Ausdruck maskiert wird. Ob es klappt, habe ich aber nicht getestet.

      Kommentar


      • #4
        Warum überhaupt einen regulären Ausdruck?

        Wenn du es einfach machen willst, dann nimm doch strpos() und substr(). Wenn du es ordentlich machen willst, dann nimm einen HTML-Parser wie zB. DOMDocument. Regex ist weder einfach noch ordentlich.

        Kommentar


        • #5
          Zitat von Wasser_Wanderer Beitrag anzeigen
          Hallöchen,

          Wenn es so in der Variable $code steht, klappt es

          PHP-Code:
          $code '<td class="da12-kaufpreis">125.000,00 EUR</td>';
           
          preg_match('/<td class=\"da12-kaufpreis\">(.*?) EUR<\/td>/'$code$preis);
          echo 
          $preis[1]; 
          Stimmt und mittlerweile hab ich auch erkannt woran es liegt. In der Variable sind zuviele leerzeichen oder unnötige Absätze.

          Code:
          <td class="da12-kaufpreis">
                    28.00  m²
                              
                  </td>
          In diesem Fall würde er es erkennen:
          Code:
          <td class="da12-kaufpreis"> 28.00  m²</td>
          Daher muss ich die Leerzeichen irgendwie rausfiltern. Müßte ich mit dem preg_match auch können aber weiß nicht wie? Weil die Variable zuvor durch ein str_replace zu jagen macht keinen sinn!

          Kommentar


          • #6
            wieso geht das nicht?

            PHP-Code:
            $codestr_replace(" """$code); 
            ich weiß nicht genau ob ich dein Anliegen richtig verstanden habe,
            aber wenn der Preis hard gecodet wurde, könntest den doch glatt durch eine variable ersetzen?

            Kommentar


            • #7
              Hatte schon mehrfach feststellen müssen, dass \s, obwohl \s eigentlich Leer- und Steuerzeichen schlucken sollte, keine Zeilenumbrüche schluckt. In folgendem Ausdruck kann \s ohnehin keinen Zeilenumbruch schlucken, da einfache Leerzeichen unberücksichtigt bleiben.

              PHP-Code:
              <?php

              $code 
              "<td class=\"da12-kaufpreis\">
                        28.00  EUR
                                  
                      </td>"
              ;


              $code preg_replace("/\s{2,}|\r\n/"" "$code);

              echo 
              $code;

              /* Ausgabe in den Quelltext: 

                 <td class="da12-kaufpreis"> 28.00 EUR </td>
              */
              ?>
              preg_match nach preg_replace funktioniert im Augenblick dennoch nicht, weil das noch irgendwie von den Maskierungen abhängt. Falls es Dich interessiert, hatte mal ein einfaches Script für die Suche im Quelltext mit einfachen regulären Ausdrücken geschrieben. An Zeilenumbrüche habe ich aber auch bei diesem Script nicht gedacht.

              RegEx: Mit regulären Ausdrücken im Quellcode von Dateien suchen

              Auch wenn sich die Ausdrücke nicht direkt übernehmen lassen, so doch vielleicht als Ansatz ganz brauchbar.

              Kommentar


              • #8
                Zitat von Melewo Beitrag anzeigen
                Hatte schon mehrfach feststellen müssen, dass \s, obwohl \s eigentlich Leer- und Steuerzeichen schlucken sollte, keine Zeilenumbrüche schluckt.
                Doch, tut’s.

                Allerdings magst du mit der Anzahl der Zeilenumbruchzeichen ein Problem haben, wenn du nur ein einzelnes \s zu matchen versuchst – und der Zeilenumbruch aber durch mehr als ein Zeichen dargestellt wird.
                I don't believe in rebirth. Actually, I never did in my whole lives.

                Kommentar


                • #9
                  Zitat von wahsaga Beitrag anzeigen
                  Allerdings magst du mit der Anzahl der Zeilenumbruchzeichen ein Problem haben, wenn du nur ein einzelnes \s zu matchen versuchst – und der Zeilenumbruch aber durch mehr als ein Zeichen dargestellt wird.
                  Ah, ja das könnte sein, da werde ich mal beim nächsten Mal drauf achten.

                  Und bei diesem Beispiel hier, wenn das es maskierte Zeichen aus dem Ausdruck entfernt wird, scheint es zu gehen. Da ist wohl die Frage, was nun wirklich eingelesen wird und wie der eingelesene String aussieht.

                  PHP-Code:
                  <?php

                  $code 
                  "<td class=\"da12-kaufpreis\">
                            28.00  m²
                                      
                          </td>"
                  ;

                  $code preg_replace("/\s{2,}|\r\n/"" "$code);
                  preg_match("#<td class=.{1}da12-kaufpreis.{1}>(.*?)</td>#"$code$preis);

                  echo 
                  $preis[1];

                  // Ausgabe: 28.00 m² 

                  ?>

                  Kommentar

                  Lädt...
                  X