reguläre ausdrücke

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • reguläre ausdrücke

    wer weis rat?

    ich komme aktuell leider nicht weiter.
    und zwar möchte ich auf einer bookmark.htmtl datei alle youtube links und bezeichner raus ziehen.

    das klappt auch soweit, nur habe ihc nun das problem, das ich die links nur bis zum & brauche.
    ich habe mir ne kleine "musikbox" gebastelt, und der flashplayer der dahinter steckt nimmt die links nicht an, wenn das &mode=related&search= oder das &feature=related im link noch vorkommt.

    hier mein code.
    ich habe drei varianten, aber keine funktioniert ganz.

    PHP-Code:
    $lines file ($this->booklist);
                
    #$neddle = "#(<A\sHREF\s*=\s*\"([^\"]+)\"\s*ADD_DATE).*\">(.+)</a>#isu";
                #$neddle = "#(<A\sHREF\s*=\s*\"([^\"]+)(&mode=related&search=|&feature=related)\"\s*ADD_DATE).*\">(.+)</a>#isu";
                  
    $neddle "#(<A\sHREF\s*=\s*\"([^\"]+)[^&mode=related&search=|&feature=related]\"\s*ADD_DATE).*\">(.+)</a>#isu";
                
    $gogo="youtube";
            
                
    // Durchgehen des Arrays und Anzeigen des HTML Source inkl. Zeilennummern
                
    foreach ($lines as $line) {
                    if(
    stristr($line$gogo)) {
                        
    preg_match($neddle,$line,$match);
                        if(!empty(
    $match)) { 

    Wer kann mir einen Tip geben?

    Danke
    gruss pedro

  • #2
    Warum nicht einfach den ganzen Link selectieren und dann beim explode bei & anwenden?

    mfg

    Kommentar


    • #3
      naja wird nicht gehen.

      hier ein beispiel.

      PHP-Code:
      <A HREF="http://www.youtube.com/watch?v=tFfb_
      CwBma0&feature=related" 
      ADD_DATE="1198579113" LAST_VISIT="1201272015" ICON="data:image/x-icon;
      base64,AAABAAEAEBAAAAEAIABoBAAAFgAAAC
      gAAAAQAAAAIAAAAAEAIAAAAAAAAAAAABMLAAATCwAAAAAAAAAAAAD
      //////////4OD//9paf//bm7//2Fh//9ZWf//Wlr//1pa//9WVv//ZGT//3Bw//9jY///goL
      //////////////////11d//8sLP//QUH//ygo//84OP//RET//y4u//8xMf//UVH//y4u//8PD
      ///ZWX//x0d//9aWv////////////88PP//Cgr///////8zM///1NT///////+lpf//ubn///////
      +urv//fHz////////g4P//Fhb/////////////MzP//woK////////NDT//8vL//9ycv//paX//7
      Cw//9jY///s7P//8nJ//9XV///eXn//yIi/////////////zMz//8LC///+/v//zMz///Gxv//hYX//
      6Ki//+srP//W1v//6ys//+3t///2tr//93d//8PD/////////////80NP//AgL///b2//8nJ///
      5ub//56e//+5uf//oaH//+/v//+5uf//oKD//+Li///f3///AgL/////////////MzP//wUF////////
      Skr//0pK//9NTf//NTX//97e//+ysv//Nzf//xIS//+mpv//Kyv
      //z09/////////////xkZ///Y2P////////////
      8nJ///EBD//wAA///y8v//Ly///wAA//
      8mJv//Hh7//6mp//92dv////////////+vr///Jib//xMS//8eIP//
      MzP//zY2//84OP//Hh///y4u//9XV///hoj//8LC///R0f//qqr
      ///////////////////////////////////////////////
      //////////////////////////////////////////////////////////////
      AAAA/8zMzP/u7u7/IiIi/wAAAP8iIiL//////
      zMzM/8AAAD/AAAA/////////////////////////////////
      wAAAP/MzMz//////yIiIv/u7u7/ERER/7u7u/8AAAD/iIiI/
      xEREf///////////////////////////+7u7v8AAAD/zMzM//////
      8iIiL/7u7u/xEREf+7u7v/AAAA/8zMzP8RERH
      ///////////////////////////93d3f/AAAA/1VVVf/u7u
      7/IiIi/wAAAP8iIiL//////wAAAP/MzMz/ERER///////////////////////
      d3d3/AAAA/4iIiP8AAAD/3d3d//////////////
      ///////////////////////////////////////////////////wAAAP//////AAAA
      ////////////////////////////////////////////////////////////
      AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
      AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
      AAAAAAAAAAAAAAAAAAAAAA==" 
      LAST_CHARSET="UTF-8" ID="rdf:#$ZQw0T">snoop dog ft pharell beautiful</A>
      <
      DD>video 
      Zuletzt geändert von petro_0; 20.06.2008, 20:10.
      gruss pedro

      Kommentar


      • #4
        Hier ein Tipp: Code umbrechen!
        [FONT="Helvetica"]twitter.com/unset[/FONT]

        Shitstorm Podcast – Wöchentliches Auskotzen

        Kommentar


        • #5
          Verstehe nicht, wieso das nicht funktionieren soll.

          http://regexp-evaluator.de/evaluator...ab6e/#ergebnis

          [1] = Link
          [2] = Nonsense
          [3] = Titel

          Ist nen simpler regex atm..
          [1] jetzt exploden und fertig..


          mfg

          Kommentar


          • #6
            genial

            du hattest recht.

            ich habs falsch verstanden;o(

            gut der trick lag ansich schon in der regexp.

            ''
            PHP-Code:
            '#<a href="(.*)" (.*)>(.*)</a>#isU' 
            Meine war bissi umständlicher, daher hatte ich ein anderes array und mein explode hat nciht hin gehauen.

            Übrigens starke seite: http://regexp-evaluator.de/evaluator...ab6e/#ergebnis

            ich weis bis heute nicht wie das genau funzt. viell können wir uns mal austauschen und du gibts mir ne hilfestellung zu der nutzung?

            wäre toll danke

            gruss günter
            gruss pedro

            Kommentar


            • #7
              Da du in Sachen Regex noch Laie bist, möchte ich dich nicht durcheinander bringen, allerdings darauf hinweisen, dass gleich drei (.*) (Gierige Sterne) in einem Ausdruck in puncto Performance problematisch werden können.. Etwas Lektüre dazu gibt es hier (ab Beitrag #15).
              Probiers mal hiermit:
              Code:
              <a\s+href\s*=\s*"([^"]+)"\s+([^>]*)>(.*?)</a>
              Grüße
              Zuletzt geändert von Griecherus; 21.06.2008, 22:09.
              Nieder mit der Camel Case-Konvention

              Kommentar


              • #8
                naja laie... mir liegen die regulären ausdrücke nicht so ;o)

                ja das mit den resourcen und dem .* war mir egentlich bekannt, nur bin ich froh überhaupt eine Hilfe bekommen zu haben.

                Danke auch für deinen Link.

                habe mal nach Greepx Dots gesucht und bin auf folgenden Link gestossen.
                http://www.perlmonks.org/index.pl?node_id=24640

                Dann wäre doch ein (.*?) genau das richtige für mich oder?

                Zusatz:

                Nein das geht auch nicht, besser ich (.+), aber auch das ist nicht optimal.
                Hier greift doch nun wieder der backtrack.

                Aber wie ist es denn denn nun optimal für mein Beispiel?
                Zuletzt geändert von petro_0; 21.06.2008, 21:13.
                gruss pedro

                Kommentar


                • #9
                  Ich habe im meinem Posting doch eine Regex zu stehen
                  Dabei habe ich Negierte Charakter-Klassen verwendet.
                  Beispiel:
                  Code:
                  ([^>]+)
                  Trifft auf alle Zeichen zu, die kein Größer-als Zeichen sind. Das Zirkumflex am Anfang der Charakter-Klasse negiert diese.

                  Grüße
                  Nieder mit der Camel Case-Konvention

                  Kommentar


                  • #10
                    also "spar" ich mir durch das
                    PHP-Code:
                    ([^>]+) 
                    die ganze backreference die resourcen kostet?

                    Also genauer gesagt schaktet das negieren das backreferencing aus ;o) ??
                    gruss pedro

                    Kommentar


                    • #11
                      Original geschrieben von petro_0
                      also "spar" ich mir durch das ([^>]+) die ganze backreference die resourcen kostet?

                      Also genauer gesagt schaktet das negieren das backreferencing aus ;o) ??
                      Nein, es schaltet das Backtracking nicht aus. Es kommt lediglich zu keinem Backtracking, solange das Muster zutrifft.
                      Nieder mit der Camel Case-Konvention

                      Kommentar


                      • #12
                        ok nun danke für die hilfe...

                        bei mir mucc nun endlich mal der groschen bezüglich der regulären ausdrücke fallen, sonst seh ich schwart ;o)

                        aber danke dir für deine geduld.
                        gruss pedro

                        Kommentar

                        Lädt...
                        X