URL auslesen

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • URL auslesen

    Hallo,

    mit $data = strtolower(strip_tags(implode("", file($url)))); lese ich den Ìnhalt einer Url aus. Nun möchte ich z.B. keine Daten aus dem <style> bereich oder javascript auslesen.

    Wer kann mir bitte weiterhelfen?


    Mfg
    Zocker

  • #2
    fang mal anders an. du hast einen string $data, der den quellcode eine fremden html-seite beinhaltet. was soll nun mit $data passieren?

    Comment


    • #3
      Es soll nur der Text zw. <body> und </body> in ein Array geschrieben werden. Ich benötige nur den Seiteninhalt, nicht den Header.

      Soweit klar?



      Mfg
      Zocker

      Comment


      • #4
        was denn für ein array?

        vielleicht versuchst du einen regulären ausdruck mittels preg_match() anzuwenden, um erst mal den body auszulesen?

        Comment


        • #5
          Wenn ich wüßte wie das geht, hatte ich es bereits gemacht. Kannst du mir da bitte weiterhelfen?


          Mfg
          Zocker

          Comment


          • #6
            wie hast du es bis jetzt versucht?

            Comment


            • #7
              Gabs doch grad erst!

              Comment


              • #8
                Das Problem aber ist dass ich den Quellcode nicht habe. Die Daten der URL werden wie folgt ausgelesen:

                newsletterwerbung bannerwerbung sponsoren partnerprogramm a {text-decoration:none} a:link {color:#000080} a:visited {color:#000080} a:active {color:#ff0000} a:hover {color:#ff0000} u{color:#000000; text-decoration:none} home anmeldung partnerprogramm webmaster login werbung kaufen werbekatalog power letter versenden sponsor login var ref_url=encodeuricomponent(document.location); var txt= ''; document.write(txt); » werbung.. » informiert » steigert umsatz » macht bekannt professionelle technik ermöglicht uns, ihnen effektive werbeflächen auf derzeit 51 verschiedenen domain zu günstigen konditionen anzubieten. wählen sie ihre gewünschte werbeform und werbemenge aus unserem werbekatalog aus.. zum werbekatalog sie möchten ihre werbung als newsletter versenden ?

                Nun möchte ich den oberen Teil, den <style> Bereich, bzw. den javascript Teil nicht auslesen.


                Mfg
                Zocker

                Comment


                • #9
                  Original geschrieben von Zocker
                  [B]Das Problem aber ist dass ich den Quellcode nicht habe.
                  ist doch der quelltext, halt nur ohne tags. ist aber auch normal, wenn du strip_tags verwendest.

                  Comment


                  • #10
                    Das ist mir schon klar. Aber wie kann ich nun den <style> und <javascript> Bereich ausklammern?


                    Mfg
                    Zocker

                    Comment


                    • #11
                      erst _ohne_ strip_tags() auslesen, regexp anwenden, dann von mir aus erst strip_tags.

                      Comment


                      • #12
                        Ich habe es nun wie folgt gemacht:

                        $data = strtolower(implode("", file($url)));

                        $reg = "/<body[^>]*>(.*)<\/body>/iUs";
                        preg_match($reg, $data, $ausgabe);

                        $data = strip_tags($ausgabe);


                        Was mache ich nur falsch?


                        Mfg
                        Zocker

                        Comment


                        • #13
                          du beschreibst dein problem nicht.

                          Comment


                          • #14
                            Es wird immer noch der Code mit ausgelesen, der im <style> Bereich steht.

                            Das ist mein Problem.



                            Mfg
                            Zocker

                            Comment


                            • #15
                              woran stellst du das fest?

                              Comment

                              Working...
                              X