Grabb-Script geuscht

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Grabb-Script geuscht

    Suche Script was folgendes macht:

    - eine andere Internetseite aufrufen
    - Text ausfiltern und zurückgeben

    In der aufgerufenen Seite sind die Textteile
    <!-- Start des Redaktionsbereiches -->
    und
    <!-- Ende des Redaktionsbereiches -->
    enhalten.

    Die ganze Seite sieht praktisch so aus:

    ...Text..blablabla
    <!-- Start des Redaktionsbereiches -->
    ...Text der dargestellt werdeen soll.....
    <!-- Ende des Redaktionsbereiches -->
    Text...blablabla


    Das Script soll alles zwischen diesen beiden Textteilen
    als Ausgabe zurückgeben.

    Kann mir jemand helfen?

    Gruß Michael

  • #2
    datei einlesen. -> fopen()
    daten filtern. -> regex


    suche im forum und du wirst fündig werden.

    INFO: Erst suchen, dann posten![color=red] | [/color]MANUAL(s): PHP | MySQL | HTML/JS/CSS[color=red] | [/color]NICE: GNOME Do | TESTS: Gästebuch[color=red] | [/color]IM: Jabber.org |


    Kommentar


    • #3
      nix gefunden

      Sri,

      vielleicht bin ich blind :-)
      hab zwar was zum Theme fopen gefunden (das parsen einer anderen Seite krieg ich auch noch hin) aber nix zum Ausfiltern wie von mir beschrieben.

      Gruß Michael

      Kommentar


      • #4
        erledigt :-)

        Hallo allerseits,
        ich habe im Internet was gefunden!

        wens interessiert, hier der Quellcode:

        ----schnipp---

        PHP-Code:
        <?php

          
        // Global Variables
        $filename "http://www.darc.de";      // Location of the News Source
        $start "<!-- Start des Redaktionsbereiches -->";            // Start Grabbing Code
        $stop  "<!-- Ende des Redaktionsbereiches -->";                 // Stop Grabbing Code
        $page  "wtowatch.txt";            //name of first cache file


          // Get contents of the specified URL and writes it into a string
        $fd fopen$filename"r" );
        $contents fread$fd20000 );
        fclose$fd );

          
        // Isolates desired section.
        if(eregi("$start(.*)$stop"$contents$printing)) {
          
        $substring=$printing[1];


          
        // while is added as there are multiple instances of the </table> string & eregi
          // searches to include the most that matches, not the next.
         
        while(eregi("(.*)$stop"$substring$printing)) {
             
        $substring=$printing[1];
           };

         } else {
           echo 
        "Didn't find Daily summary";
         }

          
        // Replaces specific HTML tags and text
        $printing[1] = eregi_replace"- .* records</b>"""$printing[1] ); // Text
        $printing[1] = eregi_replace"<IMG SRC=[^>]*>"""$printing[1] );   // Images
        $printing[1] = eregi_replace"<font[^>]*>"""$printing[1] ); // Fonts
        $printing[1] = eregi_replace"</font>"""$printing[1] );
        $printing[1] = eregi_replace"<tr[^>]*>""<li>"$printing[1] ); // Table Codes
        $printing[1] = eregi_replace"<td[^>]*>"""$printing[1] );
        $printing[1] = eregi_replace"</tr>"""$printing[1] );
        $printing[1] = eregi_replace"</td>"""$printing[1] );

          
        // Adds Absolute URL
        $printing[1] = eregi_replace"href=\"""href=\"http://www.darc.de"$printing[1]);

          
        //  Saves output to include file
        $cartFile fopen("$page","w");
        fwrite($cartFile,$printing[1]);
        fclose($cartFile);

        include (
        "$page");

        ?>
        ---schnipp---

        Gruß Michael


        EDIT:
        php-tags eingefügt.
        Abraxax

        Zuletzt geändert von Abraxax; 29.04.2003, 21:23.

        Kommentar


        • #5
          danke

          Danke fürs ändern.

          Wer wissen will, wie es funtioniert, der schaut auf meine Seite

          www.a-funk.net

          und ruft mal die DARC-Headlines auf!

          Gruß aus Aschaffenburg

          Kommentar


          • #6
            das scriptelchen ist ja cool.
            kann doch hier und da recht nützlich sein

            lg
            jens

            Kommentar

            Lädt...
            X