Inhalte aus HTML seiten übernehmen...

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Inhalte aus HTML seiten übernehmen...

    Hallo!

    Ich möchte einen Teil meiner Homepage mit der eines Freundes zusammenlegen.
    Dafür möchten wir gerne Teile der Inhalte übernehmen.
    Da wir aber nicht immer beide Seiten aktualisieren möchen, und der Webserver meines
    Kumpels leider kein PHP unterstützt würde mich interessieren ob es möglich ist mit PHP einen bestimmten Teil von seinen Texten auszulesen und bei mir zu integrieren.

    Vom Inhalt ist dies etwa so:

    <HTML>
    HEADER
    BODY
    etc.
    >Start des TEXTES
    text
    text
    text
    ...Es könnten auch Bilder oder Tabellen hier stehen...
    text
    text

    <Ende des TEXTES
    FOOTER
    </HTML>

    Und diesen Markierten Text würde ich gerne übernehmen.
    Ist sowas machbar?
    (Ja, ich bin noch Anfänger!)

    Vielen Dank schonmal,

    Martin

  • #2
    Re: Inhalte aus HTML seiten übernehmen...

    ja, du kannst seine seite analog wie eine datei öffnen, und dann mit regulären ausdrücken (siehe tutorials) den bereich den du haben möchtest rausfiltern.
    I don't believe in rebirth. Actually, I never did in my whole lives.

    Kommentar


    • #3
      Klar. Am besten setzt Du ein Inhaltstag vor und nach den zu übernehmenden Text, z.B. <mycontent> </mycontent>. Dann liest Du das ganze aus. Geht mit einer Regex bestimmt in einer Zeile. Wo sind unsere Regex-Meister?

      Kommentar


      • #4
        Original geschrieben von pekka
        Am besten setzt Du ein Inhaltstag vor und nach den zu übernehmenden Text, z.B. <mycontent> </mycontent>.
        aber bitte als kommentartexte, man muss sein html ja nicht unbedingt unvalider machen als nötig :-)

        <!--mycontent-->
        auszulesender inhalt
        <!--/mycontent-->
        I don't believe in rebirth. Actually, I never did in my whole lives.

        Kommentar


        • #5
          Gut die Idee ist nicht schlecht, danke!!

          Aber was ist Regex und wie geht man damit um???
          Wie gesagt, ich bin ziemlicher Anfänger, was PHP angeht!!

          Martin

          Kommentar


          • #6
            Original geschrieben von otakuisland
            Aber was ist Regex und wie geht man damit um???
            wie gesagt: siehe tutorials!
            I don't believe in rebirth. Actually, I never did in my whole lives.

            Kommentar


            • #7
              Hier ist genau das was du suchst:
              http://www.php-resource.de/forum/sho...threadid=16783

              Übrigens: Sollte das Öffnen der Datei vom Server deines Freundes nicht funktionieren, dann steht vermutlich bei deinem PHP die Einstellung allow_url_fopen auf 0 bzw. Off.
              mein Sport: mein Frühstück: meine Arbeit:

              Sämtliche Code-Schnipsel sind im Allgemeinen nicht getestet und werden ohne Gewähr auf Fehlerfreiheit und Korrektheit gepostet.

              Kommentar


              • #8
                PHP-Code:
                $openfile fopen("seite.htm","r");
                $superstring implode("",(@file("seite.htm")));
                fclose ($openfile);
                // Entfernen aller Zeilenumbrüche
                $superstring eregi_replace ("\n"," ",$superstring);
                $superstring eregi_replace ("\r","",$superstring);
                $superstring eregi_replace ("\t","",$superstring);
                // Entfernen JavaScript
                $javascript = ("'<script[^>]*>.*?</script>'si");
                $superstring preg_replace ($javascript""$superstring);
                 
                // Entfernen CSS
                $css = ("'<style[^>]*>.*?</style>'si");
                $superstring preg_replace ($css""$superstring);
                // Entfernen des Titels
                $head = ("'<head>.*?</head>'si");
                $superstring preg_replace ($head""$superstring);
                // Entfernen der Kommentare
                $comment = ("'<!--.*?-->'si");
                $superstring preg_replace ($comment""$superstring);

                // Entfernen der HTML-Tags und Sonderzeichen
                $superstring strip_tags($superstring);
                $space '&nbsp;';
                $superstring ereg_replace ($space,"",$superstring);    
                $superstring ereg_replace ('&Auml;','Ä',$superstring);
                $superstring ereg_replace ('&auml;','ä',$superstring);
                $superstring ereg_replace ('&Uuml;','Ü',$superstring);
                $superstring ereg_replace ('&uuml;','ü',$superstring);
                $superstring ereg_replace ('&Ouml;','Ö',$superstring);
                $superstring ereg_replace ('&ouml;','ö',$superstring);
                // Mehrfache Leerzeichen werden entfernt
                while(substr_count($superstring"  ") > 0)
                {
                  
                $superstring str_replace("  "" "$superstring);
                }
                while(
                substr_count($superstring"- ") > 0)
                {
                 
                $superstring str_replace("- ""-"$superstring);
                }
                // Manuelle Trennzeichen löschen
                $superstring split("-",$superstring);
                for (
                $a=1;$a<sizeof($superstring);$a++)
                {
                 if (
                ereg("^(und)",$superstring[$a], $reg))
                 {
                   
                $superstring[$a]="- ".$superstring[$a];
                  }
                  else if (!
                ereg("^[a-z]",$superstring[$a], $reg))
                  {
                   
                $superstring[$a]="-".$superstring[$a];
                  }
                }
                echo 
                $superstring
                mit dem code extrahierts du aus einer html-datei den nackten text, der auf der seite angezeigt wird, inklusives entfernen manueller umbrüche und html-sonderzeichen, was bleibt ist nackiger asci-text.
                vielleicht kannst du damit was anfangen.
                gruss
                peter
                Zuletzt geändert von Kropff; 26.02.2003, 15:48.
                Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
                Meine Seite

                Kommentar


                • #9
                  kann er nicht auch die datei, die noch auf seinem server mit apache oder was weiss ich liegt, mit seinem browser öffnen, sich den Quelltext anzeigen lassen und das was er haben will in html-format rauskopiern? würd ich so machen

                  Kommentar

                  Lädt...
                  X