Daten aus HTML-Datei rippen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Daten aus HTML-Datei rippen

    ich hab diesen Link :

    http://www4.samplesound.de/objekte.htm !

    was für ein Script gibt es das die Daten aus der HTML Datei Rippt und mir eine Datenbank draus erstellt erstellt.

    also in der Form :

    Objekt/Lage: Beschreibung: Verkehrswert:Grundbuch: Ort: Termin:

    data1 data2 data3 data4 data5 data6


    Bitte um Hilfe ... tHX

  • #2
    soweit ich weiß, keines

    aber mit socket funktionen und ein bisschen regex, sollte es gehen

    Kommentar


    • #3
      mit fopen etc. kannst du die html Datei in nen String einlesen und anschliessend mit regulären Ausdrücken filtern - viel Spass
      Cocoa Entwicklertraining - Alles für die Apfelzucht

      Kommentar


      • #4
        Danke, ich habe die HTML über FOPEN geöffnet und diese Zeile ausgelesen :


        <TR><TD> DATA="2" <TR><TD VALIGN=TOP


        Ich müsste praktisch die Strings <TR><TD> und <TR><TD VALIGN=TOP löschen . wie geht das ? so das nur noch DATA="2" da steht ...

        und wie krieg ich den String DATA="2" in eine Variable ?


        Danke nochmal

        Kommentar


        • #5
          Bitte nochmals um Hilfe :


          habe die HTML über FOPEN geöffnet und diese Zeile (Beispiel) ausgelesen :


          <TR><TD> DATA <TR><TD VALIGN=TOP>


          Ich müsste praktisch die Strings <TR><TD> und <TR><TD VALIGN=TOP löschen, so dass da nur noch DATA steht

          wie geht das ?

          und wie krieg ich den String DATA in eine Variable ?

          THXX

          Kommentar


          • #6
            Guck dir mal die String funktionen an. In dem Fall sind reg. Ausdrücke wohl weniger gut - du möchtest ja Rückschlüsse auf die Position in der Tabelle ziehen. Also immer bis zum nächsten ...<td> abschneiden, dann kommt Text bis zum </td>... usw.

            Aber was hastn du eigentlich vor? Ne Website mit Versteigerungsterminen rippen, die jemand scheinbar schlecht geschützt hat Stehen die nicht auch in der Tageszeitung? Und 100% legal ist es auch nicht sich an fremdem Content zu bedienen.

            Gruss
            Cocoa Entwicklertraining - Alles für die Apfelzucht

            Kommentar


            • #7
              das ist erlaubt . hab beim Amtsgericht nachgefragt ... in welcher Tageszeitung stehen die ? die Firma Agetra macht das ja auch und immowelt etc... hab heraus gefunden das das mit dem befehl FGETSS geht ... Trotzdem THX

              Kommentar


              • #8
                naja,

                wenn du die seite schon auslesen kannst, kannst du per

                $inhalt[$index] = strip_tags($zeile);

                den inhalt jeder eingelesenen zeile von den html-tags befreien, das auslesen der daten und zuweisen an andere variablen dürfte dann ja nicht mehr das problem sein.
                Die Zeit hat ihre Kinder längst gefressen

                Kommentar


                • #9
                  aber wie springt man von zeile 1 zu Zeile 2 ?

                  Kommentar


                  • #10
                    Original geschrieben von michaelme
                    aber wie springt man von zeile 1 zu Zeile 2 ?
                    das ist halt das problem! mit strip_tags() sind alle deine "anhaltspunkte"
                    futsch. nimm dir mal ein paar einträge, versuche eine REGELMÄSSIGE
                    struktur zu erkennen und dann sind reguläre ausdrücke (regexp) mit
                    preg_match() und preg_replace() deine freunde.

                    wenn du die inhalte erstmal in einem array hast, ist das problem auch gelöst.
                    Kissolino.com

                    Kommentar


                    • #11
                      THX ... Ihr habt mir sehr geholfen

                      Kommentar


                      • #12
                        Du must auch nicht von zeile zu Zeile springen - der ganze Text der Seite wird in eine Var eingelesen $text=$text.$zeile; .

                        Das weiter oben sollte auch keine "Internetpolizeiliche Ermahnung" sein, jedem seinen Spielplatz.

                        Gruss
                        Cocoa Entwicklertraining - Alles für die Apfelzucht

                        Kommentar


                        • #13

                          THX
                          Zuletzt geändert von michaelme; 14.08.2003, 22:36.

                          Kommentar

                          Lädt...
                          X