Daten von anderen Webseiten in SQL-DB schreiben

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Daten von anderen Webseiten in SQL-DB schreiben

    Guten Tag,

    ich habe folgendes Problem: Gibt es eine Möglichkeit automatisiert eine umfangreiche Webseite zu durchsuchen und bestimmte Inhalte automatisch in eine SQL-Datenbank zu kopieren ?

    Zur näheren Erläuterung: Es geht um eine Seite mit einem umfangreichen News-Archiv, man wählt in einem Formular das Datum und ein Schlüsselwort und erhält eine Übersicht mit allen News vom gewählten Tag die das Schlüsselwort enthalten. Diese kann man dann einzeln anklicken und kann die komplette News lesen.

    Das Script/Programm/wasauchimmer müsste also nacheinander alle möglichen Daten mit dem Schlüsselwort durchgehen, die entsprechenden News 'anklicken' und, falls es eine serverseitige Lösung gibt, den Text in die Datenbank bzw. in einem SQL-kompatiblen Format in eine Textdatei speichern falls es für sowas Desktop-Programme gibt.

    Bevor wegen copyright gemeckert wird, die rechtlcihen Fragen sind alle geklärt und ich habe die Erlaubnis die für mich interessanten Sachen zu übernehmen, allerdings war leider niemand dazu bereit (oder in der Lage) mir einen entsprechenden DB-Dump zur Verfügung zu stellen und das alles von Hand zu machen ist reichlich mühsam

    Mich würde erstmal interessieren womit man sowas überhaupt realisieren kann (Perl, PHP ?) oder ob es da vielleicht was 'vorgefertigtes' für gibt, was ich eigentlich schon denke, schliesslich hört man ja immer von irgendwelchen Leuten die tausende Webseiten nach Mailaddys fürs Spammen durchsuchen, das muss ja so ähnlich funktionieren.

    Mit meinen Grundkenntnissen in PHP hab ich zwar schon ein bisschen rumprobiert, schliesslich werden ja zb die Variablen fürs Datum auch ganz normal an die URL drangehangen, aber ich hab keine Ahnung ob und wie man fremden Code in eigene Scripte einbinden soll um diesen dann weiter zu verarbeiten...

    ich freue mich über jeden Hinweis, suche schon lange nach einer Lösung, habe aber wohl auch nicht die richtigen Suchbegriffe benutzt...

    Vielen Dank im Voraus.

  • #2
    Möglich ist das, mit PHP (wir sind ja schließlich bei der ~-Resource) ist das ganz gut zu machen.

    Das Prinzip ist in der Tat das gleiche wie bei den Spambots, mit dem unterschied, dass du keine Mail Addies, sondern News oder was auch immer haben willst.

    Fertig wirds da nichts geben, schließlich weiß keiner, wie die Artikel/Seiten aussehen, die du durchsuchen möchtest.

    Passende Codesnippets findest du im Forum. Allerdings solltest du schon vernünftige Grundlagen beherrschen, ansonsten wirst du damit nichts anfangen können.

    RegEx sind auch ganz wichtig, aber dazu findest du Tutorials...

    Kommentar


    • #3
      Ok, schonmal danke für die Antwort. Dann werde ich mir mal meine Gedanken machen und ein paar Tutorials studieren. Ich hoffe ich kann mich nochmal melden falls ich hängenbleibe.

      Gruss
      VipeR

      Kommentar


      • #4
        Ich hoffe ich kann mich nochmal melden falls ich hängenbleibe.
        Ne! Niemals!

        Kommentar

        Lädt...
        X