Content Grabbing?

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Content Grabbing?

    Hi,

    hab nenn paar Probleme, und zwar gehts mir darum von der Seite

    "http://german.imdb.com/Title?0267626"

    Sämtliche Infos zu grabben wie z.B.

    Titel, Imdb Rating, Director usw.

    eben alles was so informativ zu einem Film sein kann.
    Das Problem ist, dass ich nichtmal weiß, wie ich anfangen kann, hab auch nix wirklich interessantes bei Google.de gefunden.

    Zumal ich denke, dass es auch folgende Probleme geben könnte:

    z.B. ist der Titel jedes Filmes anders, wenn ich nun den zu grabbenden Bereich festlegen würde, würde z.B. in der TITEL Zeile manchmal zuviel und manchmal zuwenig gegrabbt werden.

    Hat vielleicht jemand ne Idee (source source source) wie ich sowas anpacken könnte?

    Danke im Voraus.

    Gr33tz

  • #2
    All content on this site, unless otherwise indicated, is copyright © 1990-2002 Internet Movie Database Inc. Reproduction, distribution or transmission by any means without the prior permission of IMDb is prohibited outside the exceptions listed below
    das wäre illegal, also lass es lieber. die ausnahmen beziehen sich zumindest nicht auf das auslesen.
    Dieses Schreiben wurde automatisch erstellt und ist ohne Unterschrift gültig.

    Kommentar


    • #3
      Es geht mir hauptsächlich ums grabben, weißt du nun wie es geht oder nicht? Son sinnlos post ist echt unsinnig gewesen.

      Kommentar


      • #4
        naja, demnächst wird hier dann gefragt, wie man bomben baut oder wo man drogen kaufen kann. illegal ist illegal, auch für dich.

        ich will mich hier nicht zum moralapostel aufspielen, aber mit solchen dingen wäre ich sehr vorsichtig. ein freund von mir wurde von gewissen konkurrenten diesbezüglich (zu recht) angezeigt. die folge war eine geldstrafe im fünfstelligen bereich.
        Dieses Schreiben wurde automatisch erstellt und ist ohne Unterschrift gültig.

        Kommentar


        • #5
          oh oh was ist nur aus der PHP RESOURCE Community geworden die hier noch vor nem Jahr war. Tja hat sich viel verändert seit ich nichtmehr hier gewesen bin. Aber wenn hier noch sone Typen wie du rum rennen, dann kann man das Forum gleich schließen.

          Btw: Content Grabbing ist nicht verboten. Vielleicht von manchen pages aber nicht ALLGEMEIN. *tz*

          Kommentar


          • #6
            ich kann dir da helfen, hab selber von n paar pages links usw gegrabt, aber alles im legalen bereich,
            was du mir der info anstellst ist deine sache
            meld dich bei mir...

            edit: solange du die gegrappte infos für dich behehlts isses ja nicht anderes als auf imdb du gehen und select all copy, paste zu machen...
            Zuletzt geändert von Campus; 30.07.2002, 00:24.
            meine Projekte bestaunen: http://www.kleiza.de

            Kommentar


            • #7
              content grabbing ist immer dann verboten, wenn es nicht ausdrücklich erlaubt ist.

              du scheinst dich im übrigen ja sehr für das forum hier interessiert zu haben. hab mir mal eben deine beiträge (ganze 35, in einem jahr ) so angeschaut, alles nur fragen - hut ab.
              Dieses Schreiben wurde automatisch erstellt und ist ohne Unterschrift gültig.

              Kommentar


              • #8
                Also ob es erlaubt ist oder nicht spielt doch keine Rolle. Er will halt aus einem HTML Dokument etwas auslesen.


                Also um deine Frage zu beantworten. Ich würd über das DOM Object direkt die passenden Tags raussuchen oder wenn man eine Struktur erkennen kann im HTML Evtl. sogar nen Regex ansetzen um mir das ganze aufbereitet anzuschauen.


                P.S. HTML ist in gewisser weise nix anderes als XML also behandelt es doch einfach so.
                -- Bat[e] / pixelcore.com

                Kommentar


                • #9
                  Ok,danke für die Antworten, hat mich schon nenn bissel weiter gebracht

                  Thx

                  Kommentar

                  Lädt...
                  X