Wie kann man eine externe URL nach Bildern durchsuchen?

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Wie kann man eine externe URL nach Bildern durchsuchen?

    Hallo,

    ich möchte alle IMG Tags einer Externen URL ausgeben bzw. ermitteln.
    Weiß jemand wie das geht bzw. wonach man da suchen soll oder welches Script das kann?

    Danke im Voraus!

  • #2
    Hallo,

    du schickst mit cURL eine Anfrage an den externen Server, holst das Dokument ab, lädst es in ein DomDocument-Objekt und rufst getElementsByTagName() ab.

    Gruß,

    Amica
    [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
    Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
    Super, danke!
    [/COLOR]

    Kommentar


    • #3
      ich habe folgendes Problem:
      Ich will alle geladenen Grafiken aus einer externen URL filtern und mache das aktuell so, dass ich die URL als HTML String einlese und dann die Seite nach IMG Tags und jpg, gif und png links durchsuche.. das funktioniert soweit super, nur leider nicht bei jeder URL.

      PHP-Code:
      $url "http://www.website-mit-bildern.de"

      $html file_get_contents($url); 

      preg_match_all('/((http|https):\/\/)*[-A-Za-z0-9\/.-_&#]*(.jpg|.gif|.png)/i'$html$img_array); 
      Bei manchen Webseiten, werden die Grafiken anders verlink bzw. nicht direkt verlinkt, so das ich diese so nicht ausfiltern kann.
      Gibt es eine andere Möglichkeit die von Server übergebenen Grafiken zu ermitteln und so auf die direkte URL der Grafik zuzugreifen bzw. diese dann zu filtern??

      Danke im Voraus!

      Kommentar


      • #4
        Serverseitig(!) wirst du nie wissen, welche Grafiken tatsächlich geladen wurden oder nicht. Das geht maximal wenn du direkt auf dem Client arbeitest, der die Daten läd.

        Wenn du es serverseitig machst, brachst du dort einen entsprechenden Parser, der die Webseiten (wie jeder andere Client auch) parst.

        Kommentar


        • #5
          Wenn du mit „anders verlinkt“ relative URLs meinst, diese musst du auflösen. Wenn die HTML-Seite ein base-Element mit href-Attribut hat, nimmst du das als Grundlage, ansonsten die aktuelle Adresszeile, also die URL der geladenen Seite.
          [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
          Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
          Super, danke!
          [/COLOR]

          Kommentar


          • #6
            Hier ein Beispiel.

            wenn ich die URL

            Product Detail | H&M DE

            mit meinem Script auslese, bekomme ich die meldung das kein bild vorhanden ist.

            Wenn ich diese mit Pinterest / Home auslese, wird die grafik gefunden.

            Das bild hat folgenden link:

            http://lp.hm.com/hmprod?set=key[source],value[/environment/2012/J01_1911_060R_1.jpg]&set=key[rotate],value[0]&set=key[width],value[2120]&set=key[height],value[2479]&set=key[x],value[774]&set=key[y],value[372]&set=key[type],value[FASHION_FRONT]&call=url[file:/product/large]

            wie kann ich denn z.b. hier feststellen, das dies ein bild ist?

            Kommentar


            • #7
              Über den Elementnamen. Ist es ein img, wird es wohl ein Bild sein, ist es ein a-Element, kann es alles mögliche sein. Wenn du das nicht auswerten willst, kannst du auch einfach alle URI-Referenzen in der Seite abrufen und deren Content-Type-Header auswerten, die dann immer als image/irgendwas angegeben sind.
              [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
              Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
              Super, danke!
              [/COLOR]

              Kommentar


              • #8
                ok das probiere ich mal..
                über das img tag geht leider auch nicht immer, da manche grafikel direkt im a href verlinkt sind...

                Kommentar


                • #9
                  über das img tag geht leider auch nicht immer, da manche grafikel direkt im a href verlinkt sind...
                  Dann werden die aber wohl auch nicht geladen.

                  Kommentar

                  Lädt...
                  X