Indizierte PDF an Seite weiterleiten

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Indizierte PDF an Seite weiterleiten

    Hallo.

    In einem Webshop wird in den Artikeldetails, ebenfalls die Datails als PDF zum Download angeboten. Google indiziert ja die PDFs - was auch ok ist. Aber was quatsch für einen Webshop ist, dass die PDFs über Google direkt aufgerufen und runtergeladen werden. Das ist natürlich nicht im Sinne des Shops.

    Wie würdet Ihr das lösen, dass bei Klick auf das PDF-Dokument einer Weiterleitung auf den Artikel im Shop erfolgt, statt das PDF-Dokument aufzurufen.

    Das PDF soll nur über den Webshop runtergeladen werden können.

    Ich denke dabei an ModRewrite! Damit müsste es doch zu machen sein, oder? Ist der Referer nicht der des Shopes und kein Bot, erfolgt automatisch eine Weiterleitung zum Shop.

    Oder sollte man das über ein Skript laufen lassen.

    Danke für eure Hilfe!

  • #2
    Das PDF soll nur über den Webshop runtergeladen werden können.
    dafür reicht eine robots.txt mit den entsprechenden einträgen.

    gruß
    peter
    Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
    Meine Seite

    Kommentar


    • #3
      meinst du? kann dem nicht ganz folgen.

      ich will ja nicht das google die pdfs nicht indiziert. das soll er ja, der klick auf ein in google aufgelistetes pdf soll auf eine Seite weitergeleitet werden.

      kann mir nicht vorstellen, wie das die robots.txt machen soll. hab zum. noch nix darüber gehört bzw. gelesen.
      Ein Link wäre nicht schlecht, wenn ich mich irren sollte!

      Kommentar


      • #4
        ich will ja nicht das google die pdfs nicht indiziert.
        ach so, dann musst du mit mod_rewrite arbeiten.

        gruß
        peter
        Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
        Meine Seite

        Kommentar


        • #5
          googlebot lässt sich über user agent identifizieren. dem kannst du dann eine weiterleitung vorsetzen. dann werden diese aber auch nicht als pdf-dateien indiziert.

          es gibt aber auch andere suchmaschinen. was machst du mit ihnen?
          und was ist daran schlimm, dass pdf dateien gefunden werden?

          Kommentar


          • #6
            naja, ein liste der aktuellen bots hab ich ja.

            naja, wenn ich weiß das es ein googlebot oder ein anderer Bot ist, dass lass ich ihn den PDF ganz normal indizieren. Ist es aber kein Bot und hat nicht den Referer des Shops, dann soll eine Weiterleitung zum PDF erfolgen. So müsste es klappen.

            Naja, der Sinn ist doch ganz klar, oder?
            Wenn jemand ein Produkt sucht und auf den PDF-Link in den Suchmaschinen klickt, bekommt er zwar die Informationen mehr aber auch nicht. Ich möchte Ihne aber gern als Kunden haben, also soll er direkt zur Artikelbeschreibung auf den Shop weitergeleitet werden, wo er die gleichen Infos erhält zusätzlich aber auch gleich bestellen kann.

            Kommentar


            • #7
              Das wird wohl nicht funktionieren. Google speichert die PDFs und bietet sie auch als HTML Code an (ohne deine Kontrolle). Du könntest den Inhalt der PDF Dateien auf deine eigenen Seite für den Googlebot anzeigen lassen. In SEO-Kreisen streitet man aber darüber ob Google nicht auch ohne Googlebot die Seiten besucht und Seiten die unterschiedliche Inhalt habe herunterstuft oder aus dem Index schmeißt.
              Die Regeln | rtfm | register_globals | strings | SQL-Injections | [COLOR=silver][[/COLOR][COLOR=royalblue]–[/COLOR][COLOR=silver]][/COLOR]

              Kommentar


              • #8
                naja, wäre ich mir nicht sicher. denn der link in den ergebnissen zielt direkt auf den server.

                Kommentar


                • #9
                  Ich würde mir für diesen Fall eine php Datei anlegen, die je nach übergebenen Parameter die entsprechende PDF Datei generiert/zum Download anbietet. In dieser Datei prüfst du den Referer und den User Agent. Wenn UserAgent Googlebot/oder Browser und Referer deine Seite --> Zugriff erlauben. Falls nicht dein Referer --> auf Haupseite umleiten

                  Wäre jetzt so mein Vorschlag

                  Gruss

                  tobi
                  Gutes Tutorial | PHP Manual | MySql Manual | PHP FAQ | Apache | Suchfunktion für eigene Seiten

                  [color=red]"An error does not become truth by reason of multiplied propagation, nor does truth become error because nobody sees it."[/color]
                  Mohandas Karamchand Gandhi (Mahatma Gandhi) (Source)

                  Kommentar


                  • #10
                    Code:
                    http://66.102.9.104/search?q=cache:vHcqJKWkMvkJ:[url]www.imsdd.fraunhofer.de/de/products/FAB/test-d.pdf+test+filetype:pdf&hl=de&ct=clnk&cd=4&gl=de[/url]
                    Der Link zeigt zur Website? Das ist ein eindeutig ein Link in den Google Cache.
                    Die Regeln | rtfm | register_globals | strings | SQL-Injections | [COLOR=silver][[/COLOR][COLOR=royalblue]–[/COLOR][COLOR=silver]][/COLOR]

                    Kommentar


                    • #11
                      an sowas hätte ich auch gedacht.

                      Kommentar


                      • #12
                        Original geschrieben von tontechniker
                        Der Link zeigt zur Website? Das ist ein eindeutig ein Link in den Google Cache.
                        Das ist der Link zur von Google erstellten HTML-Version der Inhalte des PDF-Dokumentes.

                        http://www.google.de/search?hl=de&q=...hofer.de&meta= - diese Suchanfrage verlinkt aber erst mal groß direkt auf das PDF.


                        Ich halte das Vorhaben aber auch für unsinnig.
                        Wenn Google mich schon vor [PDF] "warnt", nehme ich normalerweise sowieso den nächsten Ergebnislink - da ich PDF als Format nur im absoluten "Notfall" akzeptiere. Bei mir hast du also gleich verloren, dadurch dass du das PDF indizieren lässt, statt einer normalen, problemlos nutzbaren HTML-Seite.

                        Und auf Dauer verlierst du dadurch, dass ein paar mal das Spamreport-Formular abgeschickt wird, weil Nutzer sich getäuscht fühlen, weil sie nicht das bekommen haben, was ihnen das Ergebnislisting von Google versprach - eine PDF-Datei eben.
                        I don't believe in rebirth. Actually, I never did in my whole lives.

                        Kommentar


                        • #13
                          ja, ok. im cache. aber wenn ich eine pdf in den suchergebnissen anklicke dann nicht über den cache.

                          Kommentar


                          • #14
                            Ja, finde das mit der PDF Indizierung auch quatsch. Ich werde vorschlagen, PDFs ganz von der Indizierung auszuschließen. Blöd wird es ja auch, wenn die PDF vor der eigentlichen HTML-Seite auftaucht.

                            Kommentar


                            • #15
                              Wie auch immer die Diskussion ausgeht, ein Lösungsvorschlag:

                              1. Du baust eine PHP-Datei, die die PDF-Dateien durchschleift, anstatt sie direkt zum Download anzubieten. Also nach dem Motto download.php?datei=xyz.pdf.
                              Das läßt sich mit mod_rewrite auch elegant so maskieren, daß nachher wieder "richtige" PDF-URLs dastehen, aber das ist ja nicht das primäre Thema.
                              Stichworte: header() fopen() fpassthru()

                              2. Die PHP-Datei überprüft den Referer. Ist dieser Google (bzw. nicht deine Site), wird mit header("location:xyz") auf eine andere Seite weitergeleitet. Ansonsten wird das angeforderte PDF durchgeschleift.

                              Kommentar

                              Lädt...
                              X