komprimierte PDF Files Parsen

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • komprimierte PDF Files Parsen

    Gibt es die möglichkeit komprimierte PDF Files mit PHP zu parsen
    um dann einzelne Informationen heraus zu filtern?

    Habe das Netz schon abgesucht und habe nur Lösungen gefunden mit
    denen man nur unkomprimierte PDF Files parsen kann.

    Danke für eure Hilfe.

  • #2
    Was sind komprimierte PDFs? Nach welcher Methode sollen die komprimiert sein?

    Comment


    • #3
      Originally posted by pekka View Post
      Nach welcher Methode sollen die komprimiert sein?
      Es gibt PDF Dateien die man mit einem Editor öffnet und man sieht XML
      Code und es gibt Dateien da is nur Zeichensalat drin.
      Scheint ja komprimiert oder codiert zu sein.
      Meine frage ist halt gibt es wie bei XML Dateien einen Parser das man
      es mit PHP lesen und verarbeiten kann oder muß man da extra
      Programme installieren die das machen?

      Comment


      • #4
        PDFs? XML?
        Nicht, daß ich wüßte. Seit wann?
        Zeichensalat ist die Norm.
        Zeig mal so ein komprimiertes und ein unkomprimiertes.
        Und woraus schließt Du, daß die Lösungen im Netz nur mit einer Art Datei umgehen können?

        Comment


        • #5
          Originally posted by pekka View Post
          PDFs? XML?
          Nicht, daß ich wüßte. Seit wann?
          Zeichensalat ist die Norm.
          Developer Resources
          gruss Chris

          [color=blue]Derjenige, der sagt: "Es geht nicht", soll den nicht stoeren, der's gerade tut."[/color]

          Comment


          • #6
            Originally posted by MTCook View Post
            Es gibt PDF Dateien die man mit einem Editor öffnet und man sieht XML Code und es gibt Dateien da is nur Zeichensalat drin.
            Scheint ja komprimiert oder codiert zu sein.
            Das hängt einzig un alleine davon ab, womit die PDFs erstellt wurden. XML wird erst seit Acrobat 6 (?) in die Dateien geschrieben. Aber auch da ist noch Zeichensalat drin.

            Peter
            Nukular, das Wort ist N-u-k-u-l-a-r (Homer Simpson)
            Meine Seite

            Comment


            • #7
              .. und alle mir bekannten Libraries für PHP schreiben und lesen "komprimierten" Zeichensalat. Es dürfte eher Probleme geben, mit den XML-Basierten Formaten umzugehen.

              Comment


              • #8
                Originally posted by pekka View Post
                .. und alle mir bekannten Libraries für PHP schreiben und lesen "komprimierten" Zeichensalat. Es dürfte eher Probleme geben, mit den XML-Basierten Formaten umzugehen.
                kannst du mir ein paar Dir bekannte Libraries für PHP nennen?

                Danke

                Comment


                • #9
                  Open Source: FPDF
                  fpdf.de - Herzlich willkommen

                  Kommerziell: PDFLib
                  PDFlib GmbH

                  Zum Auslesen bzw. Text extrahieren (Kommandozeilen-Tool):
                  Xpdf

                  Was willst du denn machen?

                  Comment


                  • #10
                    Originally posted by pekka View Post
                    Was willst du denn machen?
                    Ich will Aufträge die immer im selben Format per Mail kommen
                    auslesen und aufarbeiten!

                    Comment


                    • #11
                      Originally posted by MTCook View Post
                      Ich will Aufträge die immer im selben Format per Mail kommen
                      auslesen und aufarbeiten!
                      Was heißt das genau? In welcher Form kommen Aufträge?

                      Comment


                      • #12
                        Ich füge mal noch das Zend_Pdf-Paket mit in die Liste ein.

                        Comment


                        • #13
                          Originally posted by pekka View Post
                          Was heißt das genau? In welcher Form kommen Aufträge?
                          Als PDF. Mit der Form meine ich das immer da steht z.B.
                          Name: Müller
                          Vorname: Hans
                          usw...

                          Comment

                          Working...