PERL: CSV-Datei als Datenbank verwenden

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • PERL: CSV-Datei als Datenbank verwenden

    Hallo Leute,

    ich stehe vor folgendem Problem:

    Meine Aufgabe ist es mit Perl eine Datenbank in Form einer CSV-Datei zu erstellen. Das Problem ist, dass die Datei bis zu 10000 Einträgen groß werden kann. Das bedeutet, dass ich nicht jedes Mal wenn ich auf der Suche nach einem Eintrag bin die komplette Datei durchforsten kann.
    Wenn ich so im Internet rumgoogle, kommt man schnell auf Seiten die einem etwas von DBI::CSV erzählen, um damit SQL-Statements zu verwenden. Eigentlich genau das was ich suche.

    Beim Versuch das zu Installieren bekomme ich jedes Mal eine Menge Fehler, so dass ich mir NICHT möglich ist die Module zu installieren.

    Nun brauch ich eure Hilfe. Gibt es eine Möglichkeit,

    1. so etwas, ohne zusätzliche Module installieren zu müssen, zu realisieren?

    2. kann man die Module auch anders installieren als über die Kommandozeile? Zur Information: Ich benutze XAMPP und habe KEINE Adminrechte (Bevor jetzt einer kommt und sagt besorg sie dir eben: Sie sind beantragt, aber das dauert in meinem Laden eben 2 Wochen und so lange kann ich nicht warten)

    Ich danke schon mal für die Hilfe!

  • #2
    Ohne die von die beschriebene Lösung zu kennen, frage ich mal neugierig, wie denn DBI::CSV an die Daten rankommt. Werden die irgendwo zwischengespeichert, indiziert, ...? Ansonsten müsste die Lösung ja auch die komplette Datei durchforsten.

    Wenn du mir etwas über die Funktionsweise sagen kannst, könnte man vielleicht auch etwas vergleichbares finden.

    Was dein Problem mit den Rechten angeht, ist natürlich eher schlecht. Ohne Recht gehts natürlich nicht. Das mittel ist dabei egal, das Problem sind ja die Rechte.

    Kannst du nicht zum entwickeln nen eigenen Server nehmen. Dann kannst du in zwei Wochen immer noch umswitchen.

    Kommentar


    • #3
      Musst du die Datensätze jeweils live suchen oder kannst du die auch zwischenspeichern? Anders gefragt: gibt es während du liest, einen anderen Prozess, der schreibt?

      Amica
      [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
      Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
      Super, danke!
      [/COLOR]

      Kommentar


      • #4
        Ich habe es nun anders gelöst:

        Für jede Zeite in der "Datenbank-Datei" einen individuellen Schlüssel und erzeuge aus dem "Zeilen-Array" einen Hash.

        Wenn ich nun nach einem Eintrag suchen will, muss ich nur überprüfen ob die individuelle Schlüssel, den ich für den zu suchenden Eintrag erstellt habe, vorhanden ist.

        Jetzt muss ich egal wie viele Elemente ich zu suchen habe, nur noch 2 Durchläufe machen
        Zuletzt geändert von Tarlar; 14.01.2010, 16:56.

        Kommentar


        • #5
          Sowas in der Art hätte ich dir auch vorgeschlagen, wenn keine anderen Schreibzugriffe stattfinden. Wenn du das ausschließen kannst, ist deine Variante gut, wenn nicht, bekommst du ein Integritätsproblem.

          Edit: aber wieso brauchst du 2 Durchläufe?
          [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
          Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
          Super, danke!
          [/COLOR]

          Kommentar


          • #6
            Vermutlich einmal zum Hashen, oder?

            Kommentar


            • #7
              Mein Vorschlag: Einmal durchgehen, um die benötigten Indizes zu erstellen, welche die Dateiposition gleich mit speichern. Danach wird nur noch ge-fseek-t. Bringt aber, wie gesagt, nur was, wenn die Datei in der Zeit nicht geändert wird.
              [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
              Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
              Super, danke!
              [/COLOR]

              Kommentar


              • #8
                Zitat von Tarlar Beitrag anzeigen
                Meine Aufgabe ist es mit Perl eine Datenbank in Form einer CSV-Datei zu erstellen.
                SQLite Home Page
                Ist schneller und unterstützt ein brauchbares SQL-Subset.
                Dafür gibts auch einen DBI-Treiber (der allerdings Binaries installiert).

                Das Problem ist, dass die Datei bis zu 10000 Einträgen groß werden kann. Das bedeutet, dass ich nicht jedes Mal wenn ich auf der Suche nach einem Eintrag bin die komplette Datei durchforsten kann.
                Wenn ich so im Internet rumgoogle, kommt man schnell auf Seiten die einem etwas von DBI::CSV erzählen, um damit SQL-Statements zu verwenden. Eigentlich genau das was ich suche.
                Nein, suchst du nicht. Was glaubst du, auf welche Art DBD::CSV "Datenbank"-Queries durchführt?

                Da wird, wenn es nötig ist, die gesamte CSV-(Text-)Datei durchsucht. Der Unterschied zum Selbersuchen ist der, dass du ein eingeschränktes SQL dafür benutzen darfst.

                Schneller wird das nicht. IIRC wird lediglich im SQL-Parser wird ein wenig gecachet (der ist aber nicht Bestandteil des CSV-Moduls).

                Beim Versuch das zu Installieren bekomme ich jedes Mal eine Menge Fehler, so dass ich mir NICHT möglich ist die Module zu installieren.
                Schön, dass du uns diese Fehlermeldungen vorenthältst ...
                So macht das Herumraten viel mehr Spaß.

                2. kann man die Module auch anders installieren als über die Kommandozeile?
                DBD::CSV besteht aus exakt zwei Dateien. Es müssen ein paar Verzeichnisse erstellt werden und diese zwei Dateien kopiert werden.

                Dann bringst du dem Perl-Script, mit dem du arbeitest, bei, dass es DBI-Driver auch in diesen Unterverzeichnissen zu suchen hat. Das sollte genügen.

                Zur Information: Ich benutze XAMPP und habe KEINE Adminrechte (Bevor jetzt einer kommt und sagt besorg sie dir eben: Sie sind beantragt, aber das dauert in meinem Laden eben 2 Wochen und so lange kann ich nicht warten)
                XAMPP und Adminrechte beantragen? Arbeitet dein Perl auf einem Windows-Server?
                (Dafür sollten sich fertige Pakete von ActiveState auftreiben lassen.)

                Um ein paar Text-Dateien in ein Verzeichnis zu kopieren, benötigt man keine Adminrechte.
                Klingon function calls do not have “parameters”‒they have “arguments”‒and they always win them!

                Kommentar


                • #9
                  But dear i think each Page In the "database file" and create an individual key from the "line array" a hash If I want to search for an item, I need to check only if the individual key I created for the entry to be searched, is present....!!!testking practice test questions and download testking practice test questions and download
                  640-722 practice tests 640-722 practice tests
                  70-649 practice tests 70-649 practice tests
                  220-701 practice tests 220-701 practice tests
                  Zuletzt geändert von jhonsmith; 13.02.2013, 06:17.
                  pimsleurreview.net http://www.pimsleurreview.net/
                  hostseeq http://www.hostseeq.com/
                  internet_marketing http://www.hostseeq.com/c/internet_marketing.htm
                  web_design http://www.hostseeq.com/c/web_design.htm
                  domain_registration http://www.hostseeq.com/c/domain_registration.htm

                  Kommentar


                  • #10
                    Zitat von jhonsmith Beitrag anzeigen
                    But dear i think each Page In the "database file" and create an individual key from the "line array" a hash If I want to search for an item, I need to check only if the individual key I created for the entry to be searched, is present....!!!
                    Yeah nice, but there is a subtle difference between retrieving an item from a hash table by its referring key and emulating a SQL query on a very big file of CSVs. DBD::CSV doesn't exist without a reason.

                    Happy New Year to you as well!
                    Zuletzt geändert von fireweasel; 01.01.2013, 13:41.
                    Klingon function calls do not have “parameters”‒they have “arguments”‒and they always win them!

                    Kommentar

                    Lädt...
                    X