Hallo,
ich habe vor eine kleine regionale Suchmaschine zu starten.
Wie baut man sowas in etwa auf?
TABLE "keywords":
keyword_id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
keyword VARCHAR(255) NOT NULL,
PRIMARY KEY(keyword_id));
TABLE "index":
keyword_id INT(10) UNSIGNED NOT NULL,
url_id INT(10) UNSIGNED NOT NULL,
PRIMARY KEY(keyword_id));
TABLE "urls":
url_id INT(10) UNSIGNED NOT NULL,
url VARCHAR(255) NOT NULL,
titel VARCHAR(255) NOT NULL,
beschreibung VARCHAR(255) NOT NULL,
PRIMARY KEY(url_id));
Inhalt könnte da z.B. so sein:
TABLE "keywords":
keyword_id = 1
keyword = "php"
TABLE "index":
keyword_id = 1
url_id = 123
TABLE "urls":
url_id = 123
url = http://www.php.de
titel = "PHP Programmierung"
beschreibung = "Diese Seite..."
Also Suchstring wird in "keywords" gesucht, die entsprechende ID
ausgelesen und dann in "index" alle urls mit dieser ID gesucht.
Das dürfte soweit funktionieren oder?
Aber wie macht man dazu noch folgende Sachen:
1) Ranking/Sortierung/Gewichtung der Suchergebnisse
2) Aktualisierung einer Website?
(vor dem Spidern erst in "index" alle url_id löschen der betreffenden Website löschen?)
ich habe vor eine kleine regionale Suchmaschine zu starten.
Wie baut man sowas in etwa auf?
TABLE "keywords":
keyword_id INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
keyword VARCHAR(255) NOT NULL,
PRIMARY KEY(keyword_id));
TABLE "index":
keyword_id INT(10) UNSIGNED NOT NULL,
url_id INT(10) UNSIGNED NOT NULL,
PRIMARY KEY(keyword_id));
TABLE "urls":
url_id INT(10) UNSIGNED NOT NULL,
url VARCHAR(255) NOT NULL,
titel VARCHAR(255) NOT NULL,
beschreibung VARCHAR(255) NOT NULL,
PRIMARY KEY(url_id));
Inhalt könnte da z.B. so sein:
TABLE "keywords":
keyword_id = 1
keyword = "php"
TABLE "index":
keyword_id = 1
url_id = 123
TABLE "urls":
url_id = 123
url = http://www.php.de
titel = "PHP Programmierung"
beschreibung = "Diese Seite..."
Also Suchstring wird in "keywords" gesucht, die entsprechende ID
ausgelesen und dann in "index" alle urls mit dieser ID gesucht.
Das dürfte soweit funktionieren oder?
Aber wie macht man dazu noch folgende Sachen:
1) Ranking/Sortierung/Gewichtung der Suchergebnisse
2) Aktualisierung einer Website?
(vor dem Spidern erst in "index" alle url_id löschen der betreffenden Website löschen?)
Kommentar