AGB  ·  Datenschutz  ·  Impressum  







Anmelden
Nützliche Links
Registrieren
Thema durchsuchen
Ansicht
Themen-Optionen

Search-Bot unter Linux

Ein Thema von moritz · begonnen am 29. Apr 2005 · letzter Beitrag vom 29. Apr 2005
Antwort Antwort
moritz

Registriert seit: 18. Apr 2003
1.037 Beiträge
 
#1

Search-Bot unter Linux

  Alt 29. Apr 2005, 13:49
Servus!

Ich beschäftige mich zur Zeit ein bisschen mit Suchmaschienen, und will jetzt einen kleinen Index-Bot schreiben. Das ganze soll auf meinem Debian-Server laufen, er braucht Zugriff auf die mySQL und auf's Netz. Ich hab noch nicht wirklich unter Linux programmiert, und weiß deswegen nicht, wo ich ansetzten soll. Soll ich den Bot in PHP schreiben? Oder doch lieber in C++? Python? Und kann ich den Bot in den Idle-Mode tun, dass er nur den CPU nimmt, der sonst nicht gebraucht wird?
Hat jemand von euch Tips für mich? Irgendwelche Links, empfehlungen?

Gruß
"Optimistisch ist diejenige Weltanschauung, die das Sein höher als das Nichts stellt und so die Welt und das Leben als etwas an sich Wertvolles bejaht."
Albert Schweitzer
  Mit Zitat antworten Zitat
tommie-lie
(Gast)

n/a Beiträge
 
#2

Re: Search-Bot unter Linux

  Alt 29. Apr 2005, 15:42
Zitat von moritz:
Soll ich den Bot in PHP schreiben?
Wenn du die Nachteile dadurch in Kauf nimmst, ja. Hat aber auch den Vorteil, daß du nicht wissen musst, wie Linux funktioniert.

Zitat von moritz:
Und kann ich den Bot in den Idle-Mode tun, dass er nur den CPU nimmt, der sonst nicht gebraucht wird?
Nennt sich Multitasking, einfach den Thread auf eine niedrige Priorität stellen. Stöber mal in den libc-Funktionen zu Threads. Wenn du das mit PHP machen willst, musst du allerdings jede Instanz des PHP-CGIs (oder den gesamten Apache, wenn PHP als Modul läuft) verringern. Wie das automatisiert geht, weiß ich nicht. Wenn du Glück hast, hat der Apache da eine Einstellung in der Konfigurationsdatei für, wenn nicht musst du tatsächlich einen "Wächter" schreiben, der Prozesse pollt und alle php-Prozesse in der Priorität erniedrigt. Dieser Wächte müsste dann vermutlich mit root-Rechten laufen, oder aber als Daemon, ich habe mich mit dem Prozess-Modell und der Rechtvergabe unter Linux noch nicht so auseinandergesetzt, daß ich dir jetzt sagen könnte, wie das geht.
  Mit Zitat antworten Zitat
moritz

Registriert seit: 18. Apr 2003
1.037 Beiträge
 
#3

Re: Search-Bot unter Linux

  Alt 29. Apr 2005, 15:45
Hast du Tipps zur Programmierung unter Linux? Ich weiß bereits, dass ich mysql bin dem mysql-befehl ansprechen und dateien mit wget runterladen kann, aber mehr....weiß ich noch ned. Evtl. mach ich es wirklich mit php bzw. shell, oder eben mit c++, aber da weiß ich eben nicht, wo ich ansetzten soll.

Gruß
"Optimistisch ist diejenige Weltanschauung, die das Sein höher als das Nichts stellt und so die Welt und das Leben als etwas an sich Wertvolles bejaht."
Albert Schweitzer
  Mit Zitat antworten Zitat
tommie-lie
(Gast)

n/a Beiträge
 
#4

Re: Search-Bot unter Linux

  Alt 29. Apr 2005, 15:53
Zitat von moritz:
Hast du Tipps zur Programmierung unter Linux?
Immer der Nase nach

Zitat:
Ich weiß bereits, dass ich mysql bin dem mysql-befehl ansprechen und dateien mit wget runterladen kann, aber mehr....weiß ich noch ned.
Das hat mit Programmierung nichts zu tun.

Mit Systemprogrammierung unter Linux habe ich noch nicht richtig angefangen, ich bringe zur Zeit GTK+ unter meine Kontrolle, der Rest kommt danach

Edit: Guck ma hier, das ist der C++-Wrapper für MySQL. Die C-Header sind laut mysql.org in der Server-Distribution enthalten und entsprechen dann den PHP-Funktionen.
  Mit Zitat antworten Zitat
Benutzerbild von mschaefer
mschaefer

Registriert seit: 4. Feb 2003
Ort: Hannover
2.032 Beiträge
 
Delphi 12 Athens
 
#5

Re: Search-Bot unter Linux

  Alt 29. Apr 2005, 18:20
Moin, moin,

also zum selbst programmieren ist das doch recht anspruchsvoll. Aber auch das Aufsetzen eines lauffähigen Harvest-Systems hat da schon einiges an Niveau und dieses arbeitet doch
professionell.

Kurz hier der Link Harvest Indexer auf Source-Forge

Viel Spaß damit // Martin
Martin Schaefer
  Mit Zitat antworten Zitat
Antwort Antwort


Forumregeln

Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks are an
Pingbacks are an
Refbacks are aus

Gehe zu:

Impressum · AGB · Datenschutz · Nach oben
Alle Zeitangaben in WEZ +1. Es ist jetzt 17:14 Uhr.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
LinkBacks Enabled by vBSEO © 2011, Crawlability, Inc.
Delphi-PRAXiS (c) 2002 - 2023 by Daniel R. Wolf, 2024 by Thomas Breitkreuz