Unter torry.net gibt es zahlreiche pdf-Komponenten.
Aber das wusstest Du sicherlich schon, ich wollt's halt nur mal der Vollständigkeit halber nochmal erwähnt haben.
Worauf ich aber eigentlich hinaus wollte :
pdf bedeutet nicht zwangsläufig, dass die Datei in irgendeinem nicht zu entziffernden Binär-Format vor liegt.
Es gibt auch pdf-Dateien, die im
ASCII-Format vorliegen mit einem Skript-ähnlichem Aufbau.
Wenn Du solche pdf's mit dem Acrobat Reader öffnest, dann merkst Du gegenüber den "normalen" pdf's im Binär-
Format keinen Unterschied, aber wenn Du da mal direkt mit einem Editor rein gehst schon ...
Und bei denjenigen pdf's, die im
ASCII-Format vorliegen, sollte das mit dem Suchen nach einem bestimmten
Wort sowieso kein Problem sein.
Schwierig wird es eben erst bei denjenigen, die im binär-Format vorliegen.
Und hierzu würde ich Dir empfehlen, dass Du Dir am besten mal den Aufbau einer pdf-Datei anschaust,
guggst Du hier :
http://www.wotsit.org/search.asp?page=2&s=text
Da gibt es dann auch eine Passage, aus der genau hervor geht, welches
ASCII-Zeichen welchem Binärcode entspricht.
Vielleicht schaffst Du es ja mit den Informationen, ein binäres pdf-File in ein (temporäres)
ASCII-File
umzuwandeln und dort kannst Du dann ohne Probleme eine
ASCII-Suche starten.
Der Aufbau einer pdf-Datei selbst ist verdammt umständlich, nichts was man sich mal eben an einem
Wochenende aneignen kann oder so ... aber solange es nur darum geht, von binär in
ASCII umzuwandeln
und dann das
ASCII-File nach irgendwas zu durchsuchen - das sollte mit einem
vertretbaren Aufwand möglich sein.