ich würde es folgendermaßen machen : den OCR Text in einer Textdatei speichern und den Namen dieser Datei in der Datenbank. Selbst ohne Datenbank könnte man dann mit grep o.ä. etwas finden. Ich hatte mal das Problem, daß einer zu blöd war, sinnvolle Dateinamen zu vergeben. Jetzt hat er ein Programm, das diesen einfach hochzählt und automatisch einen leeren Text in Word läd. Seit das fertig ist hat er sich keinen Text mehr überschrieben.
Das könnte man doch so ungefähr mit Deiner Problematik kombinieren. Nur OCR-Software ?