Moin Jan,
sonst bliebe z.B. noch die Möglichkeit, dass Du Dir einen, zumindest, rudimentären Parser für
HTML, bzw. die extrahierten Texte, schreibst, und auf eine entsprechende Zeichenkombination triffst diese ersetzt.
Das dürfte zumindest schon einmal einiges schneller gehen, da die Daten sich dann in einem Durchgang umwandeln liessen.