HTML ist ein SGML-Derivat, xHTML ist
XML und
XML ist wiederum auch ein SGML Derivat.
SGML wäre also der kleinste gemeinsame Nenner als Markup...
Ich selbst verwende unter .Net eine kleine Library, mit der ich SGML wie
XML bearbeiten kann.
Vielleicht gibt es sowas auch für Delphi32? Damit könntest du ganz easy alle Links extrahieren ohne solche Viecher wie das SHDocView Control missbrauchen zu müssen.
Nimmst du den IE, nimmst du augenblicklich Sicherheitslücken in Kauf. Selbst wenn du eigentlich nur Links extrahieren willst. Ich bezweifle, dass man ihn weit genug beschneiden kann, um auf der sicheren Seite zu bleiben...