Ich selbst habe schon mit Castalia gearbeitet, das ist ein sehr einfach aufgebauter Parser, den man daher leicht um Features erweitern kann. Vor allem ist da sehr interessant, dass man alles was man nicht braucht auch einfach ignorieren kann an Elementen.
Die Dateien des Projekts sind hier zu finden:
http://code.google.com/p/castaliadel...wse/#svn/trunk