Html Agility Pack
Je viens de découvrir cette sympathique chose via Roy Osherove : il s'agit d'un parser HTML qui fourni un DOM, avec un support XPath et Xslt, et possède apparemment une assez bonne tolérance au HTML mal formé.
This is an agile HTML parser that builds a read/write DOM and supports plain XPATH or XSLT (you actually don't HAVE to understand XPATH nor XSLT to use it, don't worry...). It is a .NET code library that allows you to parse "out of the web" HTML files. The parser is very tolerant with "real world" malformed HTML. The object model is very similar to what proposes System.Xml, but for HTML documents (or streams).
[...]
There is no dependency on anything else than .Net's XPATH implementation. There is no dependency on Internet Explorer's MSHTML dll or W3C's HTML tidy or ActiveX / COM object, or anything like that. There is also no adherence to XHTML or XML, although you can actually produce XML using the tool.
Encore quelquechose qui pourrait bientôt servir et faire gagner du temps :-)
Projet CodePlex : Html Agility Pack
Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :