13. Strumenti per l'analisi dei linguaggi di markup strutturati

Python supporta una grande varietà di moduli per lavorare con varie forme di linguaggi di markup strutturati. Questi includono moduli per lavorare con lo Standard Generalized Markup Language (SGML) e l'HyperText Markup Language (HTML), e diverse interfacce per utilizzare l'eXtensible Markup Language (XML).

È importante notare che i moduli nel package xml richiedono la presenza di almeno un parser (NdT: analizzatore) XML SAX-compatibile. A partire da Python 2.3, il parser Expat è incluso in Python, in modo che il modulo xml.parsers.expat sia sempre disponibile. Si potrebbe anche volere il package aggiuntivo PyXML add-on package; questo package fornisce un set esteso di librerie XML per Python.

La documentazione per i package xml.dom e xml.sax è la definizione dei collegamenti per le interfacce DOM e SAX di Python.

HTMLParser   Un semplice parser per gestire HTML e XHTML.
sgmllib   Niente più che un analizzatore SGML necessario per analizzare il formato HTML.
htmllib   Un parser per i documenti HTML
htmlentitydefs   Definizioni generali di entità HTML.
xml.parsers.expat   Un'interfaccia Python al parser Expat non validante XML.
xml.dom   API del Modello di Oggetto Documento per Python -- DOM.
xml.dom.minidom   Implementazione minimale del Document Object Model (DOM).
xml.dom.pulldom   Supporto per la costruzione di alberi DOM parziali da eventi SAX.
xml.sax   Package che contiene classi base ed utili funzioni per SAX2.
xml.sax.handler   Classe di base per gestori di eventi SAX.
xml.sax.saxutils   Funzioni convenienti e classi da usarsi con SAX.
xml.sax.xmlreader   Interfaccia per implementazioni di parser XML SAX compatibili.
xmllib   Un parser per documenti XML.

Vedete anche:

Python/XML Libraries
Home page del package PyXML, contenente una estensione del package xml per Python.
Vedete Circa questo documento... per informazioni su modifiche e suggerimenti.