Tipo di contenuto valido per documenti XML, HTML e XHTML


123

Quali sono i tipi di contenuto corretti per i documenti XML, HTML e XHTML?

Ho bisogno di scrivere un semplice crawler che recuperi solo questi tipi di file.

Oggigiorno http://example.net/index.html può servire ad esempio un file JPEG a causa di mod_rewrite, quindi ho bisogno di controllare il tipo di contenuto dall'intestazione della risposta e confrontarlo con un elenco di tipi di contenuto consentiti.

Da dove posso ottenere un elenco del genere?


Risposte:


206

HTML text/html:, punto.

XHTML: application/xhtml+xml, o solo se seguendo le linee guida compatbility HTML, text/html. Vedere la nota sui tipi di supporti W3 .

XML: text/xml, application/xml( RFC 2376 ).

Esistono anche molti altri tipi di media basati su XML, ad esempio application/rss+xmlo image/svg+xml. È una scommessa sicura che qualsiasi termine non riconosciuto ma registrato +xmlsia basato su XML. Consulta l' elenco IANA per i tipi di media registrati che terminano con +xml.

(Per i x-tipi non registrati , tutte le scommesse sono disattivate, ma speri +xmlche vengano rispettate.)


32
Sulle differenze tra text/xmle application/xmlvedi qui stackoverflow.com/questions/4832357/...
sanmai

Lo stesso vale per i frammenti , vedere w3.org/TR/xml-fragment o quest'altra domanda .
Peter Krauss
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.