Esistono un paio di modi diversi per rimuovere HTML tagsda un file NSStringin Cocoa.
Un modo è rendere la stringa in un NSAttributedStringe quindi prendere il testo renderizzato.
Un altro modo è usare NSXMLDocument's- objectByApplyingXSLTStringmetodo per applicare una XSLTtrasformazione che lo fa.
Sfortunatamente, l'iPhone non supporta NSAttributedStringo NSXMLDocument. Ci sono troppi casi limite e HTMLdocumenti malformati perché io possa sentirmi a mio agio usando regex o NSScanner. Qualcuno ha una soluzione a questo?
Un suggerimento è stato quello di cercare semplicemente i caratteri dei tag di apertura e chiusura, questo metodo non funzionerà tranne che per casi molto banali.
Ad esempio, questi casi (dal capitolo Perl Cookbook sullo stesso argomento) rompono questo metodo:
<IMG SRC = "foo.gif" ALT = "A > B">
<!-- <A comment> -->
<script>if (a<b && a>c)</script>
<![INCLUDE CDATA [ >>>>>>>>>>>> ]]>