Ho un file html, che contiene molti / <| ^, alcuni testi accanto alle intestazioni di immondizia, parole, ecc. Voglio estrarre alcuni testi tra una serie di lettere, come "nbsp" e una pipe "|". Perdo informazioni se utilizzo "delims = nbsp" poiché i delim le pensano come "n", "b", "s" e "p". Come devo affrontare il problema e come posso estrarre numerosi testi?
Testo di esempio:
garbage nbsp; SOME_TEXT_1 | garbage
garbage nbsp; SOME_TEXT_2 | garbage
garbage nbsp; SOME_TEXT_3 | garbage