Ho un paio di centinaia di file di codice sorgente HTML. Ho bisogno di estrarre il contenuto di un particolare <div>
elemento da ciascuno di questi file, quindi scriverò uno script per scorrere ogni file. La struttura dell'elemento è così:
<div id='the_div_id'>
<div id='some_other_div'>
<h3>Some content</h3>
</div>
</div>
Qualcuno può suggerire un metodo con cui posso estrarre il div the_div_id
e tutti gli elementi e contenuti figlio da un file usando la riga di comando di Linux?
hxselect
è più esigente riguardo al formato di input rispetto apup
. Ad esempio, sto arrivandoInput is not well-formed. (Maybe try normalize?)
ahxselect
dove lo stopup
solo analizzando.