Esiste un semplice strumento di Bash che può eseguire rapidamente il rendering dell'HTML di base?


38

Di tanto in tanto ho bisogno di fare un semplice compito in cui ho generato HTML di base nella console. Vorrei renderlo minimamente, per rendere più facile la lettura a colpo d'occhio. Esiste un'utilità in grado di gestire il rendering HTML di base nella shell (pensate al rendering in stile Lynx - ma non a un browser reale)?

Ad esempio, a volte inserisco un watchnella mod_statuspagina di Apache :

watch -n 1 curl http://some-server/server-status

L'output della pagina è HTML con un markup minimo, che mostra nella shell come:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<html><head>
<title>Apache Status</title>
</head><body>
<h1>Apache Server Status for localhost</h1>

<dl><dt>Server Version: Apache/2.2.22 (Ubuntu) PHP/5.3.10-1ubuntu3.15 with Suhosin-Patch</dt>
<dt>Server Built: Jul 22 2014 14:35:25
</dt></dl><hr /><dl>
<dt>Current Time: Wednesday, 19-Nov-2014 15:21:40 UTC</dt>
<dt>Restart Time: Wednesday, 19-Nov-2014 15:13:02 UTC</dt>
<dt>Parent Server Generation: 1</dt>
<dt>Server uptime:  8 minutes 38 seconds</dt>
<dt>Total accesses: 549 - Total Traffic: 2.8 MB</dt>
<dt>CPU Usage: u35.77 s12.76 cu0 cs0 - 9.37% CPU load</dt>
<dt>1.06 requests/sec - 5.6 kB/second - 5.3 kB/request</dt>
<dt>1 requests currently being processed, 9 idle workers</dt>
</dl><pre>__W._______.....................................................
................................................................
................................................................
................................................................
</pre>
<p>Scoreboard Key:<br />
"<b><code>_</code></b>" Waiting for Connection,
"<b><code>S</code></b>" Starting up,
"<b><code>R</code></b>" Reading Request,<br />
"<b><code>W</code></b>" Sending Reply,
"<b><code>K</code></b>" Keepalive (read),
"<b><code>D</code></b>" DNS Lookup,<br />
"<b><code>C</code></b>" Closing connection,
"<b><code>L</code></b>" Logging,
"<b><code>G</code></b>" Gracefully finishing,<br />
"<b><code>I</code></b>" Idle cleanup of worker,
"<b><code>.</code></b>" Open slot with no current process</p>
<p />

Se visualizzato in Lynx, viene visualizzato lo stesso codice HTML come: Stato Apache (p1 di 2) Stato server Apache per localhost

   Server Version: Apache/2.2.22 (Ubuntu) PHP/5.3.10-1ubuntu3.15 with Suhosin-Patch
   Server Built: Jul 22 2014 14:35:25
     ________________________________________________________________________________________________________

   Current Time: Wednesday, 19-Nov-2014 15:23:50 UTC
   Restart Time: Wednesday, 19-Nov-2014 15:13:02 UTC
   Parent Server Generation: 1
   Server uptime: 10 minutes 48 seconds
   Total accesses: 606 - Total Traffic: 3.1 MB
   CPU Usage: u37.48 s13.6 cu0 cs0 - 7.88% CPU load
   .935 requests/sec - 5088 B/second - 5.3 kB/request
   2 requests currently being processed, 9 idle workers

_C_______W_.....................................................
................................................................
................................................................
................................................................

   Scoreboard Key:
   "_" Waiting for Connection, "S" Starting up, "R" Reading Request,
   "W" Sending Reply, "K" Keepalive (read), "D" DNS Lookup,
   "C" Closing connection, "L" Logging, "G" Gracefully finishing,
   "I" Idle cleanup of worker, "." Open slot with no current process

2
Non bashesattamente, ma controlla Xiki , lo fa e altro ancora
aarosil,

xiki sembra fantastico.
MountainX

Risposte:


50

lynxha una modalità "dump", che puoi usare con watch:

$ watch lynx https://www.google.com -dump

screenshot dell'output

Da man lynx:

   -dump  dumps  the  formatted  output  of  the default document or those
          specified on  the  command  line  to  standard  output.   Unlike
          interactive mode, all documents are processed.  This can be used
          in the following way:

          lynx -dump http://www.subir.com/lynx.html

          Files specified on the command line are  formatted  as  HTML  if
          their  names  end  with one of the standard web suffixes such as
          “.htm or “.html”.  Use the -force_html option to  format  files
          whose names do not follow this convention.

Questa domanda Ask Ubuntu ha molte più opzioni.


2
la lince è fantastica. è anche uno strumento davvero utile quando la tua connessione è pessima e devi andare a controllare un sito per qualcosa - nessuna immagine, script o CSS rende un caricamento veloce della pagina
jammypeach

12

w3mè un altro programma che ha --dumpun'opzione.

È il browser Web più popolare del backend Emacs.


8

Esistono almeno due programmi denominati html2text( 1 ) ( 2 ) che svolgono questo lavoro.


In effetti, ma - se disponibile - l'output di w3mè molto più bello esp. per i tavoli.
Suuuehgi,

5

elinksha -dumpanche la modalità

elinks -dump https://www.google.com

Vedi anche linkssu quale elinkssi basa. Lo stesso comando funziona ...
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.