Arricciare. Controlla il reindirizzamento


8

Supponiamo di avere 3 collegamenti: link1, link2, link3. link1 reindirizza a link2 e link2 reindirizza a link3. Quindi, come vederlo con il ricciolo?

Risposte:


13

Puoi vedere le intestazioni HTML usando -I. Se il reindirizzamento è un meta-aggiornamento, dovrebbe apparire in questo modo come intestazione.

lamp@oort ~ $ curl -I http://google.com<br>
HTTP/1.1 301 Moved Permanently<br>
Location: http://www.google.com/<br>
Content-Type: text/html; charset=UTF-8<br>
Date: Thu, 21 Nov 2013 14:59:13 GMT<br>
Expires: Sat, 21 Dec 2013 14:59:13 GMT<br>
Cache-Control: public, max-age=2592000<br>
Server: gws<br>
Content-Length: 219<br>
X-XSS-Protection: 1; mode=block<br>
X-Frame-Options: SAMEORIGIN<br>
Alternate-Protocol: 80:quic

Se il reindirizzamento sta avvenendo tramite PHP, potresti rilevarlo confrontando la direzione in cui sta andando il browser e dove va effettivamente ... Ci sono un sacco di modi per farlo con Python, JS, ecc. Un progetto che potrebbe essere interessante per te è phantomjs, un browser senza testa con script.


5

Prova questo :

for link in link1 link2 link3; do
    curl -Is "$link" | awk '/Location/{print $2}'
done

O usando :

for link in link1 link2 link3; do
    printf '%s\n%s\n\n%s\n' 'HEAD / HTTP/1.1' "Host: $link" 'Connexion:close' |
    netcat $link 80 | awk '/Location/{print $2}'
done

4

Da man curl:

   -w, --write-out <format>
          Defines what to display on stdout after a completed and
          successful operation.

          <...>

          redirect_url   When an HTTP request was made without -L to
                         follow redirects, this variable will show the 
                         actual URL a redirect would take you to.
                         (Added in 7.18.2)

Quindi probabilmente curl -w "%{redirect_url}" link1ti darà il primo URL di reindirizzamento.

Forse qualcosa del genere funziona per te:

URL="http://google.com"
while [ -n "${URL}" ]
do
    echo $URL
    URL=$(curl -sw "\n\n%{redirect_url}" "${URL}" | tail -n 1)
done
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.