Search Engine Spider invia i moduli POST?


10

Se ho contenuto dietro un modulo POST (una casella selezionata, nel mio caso) Googlebot o altri spider dei motori di ricerca saranno in grado di eseguire la scansione del contenuto dietro quel modulo?

Ad esempio, se dovessi avere 4 traduzioni di una pagina e la selezione della lingua fosse un modulo POST sullo stesso URL, che poi reindirizzasse all'URL specifico della lingua, Googlebot sarebbe in grado di eseguire la scansione delle "altre" lingue?

Risposte:


9

Googlebot può inviare moduli , ma generalmente non lo fa a meno che non sia in grado di rilevare un motivo per farlo.

Quindi dai link, se le tue traduzioni fossero AJAX e realizzate correttamente, Googlebot potrebbe benissimo inviare il modulo per vedere quali sarebbero i risultati. Tuttavia, questo comportamento (specialmente su POST) non è garantito e probabilmente dovresti usare GET per rendere le cose più accessibili ai robot.


1
@DisgruntledGoat Sei sicuro? Hai una fonte? L' articolo collegato afferma che "Per le caselle di testo, i nostri computer scelgono automaticamente le parole dal sito che ha il modulo" . L'articolo è stato scritto nel 2008, quindi forse le cose sono cambiate?
s427,

2
@ s427 Sì, hai ragione, ho cancellato il mio commento. Per i moduli GET (come una casella di ricerca) Googlebot può generare testo e inviarlo. Ci sono alcuni avvertimenti elencati lì: non inviano moduli POST, né moduli con campi password.
DisgruntledGoat

4

Bing lo fa assolutamente. Prima di dirlo di no, avrebbe inviato continuamente sia un modulo di contatto che un modulo di sondaggio. Sapevo che era Bingbot perché ho incluso $ _SERVER ['HTTP_USER_AGENT'] nelle informazioni $ _POST. Nessun altro ragno ha mai inviato quei moduli.


Come hai detto a Bing di smettere di inviare? Grazie!
Thomas Landauer,

Ho controllato HTTP_USER_AGENT per il bingbot e ho disabilitato il pulsante di invio.
nemmy,

3

Possono e fanno. Ho un semplice modulo di raccolta e-mail nella parte anteriore di un sito che sto per lanciare. Ho appena ricevuto un invio da quel modulo da IP 66.249.73.214, che è un IP di GoogleBot.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.