WordPress con SOFT 404 in Google Search Console (WMT) Quali sono le cause Q82019309.com?


8

Il sito dei miei fratelli che ho progettato per lui ha centinaia di SOFT 404 segnalati nella Search Console di Google precedentemente denominata Strumenti per i Webmaster. Generalmente trovo facile il fissaggio del soft 404 ma questo mi ha lasciato un po 'perplesso. Tutti gli errori software restituiscono una stringa dispari che contiene Q82019309.comcon la sottocartella occasionale Aristocratall'interno della stringa /?=.

I 404 sembrano generalmente qualcosa del tipo:

  • codificato: /search/%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Decoded: /search/大奖总代Q82019309.com

Il collegamento dalle informazioni fornisce:

  • codificato: /?s=%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Decoded: /?s=大奖总代Q82019309.com

All'inizio credevo che si trattasse di un problema isolato, ma dopo un'indagine ho scoperto che questo problema riguarda effettivamente migliaia di siti Web e qualcuno deve conoscerne la causa. Quando ho Google Q82019309.com WordPress o Aristocrat Q82019309.com, sono sopraffatto dalla quantità di risultati, inclusi alcuni siti di grande reputazione come:

Domande):

Quindi cosa sta causando questi morbidi errori 404 con stringa Q82019309.comcon o senza Aristocrat.


Il tuo sito è stato violato. Q82019309.com è compromesso.
closetnoc,

Accedere al sito Q82019309.com afferma che si tratta di un sito di attacco e sono d'accordo che non è facile, ma trovo difficile credere che tutti questi siti siano stati hackerati con qualcosa che utilizza una stringa di query nella ricerca. Ci sono letteralmente centinaia di migliaia di siti Web che riportano Q82019309.com ... quelli di grande reputazione ... sicuramente questi non sono tutti hackerati?
Simon Hayter

I collegamenti sembrano essere tutti spam. Un profilo molto tipico. Inoltre, questo sembra essere specifico per i siti WP. Questo sembra essere abbastanza recente, in pochi giorni (circa 4). Controlla l'installazione di WP per assicurarti che tutto sia aggiornato. Vedi: web.nvd.nist.gov/view/vuln/…
closetnoc

È stato scoperto più di una settimana fa il 13.
Simon Hayter

Pensa che dovrò consultare il file errors.log e Access.logs per identificare se qualcuno ha tentato o è entrato tramite un nuovo hack.
Simon Hayter

Risposte:


2

Abbiamo riscontrato lo stesso problema su wisepops.com dal 3 gennaio 2017.

Google si lamenta di Soft 404 anche se l'indicizzazione è disabilitata su queste pagine. La pagina di ricerca di Wordpress ha di default questo meta:

<meta name="robots" content="noindex,follow">

Ho deciso di fare in modo che le pagine di ricerca senza risultati restituiscano un codice HTTP 404. Poiché la query di ricerca si trova nell'URL, è consigliabile gestirla in questo modo.

Per Wordpress, ho aggiunto alla fine delle funzioni.php del mio tema:

/*---------------------------------------------------*/
/*  SEARCH PAGES WITHOUT RESULTS SEND 404 HTTP CODE  */
/*---------------------------------------------------*/
function wisepops_search_404_code() {
    if (is_search() && !have_posts()) {
        header($_SERVER['SERVER_PROTOCOL'] . ' 404 Not Found');
        $GLOBALS['wp_query']->is_404 = true;
    }
}
add_action('get_header', 'wisepops_search_404_code');

@ wisepops.com: ho lo stesso problema con questo stupido attacco Search-Spam. Grazie per il codice! Ha funzionato benissimo per me! Ora la ricerca vuota restituisce un 404 pulito ed è bello. Cordiali saluti, Mitschu
Mitschu

Questo invierebbe un utente reale che effettua una ricerca e ottiene zero risultati anche su una pagina 404?
brandozz,

1

Mi sembra che qualcosa si colleghi alla funzionalità di ricerca del tuo sito con query errate. Quelle query di ricerca ottengono "nessun risultato trovato". Googlebot sta trovando quei collegamenti e stai permettendo a Googlebot di eseguire la ricerca per indicizzazione del tuo sito. A causa del "nessun risultato", Google li sta rilevando come "soft 404".

Consentire a Google di eseguire la scansione dei risultati di ricerca del tuo sito è un grande no-no. Può far penalizzare l'intero sito da parte di Google. Vedi Matt Cutts: Risultati della ricerca nei risultati di ricerca . Dovresti impedire tutta la ricerca per indicizzazione dei risultati di ricerca utilizzando robots.txt :

Disallow: /search
Disallow: /?s=

Quindi Googlebot non eseguirà la scansione di tali URL e non segnalerà errori.


Stephen, questo ha fatto rivivere i morbidi 404? Ho effettivamente aggiunto questo al mio robots.txt e contrassegnato tutti i miei morbidi 404 nella pagina di ricerca come riparati. Una volta verificato, lo contrassegnerò come corretto. Ma questa sembra essere la soluzione migliore.
brandozz,

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.