Qualcuno ha clonato il mio blog WordPress, come posso impedire che danneggi la SEO?


8

Il mio blog WordPress è completamente clonato. Quel sito clone si aggiorna in tempo reale con il mio blog. Sono sorpreso che qualcuno possa davvero farlo.

Cosa devo fare per fermare l'impatto dannoso nel mio posizionamento nei motori di ricerca? C'è un modo per dire a Google di non indicizzare quel sito?


Vedo che ora sembra essere stato "riparato" - il sito clonato non sta più "clonando". Come hai ottenuto questo alla fine?
Mr White,

1
@ w3d Dopo due settimane e diverse conversazioni con Amazon Hosting, hanno deciso di chiudere quel sito clonato. Grazie a tutti.
Tanvir Hasan,

tieni presente che dmca.com e google.com/webmasters/tools/dmca-dashboard sono diversi quando cerchi di rivendicare una violazione.
Mostra le immagini il

Risposte:


10

Stanno semplicemente caricando il tuo sito tramite uno script lato server. Tutto quello che devi fare è bloccare l'indirizzo IP del loro server tramite .htaccess. Apri semplicemente i log di accesso del tuo server, apri la pagina clonata sul loro sito, quindi visualizza il log per la nuova voce e avrai il loro indirizzo IP.

Inoltre, non sarebbe male inviare una richiesta DMCA anche a Google, ma ciò non sarà davvero necessario in quanto tali contenuti scompariranno istantaneamente una volta bloccato il loro indirizzo IP.


2
Ho intenzione di raddoppiare il suggerimento di presentare una richiesta DMCA a Google. Stiamo assistendo a varie forme di questo ultimamente e non sono sicuro di quale sarebbe il profitto. Suggerirei, tuttavia, di non bloccarli per un periodo mentre Google fa la sua cosa, quindi li bloccherei, ma potresti non doverlo fare quando Google li elimina. Sto solo suggerendo che se inoltri un reclamo DMCA a Google, concedi loro un periodo per indagare prima di bloccare. Altrimenti bloccali subito.
closetnoc,

1
Ciao John Conde, ho provato a bloccare il loro indirizzo IP tramite il file .htaccess usando questo codice "" comando Ordina Nega, Consenti Nega da [quell'indirizzo IP] "Ma quel sito clone si sta ancora aggiornando in tempo reale con il mio. il codice giusto per bloccare quell'ip?
Tanvir Hasan,

2
@TanvirHasan Questa è l'idea giusta, a condizione che tu abbia l'indirizzo IP corretto. Quell'indirizzo IP appare ancora nel tuo registro di accesso quando visiti il ​​"sito clonato"?
Mr White,

Il mio provider di hosting ha messo questi comandi nel file .htaccess e sono quelli che ottengono quell'indirizzo IP dal registro. Ma non sta funzionando.
Tanvir Hasan,

Questo è mai stato risolto ??
closetnoc,

5

(Oltre alla risposta di @ John.)

C'è un modo per dire a Google di non indicizzare quel sito?

Piuttosto curioso che, mentre essi sembrano avere clonato tutto (compreso il vostro sitemap XML * 1 ), che non hanno clonato il file robots.txt. In effetti, il file robots.txt su quel sito blocca attivamente la scansione di tutto! Quindi non sembrerebbe esserci nulla da fare in questo senso. Fare una ricerca sul sito su quel dominio restituisce solo il dominio nudo e un avviso che indica che è bloccato da robots.txt.

(Piuttosto curioso di sapere quale sarebbe la loro intenzione nel fare questo? Potresti forse presumere che abbiano fatto un errore con robots.txt - e forse anche così - ma questo mi sembra più un'eccezione deliberata?)

Inoltre, mentre le tue Sitemap XML vengono clonate, non aggiornano gli URL in esse contenuti (come stanno facendo nelle pagine del sito principale), quindi puntano ancora al tuo sito.

* 1 Informazioni sulle Sitemap XML. Sul tuo sito "sitemap.xml" è in realtà un reindirizzamento a "sitemap_index.xml" e il sito clonato ha effettivamente clonato il reindirizzamento ... che reindirizza al tuo sito! (Sicuramente un errore da parte loro.) "Sitemap_index.xml" è solo un indice, che collega ad altre 4 sitemap. Se una di queste sitemap effettive viene richiesta direttamente sul sito clonato, viene clonata correttamente e gli URL aggiornati. Tuttavia, avrei detto che è improbabile che queste sitemap si trovino sul sito clonato a causa del reindirizzamento iniziale di "sitemap.xml". (?) Anche se se avessero inviato direttamente "sitemap_index.xml", ciò avrebbe ovviamente aggirato il reindirizzamento.


1
Ho fatto una richiesta alla mappa del sito pochi minuti fa e c'è un reindirizzamento 301 dal sito di spam al sito originale.
closetnoc,

@closetnoc Ah sì! L'ho perso prima. "sitemap.xml" è in realtà anche un reindirizzamento sul sito originale ... reindirizza a "sitemap_index.xml". Il sito di spam sembra clonare questo reindirizzamento che rimanda l'utente al sito originale! Se richiedi una delle 4 sitemap elencate in "sitemap_index.xml" direttamente sul sito di spam, il sito di spam le clona correttamente, tuttavia, a causa del reindirizzamento iniziale immagino che saranno difficili da trovare, a meno che non sappiano inviare "sitemap_index.xml" invece di "sitemap.xml". Ho aggiornato la risposta. Grazie.
Mr White,

3

Se il sito produce backlink per te, è importante utilizzare lo strumento Google Disavow, altrimenti l'algoritmo funzionerà contro di te, indipendentemente.

https://www.google.com/webmasters/tools/disavow-links-main

crea un file .txt e aggiungi:

domain:thedamnsitethatcloned.com

quindi caricalo su Google tramite Strumenti per i Webmaster.

Ecco esattamente i passaggi che vorrei prendere per risolvere questo problema. So che molti webmaster affrontano questo problema. Ho avuto questo problema prima e non sembra esserci una risposta diretta su Google (ironicamente) (motivo per cui voglio aiutare). Matt Cutts è il tipo che dovresti ascoltare su questi problemi, ma ascoltarlo è come provare a vincere una partita a scacchi contro un supercomputer all'interno di una casa in fiamme (nessun aiuto da trovare).

I tagli corti:

  1. Registrati con DMCA e metti il ​​badge sul tuo sito web.
  2. Raccogli tutto il contenuto copiato incollando le prime 60 parole dal tuo sito Web su Google e invia VIA https://www.google.com/webmasters/tools/dmca-dashboard Le richieste DMCA accettano solo permalink.
  3. Rinuncia a OGNI sito che ha copiato il contenuto che rimanda a te. Fallo su ogni pagina del tuo sito web.

La mia prima risposta è stata di rinnegare il dominio, ma ho dimenticato di dire che è necessario rinnegare:

  • www. E
  • non www.

(Google li conta come due domini separati).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.