Una pagina è stata rimossa da Google a causa di DMCA, i suoi collegamenti in entrata sono ancora preziosi?


9

Ok ecco cosa credo sia una domanda difficile:

Quindi hai un sito web in cui è stata effettuata una rimozione DMCA contro un post, che ha ricevuto un'enorme quantità di traffico, la rimozione DMCA potrebbe non essere stata corretta, ma non ho né il tempo né le risorse per combatterlo al momento.

La mia domanda, la pagina che è stata pubblicata con la rimozione DMCA da allora è stata nascosta dalla SERPS, ma il post rimane ancora sul mio blog-- perché ha ricevuto una così grande quantità di traffico che ha generato una notevole quantità di backlink di alta qualità .. .. quindi cosa succede a quei backlink, la pagina è ancora sul sito, ma rimossa (nascosta) nel database di google, i backlink hanno ancora peso ...?

MODIFICA 1: quando si esegue una ricerca su Google per il collegamento, viene visualizzato quanto segue:

In risposta a un reclamo che abbiamo ricevuto ai sensi del Digital Millennium Copyright Act degli Stati Uniti, abbiamo rimosso 1 risultato (i) da questa pagina. Se lo desideri, puoi leggere il reclamo DMCA che ha causato la / le rimozione / i su LumenDatabase.org.

EDIT 2 Il vecchio sito da cui il post ha avuto origine per mesi, e ha ancora un rel canonicalriferimento al post sul blog sul mio sito, ora pubblicato con DMCA ... Tuttavia, rel canonicalè stato ignorato da quando è stato pubblicato con DMCA anche se i rel canonicalresti puntati verso il mio sito ... per quello che vale


La tua seconda modifica mi fa pensare (lo odio). Sei l'autore originale del post ?? In tal caso, come può l'altro sito affermare che hai rubato il loro contenuto? Qualcosa da considerare.
closetnoc,

@closetnoc Ho scritto il post, era un affare in cui il mio (precedente) partner e io avevamo un sito Web, abbiamo deciso di dividere, e ho preso il mio post sul mio nuovo sito Web, ha accettato di inserire un rel canonicalmio nuovo sito per il post che ho scritto .... In breve, sono successe alcune cose: ha notato il post che ho scritto (originariamente pubblicato sul nostro dominio condiviso), ha iniziato a generare una quantità ENORME di traffico, si è inacidito e ha presentato un DMCA contro la posta, (la posta ha ricevuto oltre 100.000 condivisioni sociali ed è stata menzionata in alcune importanti pubblicazioni) Pensi che sia un plagio ... basato sulla spiegazione sopra?
Timothy Coetzee,

Plagio non è la parola. Tuttavia, se fosse stato presentato un falso reclamo DMCA, lo avrei combattuto senza esitazione. Questo è "falso giuramento" secondo la legge. È un crimine. Spiega loro cosa ci hai spiegato. Consiglierei di assumere un avvocato specializzato in diritti d'autore per scrivere una o due lettere, una cessazione e desistere dal tuo ex-partner e l'altra nel tentativo di combattere questo. Le lettere sono economiche e spesso risolvono rapidamente i problemi. Per qualsiasi motivo, quando viene coinvolto un avvocato, le persone iniziano a prendere sul serio le cose. Non significa una causa, significa solo il minimo che puoi fare per assicurarti di vincere.
closetnoc,

Risposte:


7

Va bene. Questo sarà uno di quei casi in cui lavorerò attraverso il processo in modo che diventi più chiaro. Sarà un po 'lungo, ma si spera non dolorosamente lungo.

Cominciamo dall'inizio?

A partire da ciò che sappiamo su come funziona Google basato originariamente sull'articolo di ricerca di Brin e Page nel 1997, sappiamo alcune cose che molto probabilmente sono ancora in gioco oggi.

Google ha un URL nel suo indice e recupera la coda e recupera la pagina. Il codice per la pagina è memorizzato nel suo database per varie forme di elaborazione. Uno dei processi sarebbe quello di trovare nuovi collegamenti. Qualsiasi collegamento che è stato trovato da Google verrà prima individuato nell'indice dei collegamenti, se esiste. In caso contrario, il collegamento verrà aggiunto alla tabella dei collegamenti e aggiunto alla coda di recupero.

Qualsiasi collegamento all'interno della tabella dei collegamenti contiene almeno questi elementi, l'URL del collegamento, l'URL di origine e il testo del collegamento. È probabile che vi siano altri elementi di dati, tuttavia, questi non avanzano nella discussione. Ogni collegamento aggiunto alla tabella dei collegamenti ha verificato l'URL di origine, ma non necessariamente l'URL di destinazione. Utilizzando come esempio i database relazionali, gli URL di origine e di destinazione potrebbero essere un ID URL all'interno della tabella URL e una tabella di join si unirebbe all'URL di origine della tabella di collegamento e agli elementi URL di destinazione utilizzando un ID di nuovo alla tabella URL. Confuso? Non essere.

Per ogni caso in cui la pagina di destinazione non è stata recuperata, si dice che il collegamento all'interno della tabella dei collegamenti è un collegamento pendente. Una volta recuperata la pagina, il collegamento all'interno della tabella dei collegamenti è completo. Se la pagina di destinazione non esiste, il collegamento all'interno della tabella dei collegamenti è interrotto. Semplice?

Solo i collegamenti completi possono passare valore. L'algoritmo PageRank richiede un collegamento completo per calcolare il valore. Tutti i collegamenti sospesi e interrotti interrompono i calcoli utilizzando il collegamento. In precedenza, PR era un processo ricorsivo che calcolava ripetutamente i valori dei collegamenti utilizzando la tabella dei collegamenti fino a quando il valore che può essere adattato a qualsiasi collegamento rientra in un valore numerico così piccolo che effettivamente non farà alcuna differenza. Sono sicuro che questo si verifica ancora come un processo di pulizia della casa. Tuttavia, oggi le PR vengono calcolate utilizzando un altro metodo simile agli hop in una rete che misura la distanza da una pagina all'altra con importanza relativa. Si basa sul modello di rete fiduciaria che è il modo in cui il modello originale PageRank è stato progettato per emulare. Un collegamento è un voto di fiducia da un'entità all'altra. Mentre diventa più complicato di così, ottieni la foto. Fa effettivamente la stessa cosa del processo ricorsivo usando un calcolo più in tempo reale sebbene probabilmente meno preciso ma abbastanza preciso da essere affidabile. Ciò richiede collegamenti completi poiché i valori di trust (utilizzando il modello di rete di trust) non possono essere passati se non viene stabilito il trust. Ricorda che un collegamento è un voto di fiducia o un collegamento nel modello di rete di fiducia. Il PageRank è rappresentato come valore di attendibilità in una rete di fiducia.

Ora che hai capito i collegamenti e quanto sono importanti, andiamo avanti.

Per un motore di ricerca, non ha senso rimuovere alcun URL. Se un URL non esiste nella tabella degli URL, non puoi sapere nulla sull'URL e potresti perdere. Probabilmente gli URL non vengono eliminati in genere, a meno che non abbia senso, ad esempio, se l'URL non esiste più. Tuttavia, quando una pagina è impostata su NOINDEX, al motore di ricerca è stato esplicitamente richiesto di NON indicizzare la pagina. Poiché una pagina Web all'interno dell'indice è composta da due elementi, un URL e il codice sorgente HTML, NOINDEX rimuove effettivamente la pagina a questo punto. I collegamenti a una pagina NOINDEX sono almeno sospesi.

Ora che sai come appare una pagina indicizzata, spostiamoci ulteriormente.

Esistono molti modi in cui un motore di ricerca penalizza una pagina Web o un sito. Uno è delisting. Questa è la più severa di tutte le penalità e richiede molto tempo per riprendersi. Questa categoria di penalità può essere dimostrata poiché la pagina non sarà e non potrà essere trovata. Inoltre, Googles Search Console ti farà sapere, in un certo senso, che le pagine vengono cancellate. Delle penalità rimanenti, le penalità vengono applicate nei filtri SERP.

Quando viene eseguita una query di ricerca, in realtà ci sono più query contemporaneamente sull'indice che vengono poi fuse in un set di risultati basato su una parte dell'algoritmo. L'algoritmo rimanente, che spesso chiamiamo singola entità, è una serie di algoritmi SERP relativamente semplici. I cui algoritmi primari riordineranno il set di risultati in base a più metriche in tempo reale come le tendenze. Degli algoritmi, quelli che rimuovono le voci dal set di risultati o riducono notevolmente il posizionamento di una voce all'interno del set di risultati sono chiamati filtri. Uno che viene applicato è il filtro che gestisce DMCA come evidenziato...we have removed 1 result(s) from this page...

Quindi ora che sai come vengono applicate le penalità, sono collegati link, filtri PR e DMCA?

Con questo, sappiamo che è stato applicato un filtro, tuttavia, questo non ha nulla a che fare con l'indice di collegamento che è il modo in cui viene calcolato PageRank. È il più lontano possibile dal processo di collegamento / PR. Collegamenti e PR sono all'inizio del processo di indicizzazione, mentre la rimozione della pagina penalizzata DMCA è alla fine del processo di query. In realtà, si tratta di due motori completamente separati. Pertanto, sebbene una pagina possa essere rimossa a causa di un reclamo DMCA, in realtà non viene rimossa dall'indice e pertanto i collegamenti da e verso la pagina vengono comunque calcolati.

Chiaro come fango? Spero di averlo spiegato bene. Per favore fatemi sapere se posso chiarire qualcosa per voi.

[Aggiornare]

Un'eccezione che non si applica allo scenario del PO.

@StephenOstermiller fa apparire un buon punto che non mina quanto sopra, tuttavia, vorrei aggiungerlo per completezza.

Come ben sai, il punteggio di un sito o di una pagina all'interno della ricerca richiede molti fattori. Anche se questo non è tecnico o mistico come puoi immaginare, è ancora un sacco di fattori da valutare. Ho dimenticato l'effetto dei punteggi di fiducia principalmente perché non si applicava nel caso del PO. Quindi lo sto aggiungendo qui.

Chiaramente ci sono siti che non vanno bene come i siti di spam. All'interno di questa classificazione di siti ci sono siti che abusano abitualmente di contenuti protetti da copyright. Questo è stato un grosso problema molti anni fa in cui i raschiatori di contenuti avrebbero creato siti senza il tuo duro lavoro. Per molto tempo non è stato fatto nulla. I siti con contenuti originali perderebbero i siti raschietto in modo abbastanza coerente. Dovrei saperlo. Ho avuto due siti PR 8 che hanno perso quasi tutto il traffico a causa di siti raschiatori senza ricorso.

Comunque le cose sono cambiate. E sono passati solo circa quattro anni da quando sono iniziati i cambiamenti significativi.

Per questa speciale classificazione dei siti, il punteggio di attendibilità dei siti può essere significativamente ridotto. Questo è ben noto. Ci vogliono anni per ricostruire i punteggi di fiducia e per alcuni siti, questo potrebbe non accadere mai. Perché, ad esempio, pensi che i monetizzatori di dominio siano così disposti a distruggere completamente un sito con centinaia di migliaia in attesa dietro lo stesso abuso? È perché la realtà è che un dominio può rovinare il suo valore oltre la redenzione.

Ci sono molti fattori che determinano la fiducia. Non entrerò qui. Tuttavia, sappi che la fiducia è un componente importante nella costruzione del rango per qualsiasi sito.

Detto questo, per qualsiasi sito che è un grave trasgressore del DMCA con una storia abbastanza ampia, vedrebbe bussare seriamente al suo punteggio di fiducia. Questo non è lo scenario descritto dall'OP. Tuttavia, è lo scenario che sto assumendo qui.

I collegamenti e la creazione di PageRank hanno più di un componente. Uno è PageRank (autorità) della pagina stessa. Per le pagine altamente autorevoli, esiste un limite di autorità. Una pagina PR 8 non condividerà un valore di 8 tra i collegamenti in quella pagina. Questo fa parte dell'algoritmo PageRank originale destinato a inserire una curva più naturale in PR. Altrimenti, sarebbe quasi impossibile per una nuova pagina competere con una pagina con alta autorità anche dopo un lungo periodo di tempo. Il valore del collegamento stesso viene valutato utilizzando diversi fattori tra cui il valore semantico del testo del collegamento, l'URL del collegamento, la posizione del collegamento (prominenza), il valore semantico del blocco di contenuto che contiene il collegamento, se applicabile, ecc. Tutti i collegamenti vengono segnati da 0 a .9. Il calcolo dell'autorità e del punteggio del collegamento è il valore passato da qualsiasi collegamento.

Buona e giusta. Quindi, in che modo ciò influisce su un sito che è un violatore significativo del DMCA?

Il valore di qualsiasi collegamento in entrata non verrebbe necessariamente influenzato dal punteggio di attendibilità del sito di destinazione poiché il valore dei collegamenti proviene dal sito di origine. Tuttavia, qualsiasi collegamento in uscita potrebbe essere. L'autorità di qualsiasi sito che è un abusatore DMCA significativo sarebbe influenzata dal punteggio di fiducia. Dopotutto, l'autorità viene dalla fiducia. Quindi, in questo modo, il valore di un collegamento in entrata non sarebbe passato attraverso i collegamenti in uscita senza essere degradato a seconda del punteggio di fiducia.

Questo cambia leggermente la risposta.

Sebbene non si applichi allo scenario del PO, esiste uno scenario in cui un valore di collegamento in entrata non viene completamente passato attraverso il sito con una violazione DMCA. Tuttavia, questo è un caso difficile e quindi la soglia prima che ciò accada è significativa.


grazie mille per questa risposta dettagliata ... Lo terrò aperto per qualche altro giorno per vedere cos'altro potrebbe sorgere ... Farò qualche ricerca in più e ti farò qualche domanda prima che io accetti la risposta in il giorno dopo o due se va bene - grazie ancora per aver dedicato del tempo a scrivere tutto questo
Timothy Coetzee,

Google ha respinto le richieste DMCA per essere un fattore di classifica: searchengineland.com/… Questo algoritmo ha preso di mira molte richieste DMCA anziché solo una come nel caso di questa domanda. È possibile che la svalutazione dei collegamenti alle pagine soppresse DMCA potesse far parte di tale aggiornamento dell'algoritmo. Come per la maggior parte delle cose, Google non lo sta dicendo. Non conosco neanche un buon modo per testarlo.
Stephen Ostermiller

Ma sono d'accordo con closetnoc che Google avrebbe dovuto scrivere un codice per svalutare specificamente quei collegamenti a causa di dove DMCA si adatta al processo di indicizzazione.
Stephen Ostermiller

@StephenOstermiller Sì. Mi sono dimenticato di questo. Fondamentalmente, il motore dell'indice stabilisce le metriche di classificazione, inclusi i collegamenti con il dominio e le metriche di attendibilità, mentre altre entità possono eseguire il downgrade della classifica. I filtri SERP sono dinamici. Ciò che viene menzionato nell'articolo sembra essere un'intera categoria di violazioni persistenti che degradano il grado di attendibilità dei siti. Se un sito viene messo a dura prova, è molto difficile recuperarlo. Possono volerci anni. Un grado di attendibilità dei siti può influire sul valore di un collegamento in uscita. Quando sarò più caffeinato, vedrò se riesco a dare un senso a questo nella risposta. Grazie per averlo sollevato! Saluti!!
closetnoc,

@StephenOstermiller La parte che devo pensare è se il punteggio fiducia sarà effetto il valore di un link in uscita. Immagino di sì, ma non sono ancora sicuro di come funzioni. Dovrei pensarci un po '. Certamente non influirebbe sul valore di un collegamento in entrata che posso vedere. Formica che è la parte che effettua l'OP.
closetnoc,

2

HAHA Penso di aver capito davvero a fondo questa domanda ora: /

Sei stato tu a ricevere l'avviso, il link al TUO sito è nascosto nella ricerca GOOGLE, il FILE è ancora sul TUO sito e ci sono molti ALTRI LINK che puntano al TUO sito, e QUESTI link portano peso al TUO sito quando mostrano su GOOGLE che collega al TUO sito E i LINK hanno le informazioni di avviso OMESSA nella parte inferiore della ricerca di Goggle. : P Ho ragione?

Alla luce di ciò -

Le mie risposte originali sarebbero state di grande aiuto per le persone che presentavano gli avvisi di rimozione DMCA OH! -rullo di tamburi

Quindi ecco la mia risposta: No e diavolo NO!

Questi link specifici sono sostanzialmente non attendibili e dovresti preoccuparti che rimandino comunque al tuo sito. Potresti anche fare la mossa di disconoscimento e proteggerti. Davvero.

Inoltre, dovrebbero essere gli altri proprietari di siti che dovrebbero essere più preoccupati e perché l'auditing dei tuoi backlink può essere molto importante. Una cronologia di questo tipo di associazione in cui l'autore pubblica questo tipo di collegamenti avrà effetti negativi su di essi.

Puoi prendere in considerazione la possibilità di far sapere alle altre persone che hanno collegamenti di contenuto errati che puntano a TE e che potrebbero ferirli.

Onestamente, quel tipo di contenuto non vale la pena avere per te o loro e non dovresti mai fare affidamento su quei tipi di link a beneficio del tuo SEO.

Le decisioni a breve termine possono avere effetti a lungo termine.

Mi chiedevo perché continuassi a perdere informazioni un po 'alla volta.


1
Grazie per il tuo contributo ... per favore vedi la risposta @closetnoc, credo che sia una descrizione più dettagliata e accurata, non credo che dovresti usare dissavow in questo caso. E certamente non descriverò i collegamenti come non attendibili provenienti da siti PR8 + come TheIrishTimes, nzherald ...? Ricorda anche che il dominio da cui proviene il post punta ancora rel canonicalal mio sito anche se non è più onorato a causa della notifica DMCA ...
Timothy Coetzee,

1

Domanda interessante. A mio avviso, nessuna equità verrà passata attraverso i backlink in quanto la pagina non verrà sottoposta a scansione o indicizzazione da parte di Google poiché è stata rimossa dal suo database. Credo che Google esegua comunque la scansione di pagine Web che non sono indicizzate, tuttavia non sono sicuro che ciò differisca quando una pagina è stata rimossa dal database di Google anche se è ancora sul sito.


Hai esattamente ragione. Il collegamento sarebbe un collegamento penzolante, non un collegamento interrotto, e nessun valore può davvero essere passato poiché la pagina non esisterà all'interno dell'indice. Ciò include i collegamenti dalla pagina che non è indicizzata. Alcuni affermano che queste pagine esistono anche se non vengono visualizzate nelle SERP in modo che i collegamenti possano essere calcolati. Questo potrebbe essere parzialmente vero. Solo perché una pagina non è indicizzata non significa che la pagina non sia stata recuperata e che i collegamenti non siano calcolati. Questo è ancora possibile. Tuttavia, suppongo che G non lavori così duramente e possa vivere con una pausa nella catena. Fino al dibattito.
closetnoc,

Guarda che la pagina sicuramente esiste e Googles lo sa perché se fai una ricerca esatta per te lo otterrai, In response to a complaint that we received under the US Digital Millennium Copyright Act, we have removed 1 result(s) from this page. If you wish, you may read the DMCA complaint that caused the removal(s) at LumenDatabase.org.quindi Google lo sa, quindi non è impossibile che i link possano avere un peso ....?
Timothy Coetzee,

1
@TimothyCoetzee Se riesci a trovare la pagina nelle SERP, sì, i collegamenti contano. ... abbiamo rimosso 1 risultato (i) da questa pagina ... è un suggerimento. Questo è un filtro SERP, quindi sì, la pagina esiste e i collegamenti vengono conteggiati. Saluti!!
closetnoc,

1
Perché la pagina non dovrebbe essere sottoposta a scansione? Non mi aspetto che Google interrompa la scansione dei contenuti che sono stati rimossi dal loro motore di ricerca a causa di DMCA.
Stephen Ostermiller
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.