Ho letto a distanza del cuoco per identificare i valori anomali che hanno un'alta influenza sulla mia regressione. Nello studio originale di Cook, afferma che un tasso di cut-off di 1 dovrebbe essere comparabile per identificare gli influenzatori. Tuttavia, vari altri studi usano o come cut-off.
Nel mio studio, nessuno dei miei residui ha una D superiore a 1. Tuttavia, se uso come valore limite , allora ci sono vari dati punti che sono considerati influenzatori. Ho deciso di verificare se la rimozione di questi punti dati avrebbe fatto la differenza per la mia regressione lineare generale. Tutti i miei IV hanno conservato il loro significato e nessun evidente cambiamento era evidente.
Devo conservare tutti i miei punti dati e utilizzare la frequenza di taglio di 1? O rimuoverli?