Si possono tralasciare i dati della ricerca perché non sono significativi?


9

Ho incontrato questa frase mentre leggevo un articolo su sciencemag.org .

Alla fine, sono state incluse le risposte di soli 7600 ricercatori in 12 paesi perché i dati rimanenti non sono stati considerati statisticamente significativi.

È questo un modo corretto di fare ricerca? Tralasciare i risultati perché non sono stati considerati statisticamente significativi?


Un lettore nota che un rapporto è disponibile all'indirizzo eurodoc.net/index.php?s=file_download&id=122 e ci rimanda specificamente alle pagine 104-5 del rapporto completo (ma non so dove sia disponibile).
whuber

1
Questo è il link per il rapporto completo.
Aaron ha lasciato Stack Overflow il

@Aaron Grazie. Per qualche ragione, il mio primo tentativo ha prodotto solo un riepilogo di 6 pagine, ma ora il collegamento funziona bene.
whuber

Risposte:


6

Nel rapporto citato nel commento di whuber, si dice a pagina 104 [pag. 114 nel pdf]:

Il sondaggio è riuscito ad attivare la partecipazione di circa 8.900 dottorandi provenienti da oltre 30 paesi ...

Quindi, tra le pagine 104-105, si dice:

Durante lo svolgimento delle procedure di pulizia dei dati, il team di esperti del sondaggio Eurodoc ha deciso di eseguire un'analisi del test di potenza. Sulla base dell'assunzione di questionari completamente compilati che si tradurranno in una distribuzione multi-normale, è stato utilizzato un test di potenza per la stima dell'intervallo di confidenza. Questo è stato fatto per testare l'accuratezza dei dati. È stato deciso di accettare un livello di errore massimo del 6% ad un intervallo di confidenza del 95%. Una perdita del 16% delle dimensioni del campionamento ha portato a un campione di 12 paesi partecipanti con 7.600 partecipanti.

Quindi non è molto chiaro esattamente perché la perdita del 16% nel campione, ma l'assunzione di risposte incomplete sia probabilmente corretta. (E puoi vedere perché il giornalista era confuso.)


5
Il paragrafo delle pagine 104-105 parla da sé nel documentare assurdità.
Frank Harrell,

13

Quella frase in realtà non ha senso ed è chiaramente in errore.

I dati non possono essere statisticamente significativi o insignificanti. Solo le relazioni tra i dati, il prodotto di test statistici, si può parlare di in questi termini.

Se la domanda è: possiamo eliminare i dati dalle nostre analisi perché l'inclusione di tali dati significa che non possiamo rifiutare l'ipotesi nulla? La risposta è - ovviamente, spero! - no . Il messaggio che hai citato è un rapporto di notizie, non un documento scientifico. Se fosse stato un articolo che è stato rivisto, non sarebbe mai entrato.

Probabilmente, i dati non sono stati inclusi perché ci sono ragioni sostanziali per non includerli. Probabilmente, come altri hanno suggerito, i dati esclusi erano incompleti o raccolti usando metodi diversi o incomparabili.


Lo spero... ;) .
FairMiles,

7

No.

Sospetto che il giornalista intendesse dire che le altre persone sono state escluse perché i sondaggi erano incompleti o internamente incoerenti.


1
è anche quello che sospettavo, ma questa frase è chiaramente fuorviante ...
sopra il

2

No, ma i giornalisti possono usare il gergo tecnico completamente senza senso.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.