Il concetto di "provato statisticamente"


10

Quando le notizie parlano di cose "provate statisticamente", usano correttamente un concetto di statistica ben definito, lo usano in modo sbagliato o usano semplicemente un ossimoro?

Immagino che una "prova statistica" non sia effettivamente eseguita per dimostrare un'ipotesi, né una prova matematica, ma piuttosto un "test statistico".


10
Non ci sono prove nelle statistiche tranne che le prove nelle statistiche matematiche dovrebbero seguire gli standard matematici. Tuttavia, tali prove sono irrilevanti per la tua domanda. In termini del tuo esempio, nessuno, tranne un idiota o un umorista, afferma che ogni famiglia americana ha 2,4 figli. Al massimo, l'affermazione è che, in media, le famiglie hanno 2,4 figli; che può essere verificato mediante sondaggi campione o un altro censimento, ma poiché il numero può variare o cambiare sistematicamente un risultato diverso non significa che il primo risultato sia errato; né lo stesso risultato significa che il primo risultato è stato corretto.
Nick Cox,

Risposte:


16

Ciò di cui la gente parla è che la gente indovina e varia con il telegiornale. Forse il più comune è che stanno dando un sommario di una frase di ricerca che richiede diverse pagine.

Tuttavia, il tuo ultimo paragrafo è errato. Statisticamente, ogni famiglia NON ha 2,4 figli. La media è di 2,4 bambini. Questo è del tutto possibile. Se prendi un campione casuale di famiglie americane (difficile da fare, ma possibile), otterrai una stima della media. Tuttavia, se hai preso un censimento delle famiglie, quindi, se il censimento ha davvero tutte le famiglie (non lo fa) o, se le persone che ottengono sono rappresentative delle persone che non ha ottenuto, per quanto riguarda il numero di bambini, allora avresti dimostrato il fatto.

Tuttavia, non solo il censimento manca alle persone, ma le persone che le mancano sono in molti modi diverse dalle persone che ottengono. Il Census Bureau cerca quindi di capire come sono diversi; quindi, ancora una volta, dando una stima del numero di bambini per famiglia.

Ma ci sono cose che puoi provare; se volessi sapere, diciamo, il numero medio di anni che ogni professore del tuo dipartimento aveva insegnato, potresti ottenere dati precisi e trovare una media esatta.

Anche il tuo penultimo paragrafo è problematico in quanto i test statistici vengono eseguiti proprio per dimostrare le ipotesi; più precisamente, vengono fatti (nel quadro del frequentista, comunque) per rifiutare un'ipotesi nulla a un dato livello di significato.


Ho corretto la mia domanda.
Quora Feans il

5

Penso che - come in molte altre cose - sia una combinazione di un malinteso culturale diffuso e tentativi giornalistici di abbreviazione coraggiosa che a volte risulta fuorviante.

" I telefoni cellulari causano il cancro! " Vende più annunci di alcune spiegazioni sull'indagine su un possibile collegamento.

Ovviamente le conclusioni basate sull'inferenza statistica non sono una prova in alcun senso del duro senso. Fa affidamento su ipotesi, e anche allora le conclusioni (nella migliore delle ipotesi) sono probabilistiche (come otteniamo, diciamo con l'inferenza bayesiana), e quindi con l'inferenza del frequentista devi aggiungere il solito errore di errata interpretazione dei valori di p come la probabilità che il null è vero. Questo senza nemmeno prendere in considerazione problemi come la pubblicazione o la distorsione dei rapporti

Vedi errori simili altrettanto con la scienza che riporta più in generale ed è altrettanto frustrante .

Non mi piace la frase "statisticamente provata", poiché penso che dia l'impressione sbagliata. Mentre le statistiche fatte bene sono uno strumento potente, le cose che le statistiche ci dicono in realtà possono essere sorprendentemente sottili e la discussione appropriata sul significato di ciò che viene appreso e le qualifiche di accompagnamento collocate sulle conclusioni sono spesso inadatte all'hype e alla incisività di un titolo o alcuni frettolosi paragrafi racchiusi tra i soliti pettegolezzi delle celebrità.

In effetti, anche nelle riviste accademiche in cui questo tipo di qualifiche sembrerebbero essenziali, vengono spesso lasciate da parte e invece appare un pronunciamento formulaico (diverso da area di ricerca a area di ricerca) che viene considerato "ungere" il risultato.

Penso che ci sia spazio per spiegare con attenzione il ragionamento che va dai risultati dell'inferenza (se la stima del punto e dell'intervallo, la verifica delle ipotesi, i calcoli teorici delle decisioni o persino la costruzione esplorativa di alcuni confronti visivi) alle conclusioni a cui portano. Quel ragionamento è dove si trova il vero cuore della questione (incluso dove le lacune nel ragionamento sarebbero messe a nudo, se fossero esplicite) e raramente lo vediamo esposto.

Oltre a ciò, possiamo continuare a suonare una nota di cautela


(+1) Puoi per favore rivedere tutti i miei lavori futuri?
Matt Krause,

2
Potrebbe non piacerti. Più di una volta le relazioni del mio arbitro sono finite in modo significativamente più lungo rispetto al documento originale, mentre analizzo dettagliatamente cosa c'è che non va e come risolverlo (la maggior parte delle volte solo per avere la risposta è ritagliare intere sezioni di carta piuttosto che cercare di risolvere le parti più problematiche, ma di solito più interessanti, purtroppo). Una delle mie studentesse ha avuto un rapporto similmente dettagliato sul suo lavoro da uno dei suoi arbitri; in realtà era piuttosto prezioso e ha portato a un prodotto finale molto migliore.
Glen_b -Restate Monica

-2

La conoscenza empirica è sempre probabilistica, mai chiaramente vera o falsa, ma sempre nel mezzo. La "prova" statistica consiste nel raccogliere dati sufficienti per ridurre la probabilità che un'ipotesi sia errata a una soglia inferiore a quella accettata. E la soglia per "verità" o "correttezza" differisce da una disciplina accademica alla successiva. I sociologi sono soddisfatti con una probabilità del 95% di avere ragione e talvolta si accontentano di meno; i fisici quantistici richiedono il 99,99999% o meglio.


2
Benvenuto nel sito, @Kevin Krumwiede. La tua ultima frase è ambigua. Sembra che tu stia commettendo un errore comune che fonde un valore p di <.05 (ad es.) Con una probabilità del 95% che l'ipotesi nulla sia falsa.
gung - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.