Come NON usare le statistiche


15

Questa è una specie di domanda a risposta aperta, ma voglio essere chiaro. Data una popolazione sufficiente potresti essere in grado di imparare qualcosa (questa è la parte aperta) ma qualunque cosa tu impari sulla tua popolazione, quando sarà mai applicabile a un membro della popolazione?

Da quello che ho capito delle statistiche non è mai applicabile a un singolo membro di una popolazione, tuttavia, tutto a volte mi ritrovo in una discussione in cui l'altra persona va "Ho letto che il 10% della popolazione mondiale ha questa malattia" e continuo a Concludo che ogni decima persona nella stanza ha questa malattia.

Capisco che dieci persone in questa stanza non sono un campione abbastanza grande perché la statistica sia pertinente, ma apparentemente molte no.

Poi c'è questa cosa su campioni abbastanza grandi . Hai solo bisogno di sondare una popolazione abbastanza grande per ottenere statistiche affidabili. Questo, tuttavia, non è proporzionale alla complessità della statistica? Se sto misurando qualcosa che è molto raro, ciò non significa che ho bisogno di un campione molto più grande per essere in grado di determinare la rilevanza per tale statistica?

Il fatto è che metto davvero in dubbio la validità di qualsiasi giornale o articolo quando sono coinvolte le statistiche, a modo loro vengono utilizzate per creare fiducia.

Questo è un po 'di background.

Tornando alla domanda, in che modo NON puoi o non puoi usare le statistiche per formare un argomento . Ho negato la domanda perché vorrei saperne di più sulle idee sbagliate comuni riguardanti le statistiche.


2
Questa è solo una risposta molto parziale, quindi non la posterò come risposta. Hai ragione sul fatto che statistiche complesse richiedono popolazioni più grandi; ti riferisci al concetto di "gradi di libertà", che è semplicemente il numero di variabili indipendenti meno uno. Inoltre, quando si esegue qualcosa come un p-test, la soglia di rifiuto dipende dal numero di gradi di libertà oltre al valore p scelto (in genere .05).

2
Se più persone leggono Hooke Come a dire la Liars dagli statistici , forse non ci saranno altrettanti "ventose statistici", come ora abbiamo nel mondo.
JM non è uno statistico

1
Penso che potresti trarre vantaggio dal porre questa domanda su stats stackexchange - Ho segnalato la domanda, quindi forse verrà spostata lì.
Interessato

Non sapevo nemmeno che avessimo un forum dedicato all'analisi statistica.

Risposte:


2

Per trarre conclusioni su un gruppo basato sulla popolazione, il gruppo deve essere rappresentativo della popolazione e indipendente. Altri ne hanno discusso, quindi non mi soffermerò su questo pezzo.

Un'altra cosa da considerare è la non intuitività delle probabilità. Supponiamo di avere un gruppo di 10 persone indipendenti e rappresentative della popolazione (campione casuale) e che sappiamo che nella popolazione il 10% ha una caratteristica particolare. Pertanto, ciascuna delle 10 persone ha una probabilità del 10% di avere la caratteristica. L'ipotesi comune è che è abbastanza certo che almeno 1 avrà la caratteristica. Ma questo è un semplice problema binomiale, possiamo calcolare la probabilità che nessuno dei 10 abbia la caratteristica, è circa il 35% (converge a 1 / e per gruppo più grande / probabilità più piccola) che è molto più alto di quanto la maggior parte della gente indovinerebbe. C'è anche una probabilità del 26% che 2 o più persone abbiano la caratteristica.


9

A meno che le persone nella stanza non siano un campione casuale della popolazione mondiale, qualsiasi conclusione basata su statistiche sulla popolazione mondiale sarà molto sospetta. Una persona su 5 al mondo è cinese, ma nessuno dei miei cinque figli è ...


6
  1. Per indirizzare l'eccessiva applicazione delle statistiche a piccoli campioni, consiglio di contrastare con battute ben note ("Sono così eccitato, mia madre è di nuovo incinta e il mio fratellino sarà cinese." "Perché?" "Ho letto che ogni quarto bambino è cinese. ").

  2. In realtà, raccomando barzellette per affrontare tutti i tipi di equivoci nelle statistiche, vedere http://xkcd.com/552/ per correlazione e causalità.

  3. Il problema con gli articoli di giornale è raramente il fatto che trattano un fenomeno raro.

  4. Il paradosso di Simpsons viene in mente come esempio che le statistiche raramente possono essere usate senza analisi delle cause.


2
La variazione dello scherzo del "bambino cinese" che ho sentito ha avuto l'aspettativa della madre che temeva che il suo bambino potesse essere considerato un alieno illegale e quindi espulso ...
JM non è uno statistico

3

C'è un interessante articolo di Mary Gray sull'uso improprio delle statistiche nei casi giudiziari e cose del genere ...

Gray, Mary W .; Statistica e legge. Matematica. Mag. 56 (1983), n. 2, 67–81



1

Analisi statistiche o dati statistici?

Penso che questo esempio nella tua domanda si riferisca a dati statistici: "Ho letto che il 10% della popolazione mondiale ha questa malattia". In altre parole, in questo esempio qualcuno sta usando i numeri per aiutare a comunicare la quantità in modo più efficace del semplice dire "molte persone".

La mia ipotesi è che la risposta alla tua domanda sia nascosta nella motivazione di chi parla sul perché sta usando i numeri. Potrebbe essere per comunicare meglio qualche nozione o potrebbe essere per mostrare autorità o potrebbe essere per abbagliare l'ascoltatore. La cosa buona di dichiarare i numeri piuttosto che dire "molto grande" è che le persone possono confutare il numero. Vedi l'idea di Popper sulla confutazione.


0

UN

UNσ=c

UNσ

UN¬UNσ


0

Da quello che ho capito delle statistiche non è mai applicabile a un singolo membro di una popolazione

Non è vero. Dipende dall'applicazione.

Esempio: decadimento nucleare in fisica. Il tasso di decadimento definisce la probabilità di un decadimento di ogni singolo nucleo . Prendi qualsiasi nucleo e avrà esattamente la stessa probabilità di decadimento, che hai stabilito sperimentando sul campione.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.