Perché le statistiche sono utili quando molte cose che contano sono un colpo solo?


18

Non so se sono solo io, ma sono molto scettico sulle statistiche in generale. Posso capirlo nei giochi di dadi, nei giochi di poker, ecc. I giochi ripetuti molto piccoli, semplici e per lo più indipendenti vanno bene. Ad esempio, un atterraggio di una moneta sul suo bordo è abbastanza piccolo da accettare la probabilità che la testa o la coda di atterraggio sia ~ 50%.

Giocare a una partita di poker da $ 10 con l'obiettivo di vincere il 95% va bene. Ma cosa succede se i tuoi risparmi sulla vita intera e altro dipende dal fatto che tu vinca una vittoria o no? In che modo sapere che vinceresti nel 95% delle volte in quella situazione mi aiuterebbe? Il valore atteso non aiuta molto lì.

Altri esempi includono un intervento chirurgico potenzialmente letale. In che modo aiuta a sapere che è il 51% di sopravvivenza rispetto al 99% di sopravvivenza dati dati esistenti? In entrambi i casi, non credo che ciò che conta per me sarà quello che mi dice il dottore, e lo farei. Se i dati effettivi sono del 75%, potrebbe anche dirmi (salvo l'etica e la legge), che esiste una possibilità di sopravvivenza del 99,99999%, quindi mi sentirei meglio. In altre parole, i dati esistenti non contano se non binomialmente. Anche allora, non importa se c'è un tasso di sopravvivenza del 99,99999%, se finisco per morire da esso.

Inoltre, probabilità di terremoto. Non importa se un forte terremoto si è verificato ogni x (dove x> 100) anni in media. Non ho idea se un terremoto accadrà mai nella mia vita. Quindi perché sono anche informazioni utili?

Un esempio meno serio, diciamo, il 100% dei posti in cui sono stato che amo sono nelle Americhe, indifferente al 100% dei posti in cui sono stato in Europa e odio il 100% dei posti che ho stato in Asia. Ora, ciò non significa affatto che non troverei un posto che amo in Asia nel mio prossimo viaggio o odio in Europa o indifferente in America, solo per la natura stessa che le statistiche non catturano tutte le informazioni che bisogno e probabilmente non riuscirò mai a catturare tutte le informazioni di cui ho bisogno, anche se ho viaggiato per oltre il x% di tutti quei continenti. Solo perché ci sono incognite nell'1% di quei continenti in cui non sono stato. (Sentiti libero di sostituire il 100% con qualsiasi altra percentuale).

Capisco che non c'è modo di forzare brutalmente tutto e che devi fare affidamento sulle statistiche in molte situazioni, ma come possiamo credere che le statistiche siano utili nella nostra situazione a colpo singolo, specialmente quando le statistiche fondamentalmente non estrapolano agli eventi anomali?

Qualche idea per superare il mio scetticismo nei confronti delle statistiche?


5
(+1) Benvenuti nel nostro sito! Non sei solo tu: questa è una domanda profonda che va alla base delle statistiche.
whuber

3
L'esempio "salvavita" mescola questioni separate. In economia, un modello comune per l'avversione al rischio razionale è massimizzare l'utilità attesa, non il denaro previsto, dove l'utilità è in genere una funzione concava (sublineare) come il log (denaro). Ciò significa che le perdite costano di più rispetto a guadagni della stessa dimensione e questo effetto è maggiore per cambiamenti più grandi. Questo è molto diverso dal non credere che ci sia una differenza tra il e il , il che porta a comportamenti incoerenti e irrazionali. 99 %50%99%
Douglas Zare,

@DouglasZare sembra un'area molto interessante. Potete fornire un articolo introduttivo al tema dell'avversione al rischio individuale per quanto riguarda il risparmio dal vivo?
Steffen,

@steffen: questo materiale è trattato in molti testi di base di economia. La teoria della massimizzazione dell'utilità attesa è vista da molti come troppo semplice e insufficiente per spiegare molti fenomeni, ma è un importante punto di partenza da comprendere prima di passare a idee come la teoria della prospettiva. Qualcosa che è facilmente spiegabile dalla massimizzazione dell'utilità attesa invece della massimizzazione del denaro atteso non dovrebbe essere visto come un fallimento della teoria della probabilità. en.wikipedia.org/wiki/Expected_utility_hypothesis
Douglas Zare

Questo mi sembra un argomento importante e una discussione che potrebbe rimanere aperta. (Capirei se la gente volesse farlo in CW, comunque.)
gung - Reinstalla Monica

Risposte:


25

In primo luogo penso che potresti confondere "statistiche" che significa una raccolta di numeri o altri fatti che descrivono un gruppo o una situazione, e "statistiche" che significa la scienza dell'uso di dati e informazioni per comprendere il mondo di fronte alla variazione (altri potrebbero essere in grado di migliorare le mie definizioni). Gli statistici usano entrambi i sensi della parola, quindi non è sorprendente quando le persone li confondono.

Le statistiche (la scienza) riguardano molto la scelta delle strategie e la scelta della migliore strategia anche se possiamo applicarla solo una volta. Alcune volte quando io (e altri) insegniamo la probabilità, usiamo il classico problema di Monty Hall (3 porte, 2 capre, 1 macchina) per motivarlo e mostriamo come possiamo stimare le probabilità giocando un sacco di volte (non per i premi ) e possiamo vedere che la strategia "switch" vince i 2/3 del tempo e la strategia "stay" vince solo 1/3 del tempo. Ora se avessimo l'opportunità di giocare una volta sola sapremmo alcune cose su quale strategia offre maggiori possibilità di vincere.

L'esempio di chirurgia è simile, avrai un intervento chirurgico (o non lo farai) una sola volta, ma non vuoi sapere quale strategia va a beneficio di più persone? Se le tue scelte sono un intervento chirurgico con una probabilità maggiore dello 0% di sopravvivenza o nessun intervento chirurgico e lo 0% di sopravvivenza, allora sì, c'è poca differenza tra l'intervento chirurgico con sopravvivenza del 51% e sopravvivenza del 99,9%. Ma cosa succede se ci sono anche altre opzioni, puoi scegliere tra un intervento chirurgico, non fare nulla (che ha una sopravvivenza del 25%) o un cambiamento di dieta ed esercizio che ha una sopravvivenza del 75% (ma richiede uno sforzo da parte tua), no ti interessa se l'opzione di chirurgia ha una sopravvivenza del 51% contro il 99%?

Considera anche il medico, farà più di un semplice intervento chirurgico. Se la chirurgia ha una sopravvivenza del 99,9%, allora non ha motivo di prendere in considerazione alternative, ma se ha solo una sopravvivenza del 51%, mentre oggi potrebbe essere la scelta migliore, dovrebbe cercare altre alternative che aumentino tale sopravvivenza. Sì, anche con una sopravvivenza del 90% perderà alcuni pazienti, ma quale strategia gli dà le migliori possibilità di salvare il maggior numero di pazienti?

Questa mattina ho indossato la cintura di sicurezza durante la guida (la mia solita strategia), ma non ho avuto incidenti, quindi la mia strategia è stata una perdita di tempo? Se avessi saputo quando avrei avuto un incidente, avrei potuto risparmiare tempo solo indossando la cintura di sicurezza in quelle occasioni e non in altre. Ma non so quando avrò un incidente, quindi seguirò con la mia cintura la strategia della cintura di sicurezza perché credo che mi darà le migliori possibilità se mai avessi un incidente, anche se ciò significa perdere un po 'di tempo e lo sforzo nella percentuale elevata (si spera 100%) di volte che non vi siano incidenti.


+1 Greg Buon post! Stavo scrivendo il mio contemporaneamente a te. Potremmo sovrapporsi un po ', ma penso che entrambi avessimo cose da dire che erano proprio nel segno e non si sovrapponevano. Non sono sicuro di cosa pensi siano le statistiche. È bello che tu gli abbia dato il beneficio del dubbio. Ho adottato un approccio più arrabbiato.
Michael R. Chernick,

Ciao Greg, mi è piaciuta la tua risposta, ma posso ragionare in questo modo: la statistica (la scienza) è essa stessa una statistica, funziona per x% delle volte, (forse x alta), ma ci sono l'1% x sconosciuto / fattori casuali di cui dobbiamo sempre essere consapevoli. Dato che possiamo modellare l'ignoto in qualsiasi modo # (forse infinito), non sapremo mai x. Speriamo che questi valori anomali non si verifichino mai, ma dovremmo sempre essere consapevoli ed errare nei confronti del conservatore, specialmente se l'evento è catastrofico (es. Asteroidi, prodotti finanziari, incidenti nucleari per la società e incidenti automobilistici per uso personale). ha senso?
statskeptic,

@statskeptic, ciò che dici si applica a tutte le aree, non solo alle statistiche. In realtà si applica meno alle statistiche vere rispetto ad altri campi perché quando le statistiche sono fatte correttamente le ipotesi sono chiare. La maggior parte delle volte che le statistiche hanno fallito non sono state le tecniche, ma che sono state applicate in modo errato. In qualsiasi campo che implichi incertezza (che è praticamente qualsiasi cosa diversa dalla religione o dalla matematica pura, e anche loro ne hanno), puoi avere una risposta che è sbagliata, inutile o utilizza statistiche.
Greg Snow,

(+1) per le statistiche essendo "la scienza dell'uso di dati e informazioni per comprendere il mondo di fronte alle variazioni"
mezzo passaggio

4

Solo perché non usi le statistiche nella tua vita quotidiana non significa che il campo non ti influenzi direttamente. Quando sei dal dottore e raccomandano un trattamento rispetto all'altro, puoi scommettere che dietro quella raccomandazione c'erano molti studi clinici che utilizzavano statistiche per interpretare i risultati dei loro esperimenti.

Si scopre che il concetto di valore atteso è anche molto utile anche se non si utilizza personalmente il concetto. Il tuo esempio di scommessa sui risparmi di una vita non tiene conto di quanto tu sia avverso al rischio. Altre situazioni potrebbero essere meno avverse al rischio o in cui non vi sono esiti catastrofici. Affari, finanza, contesti attuariali e altri ne sono esempi. Forse stai emettendo una polizza assicurativa sulla casa - quindi all'improvviso sapere la probabilità che si verifichi un terremoto in un determinato periodo di tempo è molto importante.

Alla fine le statistiche sono un ottimo modo per affrontare l'incertezza. Nel tuo ultimo esempio hai raccolto alcuni dati sui luoghi che ti piace viaggiare e hai affermato che le statistiche diranno che non troverai mai un posto in Asia che ti piace. Questo è semplicemente sbagliato. Naturalmente questi dati ti faranno credere che l'Asia ha meno probabilità di avere un posto che ti piace, ma puoi impostare la tua precedente convinzione come qualsiasi cosa ti piaccia e le statistiche ti diranno come aggiornare la tua convinzione dati i nuovi dati. Inoltre, ti consente di modificare la tua convinzione in un modo di principio che ti permetterà di agire razionalmente in presenza di incertezza.


L'esempio di viaggio era solo inventato, ma l'idea è che le statistiche non catturino l'ignoto. Il tuo esempio di contesti aziendali mi ha fatto pensare all'esempio delle compagnie assicurative del WTC probabilmente ha stimato il costo / beneficio dell'assicurazione dell'edificio senza tener conto degli aerei che distruggono l'edificio, ma è quello che conta di più.
statskeptic,

+1 @ jjund3 per rispondere alle domande specifiche dei PO e per mescolare la statistica bayesiana e frequentista senza alcun conflitto.
Michael R. Chernick,

@statskeptic Il tuo punto che le statistiche non possono tenere conto di tutte le possibili incertezze è positivo. Ma non deve essere completo e perfetto per essere utile. Abbiamo conoscenza dei terroristi. Prima dell'11 settembre avevamo esempi di terroristi che si recavano in missioni suicide e avevamo esperienza con il highjacking degli aerei. Le informazioni avrebbero potuto essere messe insieme per determinare che lo schianto di un aereo nel World Trade Center era una possibilità, sebbene avremmo probabilmente valutato come una possibilità remota.
Michael R. Chernick,

Sapevamo che il World Trade Center era un obiettivo terroristico preferito. Era stato attaccato una volta in precedenza con una bomba nel seminterrato. Il fatto che la bomba non fosse abbastanza forte da causare il danno desiderato era almeno un suggerimento che la prossima volta sarebbe stato usato un metodo molto diverso. Naturalmente, come spesso detto, la vista posteriore è 20-20. Ci sono molti esempi in cui accade l'imprevisto o l'improbabile. Ma non nel caso del disastro di Challanger. Lì gli ingegneri Thiokol, anche con dati limitati, sapevano che c'erano alcuni rischi di un guasto catastrofico a causa del guasto degli O-ring a bassa temperatura.
Michael R. Chernick,

1
@statskeptic Il tuo argomento è molto simile allo scetticismo di Talb / bashing delle statistiche nel suo libro The Black Swan. Penso che molti statistici stessi abbiano incluso dei buchi nella sua argomentazione che sostanzialmente dice che le statistiche sono inutili perché non possono prevedere quell'evento raro e impensabile (l'11 settembre nel tuo esempio, il crollo del mercato azionario nel suo).
Michael R. Chernick,

1

Il mondo è stocastico, non deterministico. Se fosse deterministico, i fisici avrebbero governato il mondo e gli statistici sarebbero senza lavoro. Ma la realtà è che gli statistici sono molto richiesti in quasi tutte le discipline. Questo non vuol dire che non esiste un posto per la fisica e altre scienze, ma la statistica lavora di pari passo con la scienza ed è la base per molte scoperte scientifiche.

Abbastanza chiacchiere e fino ai dettagli. Ho lavorato negli ultimi 17 anni nel settore medico, prima nei dispositivi medici, poi nei prodotti farmaceutici e ora nella ricerca medica generale. Farmaci e dispositivi medici che migliorano la qualità della vita e spesso salvano o prolungano la vita sono sviluppati e approvati in questo paese e in tutto il mondo su base regolare. Negli Stati Uniti l'approvazione richiede prove di sicurezza ed efficacia prima che la FDA consentirà la commercializzazione di un farmaco o di un dispositivo medico. La prova per la FDA proviene da studi clinici in fasi. Tutti gli studi clinici richiedono validi metodi statistici di progettazione e analisi. Niente è perfetto. I farmaci funzionano bene per alcune persone mentre altri potrebbero non rispondere o avranno eventi avversi (reazioni negative che possono causare malattie o morte). Le prove separano i farmaci inefficaci da quelli efficaci. La maggior parte dei farmaci fallisce e spesso c'è un ciclo di dieci anni dallo sviluppo iniziale alla fine della fase III con l'approvazione e la commercializzazione alla fine della sperimentazione. La sorveglianza post-mercato che richiede anche statistiche viene quindi applicata per assicurarsi che il farmaco funzioni abbastanza bene per la popolazione generale. A volte la popolazione generale per la quale il farmaco è approvato è un gruppo meno restrittivo rispetto ai pazienti ammissibili per gli studi clinici. Quindi a volte le droghe si rivelano pericolose e vengono estratte dal mercato. Le statistiche aiutano in tutti gli aspetti della sicurezza dei farmaci. La sorveglianza post-mercato che richiede anche statistiche viene quindi applicata per assicurarsi che il farmaco funzioni abbastanza bene per la popolazione generale. A volte la popolazione generale per la quale il farmaco è approvato è un gruppo meno restrittivo rispetto ai pazienti ammissibili per gli studi clinici. Quindi a volte le droghe si rivelano pericolose e vengono estratte dal mercato. Le statistiche aiutano in tutti gli aspetti della sicurezza dei farmaci. La sorveglianza post-mercato che richiede anche statistiche viene quindi applicata per assicurarsi che il farmaco funzioni abbastanza bene per la popolazione generale. A volte la popolazione generale per la quale il farmaco è approvato è un gruppo meno restrittivo rispetto ai pazienti che erano eleggibili per gli studi clinici. Quindi a volte le droghe si rivelano pericolose e vengono estratte dal mercato. Le statistiche aiutano in tutti gli aspetti della sicurezza dei farmaci.

Le statistiche non sono perfette. Viviamo con alcuni errori dovuti a casualità e incertezza. Ma è controllato e le nostre vite sono migliori e gli errori sono ridotti da come sarebbero se la scienza statistica non fosse stata coinvolta.


Non fraintendetemi. Capisco che ci sono statistiche in tutto, anche la fisica con la meccanica quantistica è tutta una questione di probabilità, e non ci sono abbastanza atomi per fare calcoli senza statistiche. Voglio solo scoprire come affrontare la casualità e l'incertezza che possono influenzare la mia vita (o altre persone) più di qualsiasi statistica o distribuzione reale.
statskeptic,

Va bene statskeptic quindi non sei confuso. Ma perché è così difficile vedere come le statistiche migliorano le tue possibilità di successo. La teoria della probabilità ti dice le probabilità di vincere i giochi d'azzardo. Se puoi usare la strategia Beat the Dealer di Thorpe nel blackjack e hai una grande banca di fondi, puoi fare una fortuna a lungo termine. Gli studenti del MIT lo hanno dimostrato a Las Vegas anche se il vantaggio nel conteggio è stato ridotto dall'uso del missaggio di più mazzi. È vero. Il casinò sa che i contatori di carte sono una minaccia.
Michael R. Chernick,

Li cercano e quando pensano di trovarne uno lo buttano fuori dal casinò senza fare domande.
Michael R. Chernick,

Inoltre, per favore, non pensare che sto cercando di infiammare la tua professione. Ci sono computer che eseguono calcoli statisticamente per risparmiare energia, e lo rispetto. Sto solo cercando di imparare come le persone con molta più conoscenza di me nelle statistiche affrontano queste domande.
statskeptic,

@statskeptic Ho visto il mio post originale, mi scuso per i miei commenti iniziali. Sono stati giustamente modificati da un moderatore. Penso di aver frainteso quello che stavi cercando di dire. Spero di aver risposto bene alla tua domanda e di aver sollevato parte del tuo scetticismo.
Michael R. Chernick,

1

Io stesso ho gli stessi dubbi sull'utilità della probabilità e delle statistiche quando si tratta di prendere decisioni su un singolo evento. A mio avviso, conoscere la probabilità, reale o stimata, è estremamente importante quando l'obiettivo è stimare i risultati dei campioni, sia che si tratti di un singolo evento ripetuto più volte o che un campione sia annegato da una determinata popolazione. In breve, conoscere la probabilità ha più senso per il casinò che, sulla base di calcoli di probabilità, può mettere le regole che garantiscono che vincerebbe a lungo termine (dopo molti giochi) e non per un giocatore che finge di giocare una volta, quindi vincerebbe o perderebbe (questi sono i risultati quando l'esperimento viene eseguito una sola volta). È anche importante per i generali che prevedono di mandare i loro soldati in battaglia con il rischio (probabilità) di perdere il 10% di loro, ma non per un certo soldato (diciamo, John) che morirà o sopravviverà. Ci sono così tanti esempi come questi nella vita reale.

Il punto che voglio sottolineare è che, Probabilità e Statistica, non solo sono utili nella vita reale ma, più precisamente, sono uno strumento per tutte le moderne ricerche scientifiche e le regole decisionali. Tuttavia, non è corretto affermare che la razionalità implica fare affidamento sulla probabilità di un singolo evento, senza l'intenzione o la possibilità di ripeterlo, per stimare il risultato. La tendenza della probabilità di influenzare la decisione di un determinato individuo, basata sulla sua avversione al rischio, è ovviamente soggettiva. Il distaccante e l'amante del rischio hanno atteggiamenti (decisioni) diversi nei confronti della stessa lotteria (lo stesso valore atteso).


Il punto sull'avversione al rischio è interessante, in termini di come le persone reagiscono a un evento incerto. Ma si noti che quando gli economisti considerano la scelta in condizioni di incertezza (ad es. Materie prime dipendenti dallo stato del mondo), la vera probabilità entra in gioco attraverso la linea delle probabilità giuste (un vincolo di bilancio che riflette i possibili pacchetti in una scommessa attuarialmente equa). Gli agenti si comportano non solo in base alle proprie preferenze (ad es. Avversione al rischio), ma anche in base all'interazione del loro vincolo di bilancio (la scommessa disponibile) e alla valutazione della linea di probabilità equa.
Pesce d'argento

In breve, non è vero che tutte le persone avverse al rischio "non giocano mai" (nel senso più ampio del termine), solo che non possono essere tentate di giocare con probabilità attuarialmente corrette. Tuttavia, un premio di rischio sufficiente (in base al grado di avversione al rischio) può modificare tale decisione. Poiché questa analisi dipende dalla percezione da parte dell'agente delle probabili probabilità, anche su un "tiro unico" un agente razionale valuterà le probabilità.
Silverfish,

1- Non ho detto che le persone avverse al rischio non giocano mai. 2-Ciò che intendevo per "soggettivo" è che conoscere il valore atteso di una lotteria non determina l'atteggiamento di una persona nei suoi confronti. A parità di altre condizioni, questo atteggiamento è una funzione di una caratteristica personale che è il grado di avversione al rischio che determina l'utilità attesa della scommessa. 3-Razionalità nella teoria economica dipende da ipotesi e quindi è relativa. Ecco perché due individui che mostrano atteggiamenti diversi verso lo stesso valore atteso potrebbero essere entrambi chiamati "razionali".
Mohamed Lemine,

Vorrei che non perdessimo il punto centrale di questa discussione, che tratta del fatto che eventi con probabilità molto bassa possono aver luogo in qualsiasi percorso. e viceversa.
Mohamed Lemine,

-4

In sostanza, la probabilità è la generalizzazione unica della normale logica vera / falsa in gradi di credenza tra 0 e 1. Questa è la cosiddetta interpretazione logica bayesiana della probabilità, originata da RT Cox e successivamente sostenuta da ET Jaynes.

Inoltre, in base a ipotesi deboli, si può dimostrare che il modo giusto di ordinare risultati incerti in base alle preferenze è di ordinarli in base all'utilità attesa, con l'atteso assunto rispetto alla distribuzione di probabilità sugli esiti.

Vedi Robert Clemen, "Prendere decisioni difficili", per un'introduzione ed esposizione sull'analisi delle decisioni applicate che si basa sulla probabilità bayesiana e sull'utilità attesa.

Hai assolutamente ragione ad essere scettico riguardo alle statistiche dei frequentisti convenzionali; dal design dei suoi inventori (RA Fisher, J. Neyman, E. Pearson) è limitato a eventi ripetitivi. Ma molti problemi quotidiani non implicano eventi ripetitivi. Cosa fare? L'approccio tipico è una combinazione di forzare i picchetti quadrati in fori rotondi e spostare i pali della porta. Davvero vergognoso.


4
-1 Secondo me un ritratto molto scarso e ingiusto delle statistiche frequentiste. Non prenderei una visione così negativa dell'approccio bayesiano. Ma i bayesiani (qualsiasi campo) non sono liberi da critiche. Il grado di credenza è la base dell'inferenza? Il grado di convinzione è soggettivo e personale, in modo che due persone possano dare due risposte diverse? Che dire della necessità di una distribuzione precedente? Come dovrebbe essere scelto? Molte domande per qualsiasi paradigma di inferenza. Ma non stiamo oltre la fase del litigio degli ostelli sulle basi?
Michael R. Chernick,

5
C'è di più sul metodo scientifico per unirci e dire clamorosamente che STAISTICA È IMPORTANTE di fronte a uno scettico. Invece sei d'accordo con lo scettico per fare un tiro a buon mercato con metodi frequentisti! Questo è ciò che è vergognoso.
Michael R. Chernick,

@MichaelChernick: (1) semplicemente gridare STATISTICHE È IMPORTANTE non è certo un argomento che vincerà su uno scettico. (2) L'inferenza bayesiana ha la stessa relazione con i dati problematici della logica ordinaria. Cioè, date alcune premesse, tiri fuori una soluzione applicando le leggi della probabilità. I dati (ad es. Qualsiasi distribuzione precedente) non sono né giusti né sbagliati; lo sono e basta. Le persone ragionevoli non sono d'accordo sulle distribuzioni precedenti così come potrebbero su qualsiasi altro dato problematico.
Robert Dodier,

2
Non mi dispiace entrare in una discussione sulle basi. Questo non è il posto giusto e il mio unico punto per te è che penso che tu abbia fatto uno scatto economico e che la tua risposta sia stata inappropriata. Ciò non richiede una discussione sui fondamenti delle statistiche.
Michael R. Chernick,

4
Abbraccialo ragazzi.
Brandon Bertelsen,

-4

Sono scettico sulle statistiche per i seguenti motivi.

  1. Sono convinto che nessuno senza una laurea in statistica non abbia idea di cosa stiano facendo. Unf. ci sono milioni di persone in tutto il mondo che fanno ricerche senza una laurea in statistica. Sono stato laureato in matematica presso l'Università del Maryland College, Park. Ho preso 4 400 classi di matematica di livello. Tutti gli insegnanti hanno fatto è stato insegnarti come calcolare le cose. Nessuno mi ha insegnato come dare un senso a qualsiasi cosa o fare analisi statistiche ad eccezione del test di ipotesi, il che non ha senso per 2 motivi.
    1. Per ogni test di ipotesi che mi è stato insegnato, ho dovuto fare delle ipotesi in anticipo. Nessuno mi ha insegnato con quale / i presupposto / i dovevo iniziare. 2. I valori P non hanno senso logicamente. Una laurea in statistica potrebbe insegnarti quale sia il valore di una p in realtà. Tuttavia, sono convinto che nessun studente universitario sappia come usarlo. La definizione di laurea presuppone una probabilità che qualcosa che dipende dall'ipotesi sia corretta. Logicamente, la definizione non ha alcun senso. Ancora peggio, NESSUNO mi ha mai detto da dove viene la probabilità. In realtà, ho inviato un'email a quasi tutto il mio dipartimento di matematica (più di 200 persone) se qualcuno potesse darmi una risposta. Le risposte più popolari e uniche erano "si dovrebbe ASSUMERE i tassi di errore per la probabilità" (Quando ho chiesto alla gente come è stato fatto, mi hanno risposto tutti "
    La stessa cosa è successa quando ho cercato su Google quale fosse il significato di un valore ap. Mi porta alla conclusione ...

  2. Anche un sig. il numero di professori di matematica e statistica non ha idea di quale sia la logica alla base della statistica. Non mi aspetto che le persone abbiano una conoscenza approfondita. Tuttavia, ho la sensazione che anche un sig. % di ricercatori e professori non comprende nessuna delle logiche alla base delle statistiche.

  3. L'errore statistico non è la stessa cosa dell'errore reale. Poiché alla gente piace usare le statistiche per ricavare stime per cose che sono enormi, alla gente piace usare l'errore statistico per "mascherare" il fatto che non hanno idea di quale sia l'errore reale.

  4. Le persone usano piccoli campioni per grandi popolazioni perché la teoria statistica dice loro che possono. Ho imparato da uno dei miei corsi universitari che alla gente piace usare dati stimati da circa 30 scuole nel paese per dimostrare che ci sono pochi incidenti violenti nelle scuole di tutto il paese. Ci sono circa 100.000 scuole. Sembra folle. Un intero movimento popolare è basato su circa 30 scuole in tutto il paese.

  5. Alla gente piace rendere statico l'onere della prova. Higgs Bossom non fu mai scoperto. È stato scoperto statisticamente, ma questo non significa nulla. Qualcosa che viene scoperto puramente statisticamente è inutile perché nessuno conosce l'accuratezza delle statistiche.

  6. Alla gente piace usare le statistiche per prendere decisioni importanti. Le statistiche possono essere utilizzate come guida, ma nessuno sa quanto siano accurate. Solo perché un problema sembra impossibile da risolvere non significa che la statistica sia la cosa migliore da fare. Il fatto che il test del DNA si basi sulla statistica mi dà i brividi. Posso ricevere la pena di morte esclusivamente a causa delle statistiche? Un assassino potrebbe essere rilasciato dalla prigione solo per via delle statistiche?

Credo che le statistiche possano essere utili, ma solo se non vengono utilizzate come conclusione. Credo che le statistiche possano dirci quali sono alcune possibilità. Quindi la logica, non la logica statistica dovrebbe essere usata per dimostrare quali possibilità sono corrette.


1
"... inutile perché nessuno conosce l'accuratezza delle statistiche", e le tue lamentele sul trarre conclusioni da prove statistiche come un campione di scuole o DNA, suggeriscono che non ti fidi dell'inferenza statistica . Tuttavia, spesso un campione limitato è costituito da tutte le prove disponibili o da tutti i dati che è possibile acquisire. Come valutare tali prove? Affrontiamo l'incertezza, poiché il nostro campione non rifletterà esattamente la popolazione più ampia. L'inferenza affronta tale incertezza, ad esempio gli intervalli di confidenza misurano l'incertezza nelle statistiche del campione come la media del campione (approssimativamente, la "precisione" delle statistiche è nota).
Silverfish,

2
"i professori non comprendono nessuna delle logiche sottostanti alla base della statistica" - ci sono alcune filosofie radicalmente diverse della statistica (vedi ad esempio il dibattito bayesiano-frequentista) ma la maggior parte delle persone sono pragmatiche riguardo alle tecniche che applicano a un particolare problema. Questo potrebbe non essere molto interessante, se non del tutto, in un corso di laurea, ma un giorno la filosofia della statistica non è stata sicuramente elaborata a caso sul retro di una busta. Per quanto riguarda i valori p, "Logicamente, la definizione non ha alcun senso": forse dovresti consultare questa domanda sul CV .
Silverfish,

1
I rant speculativi non sono considerati risposte appropriate sui siti SE. Possono essere divertenti - e possono contenere alcune verità, come credo che questa faccia - ma alla fine muoiono tristi morti, come nella valutazione desolante della vita dell'uomo in Macbeth, Atto V, scena 5, righe 26-28 .
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.