Quali sono i pregiudizi più comuni che le persone fanno quando raccolgono o interpretano i dati?


39

Sono un econ / stat major. Sono consapevole che gli economisti hanno cercato di modificare le loro ipotesi sul comportamento umano e sulla razionalità identificando le situazioni in cui le persone non si comportano razionalmente. Ad esempio, supponiamo che io offra una probabilità del 100% di una perdita di $ 1000 o una probabilità del 50% con una perdita di $ 2500, le persone scelgono l' opzione $ 2500 anche se il valore atteso di quest'ultimo è una perdita maggiore di un $ 1000 garantito perdita. Questo è noto come "avversione alla perdita". Gli economisti comportamentali ora studiano questi schemi e cercano di identificare i modi in cui gli esseri umani si discostano dagli assiomi normalmente considerati come comportamenti "razionali". Qui, presumo che sia razionale preferire la perdita meno attesa.

Mi chiedevo se gli statistici hanno identificato modelli comuni nella raccolta dei dati che producono risultati distorti nel modo in cui le persone interpretano i dati. Se esistesse essenzialmente un modo "razionale" per raccogliere dati, suppongo ci siano esempi in cui gli umani si discostano da questo e mostrano "pregiudizi". In tal caso, quali sono i pregiudizi più comuni che le persone fanno quando raccolgono o interpretano i dati?


5
C'è un ottimo articolo di Podsakoff et al. che esamina i pregiudizi del metodo comune e propone rimedi statistici e procedurali: ln.edu.hk/mkt/staff/gcui/CommonMethodBias.pdf Dai un'occhiata alla tabella 2.
ayhan,


10
Hai una presunzione irrazionale di irrazionalità. Non si riesce ad applicare una funzione di utilità al risultato. Nel tuo esempio dichiarato, supponi che la persona abbia $ 1000 e debba usarlo per rimborsare un prestito a un gangster tra un minuto o verrà ucciso dal gangster. La probabilità del 100% di una perdita di $ 1000 comporta una probabilità del 100% di essere ucciso, mentre la probabilità del 50% di una perdita di $ 2500 comporta solo il 50% di possibilità di essere ucciso. Come maggiore economico, dovresti essere in sintonia con l'utilità come punto di partenza prima di dichiarare l'irrazionalità.
Mark L. Stone,

3
Gli statistici in genere non fanno quel tipo di ricerca. Mi chiedo se questo Q sia più appropriato per il sito di Psychology & Neuroscience SE.
gung - Ripristina Monica

3
Penso che l' effetto lampione - cercare i tasti persi (dati) sotto il lampione perché è lì che la luce è di notte - è estremamente comune, soprattutto ora, con così tanti dati facili da toccare. // Non esiste un "modo razionale" per raccogliere dati perché tu - il ricercatore che li raccoglie - non è randomizzato.
AS

Risposte:


23

Penso che in ambito accademico i valori di p siano comunemente interpretati erroneamente. Le persone tendono a dimenticare che il valore p esprime una probabilità condizionata. Anche se un esperimento è stato condotto perfettamente e tutti i requisiti del test statistico prescelto sono soddisfatti, il tasso di falsa scoperta è in genere molto più alto del livello di significatività alfa. Il tasso di false scoperte aumenta con una diminuzione del potere statistico e della prevalenza di veri positivi (Colquhoun, 2014; Nuzzo, 2014).

Inoltre le persone tendono a considerare le loro stime come la verità e il parametro che stimano casuali (Haller & Kraus, 2002). Ad esempio, quando affermano che nel "95% dei casi questo intervallo di confidenza identificato copre il parametro" ...

La confusione di correlazione e causalità è probabilmente anche un errore molto comune nell'interpretazione dei dati.

In termini di raccolta dei dati, penso che un errore comune sia quello di prendere il campione più facilmente accessibile piuttosto che il più rappresentativo.

Colquhoun, D. (2014). Un'indagine sul tasso di scoperta falsa e sull'interpretazione errata dei valori di P. Royal Society Open Science, 1–15.

Nuzzo, R. (2014). Errori statistici: i valori di P, il "gold standard" della validità statistica non sono così affidabili come molti scienziati ritengono. Natura, 506, 150–152.

Haller, H. & Kraus, S. (2002): interpretazioni errate del significato: un problema che gli studenti condividono con i loro insegnanti? Metodi di ricerca psicologica online, Vol.7, No.1


19

Direi l'incapacità generale di apprezzare l'aspetto della vera casualità. Le persone sembrano aspettarsi troppo pochi modelli spuri di quelli che si verificano effettivamente in sequenze di eventi casuali. Ciò si manifesta anche quando proviamo a simulare la casualità per conto nostro.

Un altro abbastanza comune non è comprendere l'indipendenza, come nella fallacia del giocatore. A volte pensiamo che gli eventi precedenti possano influenzare quelli futuri anche quando è chiaramente impossibile, come la precedente distribuzione di un mazzo di carte mischiato che ha un impatto su uno futuro.


7

È già stato sottolineato che molti dei comportamenti e dei processi di pensiero etichettati "irrazionali" o "di parte" dagli economisti (comportamentali) sono in realtà altamente adattivi ed efficienti nel mondo reale. Tuttavia, la domanda di OP è interessante. Penso, tuttavia, che potrebbe essere proficuo fare riferimento a conoscenze descrittive più fondamentali sui nostri processi cognitivi, piuttosto che cercare specifici "pregiudizi" che corrispondano a quelli discussi nella letteratura economica (ad es. Avversione alla perdita, effetto di dotazione, basare l'abbandono ecc.).

Ad esempio, la valutabilità è certamente un problema nell'analisi dei dati. La teoria della valutabilità afferma che sovrappesiamo le informazioni che troviamo facili da interpretare o valutare. Considera il caso di un coefficiente di regressione. Valutare le conseguenze "reali" di un coefficiente può essere un duro lavoro. Dobbiamo considerare le unità della variabile indipendente e dipendente come pure le distribuzioni della nostra variabile indipendente e dipendente per capire se un coefficiente ha rilevanza pratica. Valutare il significato di un coefficiente, d'altra parte, è facile: ho semplicemente confrontato il suo valore p con il mio livello alfa. Data la maggiore valutabilità del valore p rispetto al coefficiente stesso, non sorprende quasi che così tanto sia fatto di valori p.

(La standardizzazione aumenta la valutabilità di un coefficiente, ma può aumentare l' ambiguità : la sensazione che le informazioni pertinenti non siano disponibili o trattenute, perché la forma "originale" dei dati che stiamo elaborando non è disponibile per noi.)

Un "pregiudizio" cognitivo correlato è il principio di concretezza, la tendenza a sovrappesare le informazioni che sono "proprio lì" in un contesto decisionale e non richiedono il recupero dalla memoria. (Il principio di concretezza afferma anche che è probabile che usiamo le informazioni nel formato in cui sono fornite e tendano ad evitare di eseguire trasformazioni.) L'interpretazione di un valore p può essere fatta semplicemente osservando l'output di regressione; non mi richiede di recuperare alcuna conoscenza sostanziale della cosa che sto modellando.

Mi aspetto che molti pregiudizi nell'interpretazione dei dati statistici possano essere ricondotti alla comprensione generale che è probabile che prendiamo la strada facile quando risolviamo un problema o formiamo un giudizio (vedere "avaro cognitivo", "razionalità limitata" e così via) . Allo stesso modo, fare qualcosa "con facilità" di solito aumenta la fiducia con cui riteniamo le credenze risultanti ( teoria della fluidità ). (Si potrebbe anche considerare la possibilità che i dati che sono più facili da articolare- per noi stessi o per gli altri - siamo sovrappesati nelle nostre analisi.) Penso che questo diventi particolarmente interessante se consideriamo possibili eccezioni. Alcune ricerche psicologiche suggeriscono, ad esempio, che se crediamo che un problema dovrebbe essere difficile da risolvere, allora potremmo favorire approcci e soluzioni che sono meno concreti e più difficili, ad esempio, scegliere un metodo più arcano rispetto a un semplice.


7

Il più grande singolo fattore che mi viene in mente è ampiamente noto come "bias di conferma". Avendo deciso su ciò che penso mostrerà il mio studio, accetto acriticamente i dati che portano a tale conclusione, facendo scuse per tutti i punti di dati che sembrano confutare. Potrei inconsciamente rifiutare come "evidente errore dello strumento" (o qualche equivalente) qualsiasi punto dati che non si adatta alla mia conclusione. In alcuni casi, non sarà altrettanto evidente; piuttosto che eliminare completamente quei punti di dati, inventerò una formula per rimuovere "l'errore", che guiderà convenientemente i risultati verso la conferma della mia conclusione preordinata.

Non c'è nulla di particolarmente nefasto in questo; è proprio come funzionano i nostri cervelli. Ci vuole un grande sforzo per filtrare questo pregiudizio, ed è uno dei motivi per cui agli scienziati piace inventare studi in doppio cieco, in modo tale che la persona che esegue le misurazioni non sappia cosa ci si aspetta dall'esperimento. Richiede quindi un'enorme disciplina per non modificare ciò che ha fedelmente misurato.


1
Penso che questo sia il pregiudizio più pericoloso in realtà perché può già verificarsi nella fase di raccolta dei dati, ad esempio la raccolta di dati in un piccolo sottocampione che è molto probabile che confermi le tue aspettative o utilizzi le principali domande del sondaggio.
stijn

1
I pregiudizi di conferma possono essere davvero cattivi tra le discipline, dove anche le presunte basi fondamentali delle discipline sono diverse, portando affermazioni secondo cui "X è impossibile nell'uso (della) disciplina (con i suoi metodi di rilevamento), ma è evidente nella mia (possiamo senso X) ". ad es. le mele sono pensate per essere appese sugli alberi o per terra; non possono "cadere" di propria iniziativa. Spesso, nelle scienze fisiche, c'è un cambiamento di basi matematiche che nasconde la confusione.
Philip Oakley

6

Linearità .

Penso che un pregiudizio comune durante l'interpretazione / analisi dei dati sia che le persone di solito sono veloci ad assumere relazioni lineari. Matematicamente, un modello di regressione presuppone che la sua componente deterministica sia una funzione lineare dei predittori; purtroppo non è sempre vero. Di recente sono andato a una conferenza di poster per studenti universitari e la quantità di tendenze senza mezzi termini quadratiche o non lineari che ho visto essere dotata di un modello lineare era preoccupante per non dire altro.

p


2

Un caso interessante sono le discussioni sull'errore del giocatore d'azzardo.

I dati esistenti devono essere inclusi o esclusi? Se sono già in vantaggio con 6 sixes, questi devono essere inclusi nella mia corsa di una dozzina di tentativi? Sii chiaro sui dati precedenti.

Quando devo passare da numeri assoluti a rapporti? Ci vuole molto tempo perché il vantaggio acquisito durante una serie iniziale vincente ritorni a zero (una camminata casuale).

Lo 0,1% di un milione di dollari potrebbe non essere molto per una grande azienda, ma perdere $ 1000 potrebbe essere la vita e la morte di un solo operatore (motivo per cui gli investitori vogliono investire persone "spinte"). Essere in grado di passare alle percentuali può essere un pregiudizio.

Anche gli statistici hanno pregiudizi.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.