Strategie per l'introduzione di statistiche avanzate a vari pubblici

26

Lavoro principalmente con non statistici in settori come la medicina, le scienze sociali e l'istruzione.

Che io stia consultando studenti laureati, aiutando i ricercatori con articoli o esaminando articoli per riviste, ho spesso il problema che qualcuno (cliente, autore, comitato di tesi, editore di riviste) voglia usare una tecnica relativamente nota quando è interamente metodi inappropriati o quando esistono metodi migliori ma meno noti. Spiegherò spesso la tecnica alternativa, ma poi mi verrà detto "tutti lo fanno nell'altro modo".

Sarei interessato a come gli altri affrontano questo tipo di difficoltà.

INTEGRAZIONI

@MichaelChernick mi ha suggerito di condividere alcune storie, quindi lo farò

Attualmente sto lavorando con una persona che sta duplicando un documento precedente e aggiungendo una variabile indipendente per vedere se aiuta. Il documento precedente è, francamente, terribile. Tratta i dati dipendenti come se fossero indipendenti; è tremendamente eccessivo e ci sono anche altri problemi. Eppure (il mio cliente) ha presentato una versione precedente come tesi di laurea e non solo si è laureato, ma è stato ampiamente elogiato per la ricerca.

Molte volte ho cercato di convincere le persone a non dicotomizzare le variabili. Questo si presenta molto spesso in medicina. Sottolineo pazientemente che dicohotomizing (diciamo) il peso alla nascita in basso e normale (di solito a 2.500 g) significa trattare un bambino di 2.499 g come un 1.400 g; ma trattando il bambino da 2.501 grammi in modo diverso. Il clinico concorda con me sul fatto che sia sciocco. Quindi dice di farlo in questo modo.

Molto tempo fa avevo un cliente studente laureato il cui comitato ha insistito per un'analisi dei cluster. Lo studente non ha capito il metodo, il metodo non ha risposto a domande utili, ma è quello che voleva il comitato, quindi è quello che hanno ottenuto.

L'intero campo della grafica statistica è uno in cui, per molti, "è così che il nonno ha fatto" è abbastanza.

Poi ci sono persone che sembrano semplicemente premere i pulsanti. Ricordo una presentazione (non di qualcuno che ho aiutato!) Che aveva preso un intero questionario e un fattore analizzato. Una delle variabili che includeva era il numero ID!

Oy.

consulting

— Peter Flom
fonte

6

Peter, Meta è per domande su questo sito. Sospetto che potresti aver pensato allo status di "Community Wiki", che è per domande utili e interessanti che difficilmente avranno una risposta obiettivamente migliore (o che probabilmente avranno bisogno di sforzi collaborativi per rispondere a tutti). Di conseguenza, ho interpretato il tuo suggerimento come una richiesta in CW e l'ho implementato.

— whuber

1

Una breve nota sulla dicotomizzazione: in realtà penso che questa sia un'intuizione mal riposta da persone che conoscono "un po '" di statistiche. Nei campi di cui parli, immagino che molte analisi sarebbero orientate al processo decisionale (ad esempio, dovrei iniziare il trattamento per la malattia X o Y?). Questo è dicotomus - e spesso una dicotomia utile. Se hai solo un numero limitato di variabili, un'analisi delle decisioni o un test di ipotesi appropriati potrebbero imitare questo: potremmo avere "se x> 10 prende l'opzione 1, altrimenti l'opzione 2".

— Probislogic,

1

Anche un'analisi basata su variabili dicotomizzate è molto facile da ricordare se non si ha accesso a un computer.

— Probislogic,

2

In psicologia le persone spesso dicotomizzano o quantizzano perché usano ANOVA, non regressione. Questo mi fa impazzire. Da qualche parte nelle statistiche di Vanderbilt wiki biostat.mc.vanderbilt.edu/wiki/Main c'è una brillante dimostrazione del danno orribile causato dalla dicotomizzazione. Ma non riesco a trovarlo, sfortunatamente. Penso che sia lì, comunque. Avrei dovuto Evernoting quando ne ho avuto l'occasione

— Chris Beeley,

2

Dalla mia limitata esperienza nel settore assicurativo, ho scoperto che una volta sviluppato un particolare modello predittivo, ha una vita propria e continuerà a essere duplicato (forse con coefficienti aggiornati) per anni anche dopo che il modello è diventato superata. Ad esempio, il rinnovamento di un vecchio modello che stabilisce i tassi delle polizze assicurative sanitarie è un grosso problema poiché le tariffe di alcune persone possono improvvisamente salire, il nuovo modello dovrà essere giustificato per le agenzie di regolamentazione, ecc.

— RobertF

16

Questa è una domanda difficile!

Innanzitutto, alcuni pensieri sul perché ciò accada. Lavoro in un'area che fa (o almeno dovrebbe ) fare un ampio uso delle statistiche, ma in cui la maggior parte dei professionisti non sono esperti di statistica. Di conseguenza si vede molto "Ho messo un vettore nella funzione di test t di Excel e questo numero è caduto. Pertanto il mio documento è supportato dalle statistiche".

Il motivo principale che vedo per questo avvenimento è che la mancanza di conoscenza delle statistiche inizia dall'alto. Se i tuoi revisori e il comitato di tesi non si aggiornano sulle tecniche statistiche, allora devi giustificare l'uso di tutto ciò che è "non convenzionale". Ad esempio, in una tesi, ho scelto di usare trame di violino anziché trame di scatole per mostrare la forma di una distribuzione. L'uso di questa tecnica ha richiesto un'ampia documentazione nella tesi, nonché una discussione prolungata nella mia difesa in cui tutti i membri della commissione volevano sapere cosa significasse questa strana trama, nonostante sia le descrizioni nel testo sia i riferimenti al materiale di partenza . Avevo appena usato un diagramma a scatole (che mostra rigorosamente meno informazioni in questo caso, e può facilmente ingannare lo spettatore sulla forma di una distribuzione se è multimodale) nessuno avrebbe detto nulla e la mia difesa sarebbe stata più semplice.

Il punto è che nei campi non statistici i professionisti affrontano una scelta difficile: possiamo leggere e quindi utilizzare i metodi corretti , il che comporta un sacco di lavoro a cui nessuno dei nostri superiori è interessato; oppure possiamo semplicemente seguire il flusso, ottenere il timbro di gomma sui nostri documenti e tesi e continuare a utilizzare metodi errati ma convenzionali .

Ora, per rispondere alla tua domanda:

Penso che un buon approccio sia quello di enfatizzare le conseguenze del mancato uso di tecniche corrette. Ciò potrebbe comportare:

Dare un esempio del mondo reale di come qualcuno nel loro campo ha sperimentato le conseguenze della scarsa inferenza. Questo è più facile in alcuni campi rispetto ad altri. Gli esempi in cui le carriere sono state danneggiate sono particolarmente buoni.
Spiegare che fare analisi errate può lasciarti in una situazione in cui è molto improbabile che i tuoi risultati si trasferiscano nel mondo reale, il che potrebbe causare danni (ad esempio nel mio campo, se il prototipo del tuo sistema di intelligenza artificiale appare statisticamente migliore rispetto alla concorrenza, ma in realtà è lo stesso, quindi passare i prossimi 6 mesi a costruire una piena implementazione è una pessima idea.
Scegli tecniche che faranno risparmiare molto tempo agli utenti. Abbastanza tempo in modo che possano spendere ciò che risparmiano spiegando le tecniche agli alti.

— John Doucette
fonte

1

Buona discussione e buona risposta +1.

— Michael R. Chernick,

Aspetti positivi @John

— Peter Flom - Ripristina Monica

1

+1 per indicare le conseguenze. Può fare miracoli per indurre le persone a passare a metodi migliori.

— Leo,

9

Parlando dal punto di vista di uno psicologo con una leggera sofisticazione statistica: quando introduci il metodo, introduce anche gli strumenti. Se racconti alla maggior parte dei ricercatori nel mio campo una lunga storia su un nuovo fantastico metodo, passeranno tutto il tempo preoccupati che la battuta finale sia "e tutto ciò che devi fare è ripassare il tuo calcolo differenziale e poi prendere un due corso di formazione settimanale! " (o "e acquista un pacchetto di statistiche da $ 2000!" o "e adatta 5000 righe di codice Python e R!"). Considerando che se esiste un'implementazione del metodo disponibile nel pacchetto di statistiche che già utilizzano, o in un software libero con una GUI comprensibile, e possono aggiornarsi su di esso in un giorno o due, potrebbero essere disposti a dare è una prova.

Sono consapevole che questo approccio può sembrare venale e non scientifico, ma è facile per le persone cadere quando sono preoccupati per le sovvenzioni e le pubblicazioni e non vedono l'apprendimento di enormi quantità di matematica con probabilità di aiutarle a mantenere il loro lavoro.

— octern
fonte

2

@octem Non è possibile che l'investigatore si fidi dello statistico per fare quella parte della collaborazione. Perché l'investigatore ha bisogno dello strumento. Ho paragonato questo con il medico per invertire i tavoli. Come si sentirebbe se dicessi darmi un breve tutorial su come fare questo intervento chirurgico e andrò avanti e lo farò per te. Penso che shock e dsimay ed è illegale per me praticare la mewdicine senza una licenza. Questa è probabilmente una buona cosa. Ma lo statistico non merita uguale rispetto. Perché aspettarsi che posso semplicemente dargli lo strumento e lasciarlo andare via con la sua mancanza di formazione.

— Michael R. Chernick,

2

In psicologia sociale, non è normale avere uno statistico (perché non è normale disporre di fondi sufficienti per pagare uno statistico). Ora sono in sanità pubblica / psicologia della salute. Le grandi sovvenzioni di solito includono lo stipendio per uno statistico, ma gran parte del nostro lavoro viene svolto su piccole sovvenzioni pilota avari dove non possiamo nemmeno permetterci uno stipendio per l'IP. Questa è la prospettiva da cui provengo ... se sei in un campo in cui la maggior parte dei progetti include uno statistico qualificato, allora sono d'accordo, questo tipo di resistenza non sarebbe ragionevole.

— octern

1

@octem Grazie per la risposta. Solo per dare seguito all'analogia. C'è stato un tempo in cui l'aborto era illegale negli Stati Uniti e alcune donne andavano in altri paesi o lo avevano fatto illegalmente in una stanza sul retro senza condizioni sterili e grandi rischi per la salute. Potrebbe non sembrare una grande analogia ma non essere in grado di permettersi uno statistico giustifica fare un lavoro inferiore? So che la medicina è più una cosa della vita o della morte, ma anche la cattiva scienza ha conseguenze negative? L'uso improprio dei dati potrebbe portare alla pratica di cattive medicine perché un farmaco non sicuro viene utilizzato quando non dovrebbe essere.

— Michael R. Chernick,

@MichaelChernick Senti, non sono contento nemmeno dello stato dell'analisi statistica nelle scienze sociali. Ma la domanda era come convincere i ricercatori ad adottare un nuovo approccio statistico e sto dando una risposta che è appropriata per una vasta sottopopolazione di ricercatori, che ci piaccia o no.

— octern

1

@octem Abbastanza giusto e penso di averlo capito. Ti ho dato un voto prima di porre la domanda. L'atteggiamento degli investigatori nel pensare che la strada più economica sia la strada da percorrere è ciò di cui mi sto interrogando e non il fatto che tu riconosca il problema. Lo fa e sono d'accordo con te lì. Ma in qualche modo a lungo termine penso che dobbiamo solo ottenere più rispetto e riconoscimento che il nostro lavoro non è banale.

— Michael R. Chernick,

6

Grazie per questa bella domanda Peter. Lavoro in un istituto di ricerca medica e mi occupo di medici che fanno ricerche e pubblicano su riviste mediche. Spesso sono più interessati a pubblicare i loro articoli che a "fare le statistiche completamente bene". Quindi, quando propongo una tecnica sconosciuta, indicheranno un articolo simile e diranno "guarda, hanno fatto così e hanno pubblicato i loro risultati".

C'è un problema che penso quando il documento pubblicato è davvero pessimo e presenta errori. È difficile discutere anche se ho un'ottima reputazione. Alcuni documenti hanno grandi ego e pensano di poter imparare quasi tutto. Quindi pensano di capire le statistiche quando non lo fanno e possono essere insistenti. Può essere frustrante. Quando è in prova e Wilcoxon è più appropriato, li faccio fare un test di Wilk Shapiro e se la normalità viene rifiutata includiamo entrambi i metodi e spieghiamo perché Wilcoxon è migliore. A volte riesco a convincerli e spesso dipendono da me per le statistiche, quindi ho un po 'più di peso di un consulente generale.

Mi sono anche imbattuto in una situazione in cui ho fatto curve Kaplan-Meier per loro e abbiamo usato il test del registro ma Wilcoxon ha dato un risultato diverso. È stato difficile per me decidere e in tali situazioni penso che sia meglio presentare entrambi i metodi e spiegare perché differiscono. Lo stesso vale per l'utilizzo degli intervalli di confidenza di Peto vs Greenwood per la curva di sopravvivenza. Spiegare l'assunzione del rischio proporzionale di Cox può essere difficile e spesso interpretano erroneamente i rapporti di probabilità e il rischio relativo.

Non esiste una risposta semplice. Avevo un capo qui, che era un ricercatore medico di spicco in cardiologia e talvolta faceva da arbitro per le riviste. Stava guardando un documento che trattava la diagnosi e usava l'AUC come misura. Non aveva mai visto una curva AUC prima e venne da me per vedere se pensavo fosse valida. Aveva dei dubbi. Si è rivelato appropriato e gliel'ho spiegato nel miglior modo possibile.

Ho cercato di tenere lezioni di biostatistica ai medici e ho insegnato biostatistica nelle scuole di sanità pubblica. cerco di farlo meglio di altri e ho prodotto un libro per il corso di specializzazione in scienze della salute nel 2002 con un epidemiologo come coautore. Wiley vuole che io faccia una seconda edizione adesso. Nel 2011 ho pubblicato un libro più conciso che ho cercato di coprire solo gli elementi essenziali in modo che i MD impegnati potessero impiegare il tempo per riassegnarlo e fare riferimento. Ecco come lo gestisco. Forse puoi condividere le tue storie con noi.

— Michael R. Chernick
fonte

Questi sono buoni punti @Michael. Aggiungerò alcune storie

— Peter Flom - Ripristina Monica

1

@PeterFlom Penso che potremmo avere esperienze molto simili. Penso anche che tu stia ottenendo altre ottime risposte nelle risposte degli altri.

— Michael R. Chernick,

6

Ci sono già dei bei commenti già fatti qui, ma aggiungerò i miei 2 centesimi. Prefarrò tutto questo dicendo che presumo che stiamo parlando di una situazione in cui l'uso delle tecniche tradizionali "in scatola" danneggerà le conclusioni sostanziali raggiunte dall'analisi. In caso contrario, penso che a volte fare un'analisi eccessivamente semplicistica sia scusabile sia per brevità sia per facilità di comprensione quando il pubblico target è laico. È davvero un tale crimine assumere indipendenza quando la correlazione intraclasse è .02 o assumere linearità quando la verità è Direi di no. $\log(x); \ x \in (1,2)? \$

Nella mia carriera svolgo molte ricerche interdisciplinari e mi ha portato a lavorare a stretto contatto con ricercatori di abuso di sostanze, epidemiologi, biologi, criminologi e medici in varie occasioni. Questo in genere implicava l'analisi di dati in cui i consueti approcci "in scatola" fallivano per vari motivi (ad esempio una combinazione di campionamento parziale e dati raggruppati, longitudinalmente e / o spazialmente indicizzati). Ho anche trascorso un paio di anni a consultare part-time nella scuola di specializzazione, dove ho lavorato con persone provenienti da una grande varietà di settori. Quindi, ho dovuto pensarci molto.

La mia esperienza è che la cosa più importante è spiegare perché i soliti approcci in scatola sono inappropriati e fanno appello al desiderio della persona di fare "buona scienza". Nessun ricercatore rispettabile vuole pubblicare qualcosa che sia palesemente fuorviante nelle sue conclusioni a causa di analisi statistiche inadeguate. Non ho mai incontrato qualcuno che dicesse qualcosa del tipo "Non mi interessa se l'analisi è corretta o meno, voglio solo farla pubblicare" anche se sono sicuro che esistano persone del genere - la mia risposta sarebbe porre fine alla relazione professionale, se possibile. Come statistico, è la mia reputazione che potrebbe essere danneggiata se qualcuno che effettivamente sa di cosa stanno parlando capita di leggere il giornale.

Ammetto che può essere difficile convincere qualcuno che una particolare analisi è inappropriata, ma penso che come statistici dovremmo (a) avere le conoscenze necessarie per sapere esattamente cosa può andare storto con l'approccio "in scatola" e (b) avere la capacità di spiegarlo è un modo ragionevolmente comprensibile. A meno che tu non stia lavorando come professore di statistica o matematica, una parte del tuo lavoro sarà quella di lavorare con non statistici (e anche a volte se sei un professore statistico / matematico).

Per quanto riguarda (a) , se lo statistico non ha questa conoscenza, perché dovrebbero scoraggiare l'approccio fisso? Se lo statistico sta dicendo "usa un modello di effetti casuali" ma non può spiegare perché supporre che l'indipendenza sia un problema, allora non sono colpevoli di arrendersi al dogma allo stesso modo del cliente? Qualsiasi revisore, statistico o meno, può fare critiche pedanti su un approccio di modellistica statistica perché, ammettiamolo, tutti i modelli sono sbagliati. Ma richiede esperienza per sapere esattamente cosa potrebbe andare storto.

Per quanto riguarda (b) , ho scoperto che le rappresentazioni grafiche di ciò che potrebbe andare storto in genere "colpiscono maggiormente". Esempi:

Nell'esempio fornito da Peter sulla categorizzazione dei dati continui, il modo migliore per mostrare perché questa è una cattiva idea è di rappresentare graficamente i dati nella sua forma continua e confrontarli con la sua forma categorica. Ad esempio, se stai rendendo binaria la tua variabile di risposta, traccia la variabile continua rispetto a e, se non assomiglia molto a una funzione di passaggio, sai che la discretizzazione ha perso informazioni preziose. Se questa differenza non è drastica o non comporta cambiamenti nelle conclusioni sostanziali, puoi anche vederlo dalla trama. $x$
Quando la "forma" proposta del modello (ad es. Lineare) è inappropriata. Ad esempio, se la funzione di regressione "plateau" come per ma per l'inclinazione di un adattamento lineare sarà troppo superficiale e, a seconda dei dati, potrebbe spingere la -value sotto significato nonostante vi sia una relazione evidente tra ed . $y = x$ $x \in (0,1)$ $y = 1$ $x > 1$ $p$ $x$ $y$
Un'altra situazione comune (menzionata anche da Peter) sta spiegando perché assumere l'indipendenza è una cattiva idea. Ad esempio, è possibile dimostrare con una trama che l'autocorrelazione positiva in genere produrrà dati più "raggruppati" e la varianza sarà sottostimata per tale motivo, dando una certa intuizione del perché gli ingenui errori standard tendano ad essere troppo piccoli. Oppure, è anche possibile tracciare i dati con la curva adattata che presuppone l'indipendenza e si può vedere visivamente come i cluster influenzano l'adattamento (riducendo effettivamente la dimensione del campione) in un modo che non è presente nei dati indipendenti.

Ci sono un milione di altri esempi, ma sto lavorando con vincoli spazio / tempo qui :) Quando le immagini semplicemente non funzionano per qualsiasi motivo (ad esempio mostrando perché un approccio è sottodimensionato), anche gli esempi di simulazione sono un'opzione che ho usato di volta in volta.

— 3 giri
fonte

3

Alcuni pensieri casuali perché questo è un problema complesso ...

Sento che un grosso problema è la mancanza di educazione matematica in una varietà di discipline professionali e programmi di laurea.

Senza una comprensione matematica delle statistiche, diventa un mucchio di formule da applicare a seconda dei casi.

Inoltre, per ottenere una reale comprensione della questione, i professori dovrebbero parlare dei problemi originali che gli autori originali stavano affrontando nel momento in cui hanno pubblicato i loro approcci. Si può imparare di più da quello che dalla lettura di migliaia di libri sull'argomento.

La statistica è una cassetta degli attrezzi per risolvere i problemi, ma è anche un'arte e affronta gli stessi problemi di qualsiasi altra arte.

Si può imparare a emettere suoni con uno strumento. Ma potendo"suonare" uno strumento non si diventa musicisti.

Tuttavia, non è raro trovare persone che si vedono come musicisti senza aver studiato un unico concetto di ritmo, melodia e armonia.

Allo stesso modo, per pubblicare documenti, la maggior parte delle persone non ha bisogno di conoscere né comprendere i concetti alla base di una formula ... oggi gli scienziati hanno solo bisogno di sapere quale chiave devono premere e quando deve essere premuto, punto.

Quindi questo non ha nulla a che fare con l '"ego" degli MD. Questo è un problema subculturale, un problema più legato all'istruzione, ai costumi e ai valori della comunità scientifica.

Cosa ci si può aspettare in un'era in cui ci sono migliaia e migliaia e migliaia di documenti e libri inutili pubblicati per soddisfare alcuni requisiti / politiche accademici? In un'era in cui la quantità di articoli che si pubblicano è più importante della loro qualità?

Gli scienziati tradizionali non sono più preoccupati per la buona scienza. Sono schiavi dei numeri. Sono influenzati (o infettati) dal bug amministrativo della nostra era ...

Quindi, dal mio punto di vista, un buon corso di statistica dovrebbe includere le basi matematiche, storiche e filosofiche dell'approccio studiato, evidenziando sempre i vari percorsi che uno può prendere per risolvere un singolo problema.

Infine, se fossi un professore di statistica / probabilità, le mie prime lezioni sarebbero dedicate a problemi del generemescolare le carte o lanciare una moneta . Ciò metterà il pubblico nella posizione giusta per ascoltare ... probabilmente.

— Diego
fonte