Quali statistiche descrittive non sono dimensioni dell'effetto?


12

Dice Wikipedia

la dimensione dell'effetto è una misura della forza di un fenomeno o una stima basata su campione di tale quantità. Una dimensione dell'effetto calcolata dai dati è una statistica descrittiva che trasmette l'entità stimata di una relazione senza fare alcuna dichiarazione sul fatto che la relazione apparente nei dati rifletta una vera relazione nella popolazione.

Per capirlo meglio, mi chiedevo quali statistiche descrittive non sono le dimensioni degli effetti, ad eccezione di grafici e grafici.


Il grafico e i grafici possono effettivamente essere eccezionali per misurare la dimensione di un effetto in modi più intuitivi rispetto alle misure della dimensione dell'effetto. Se in realtà vedi la sovrapposizione tra due gruppi su alcune misure (che corrisponderebbero approssimativamente a una più piccola d ), forse è più facile rendersi conto che una differenza significativa non significa che i membri di un gruppo abbiano tutti punteggi più bassi rispetto ai membri dell'altro gruppo , ecc.
Gala,

Risposte:


18

Dimensioni dell'effetto

  • Le dimensioni comuni degli effetti standardizzati in genere quantificano la quantità o il grado di una relazione o di un effetto. Le misure di dimensione dell'effetto più comuni sono probabilmente cohen's d, Pearson's r e odds ratio (in particolare per un predittore binario).
  • Misure di dimensioni dell'effetto meno comuni:Detto questo, puoi avere misure di dimensioni dell'effetto standardizzate e non standardizzate. Qualsiasi statistica che comunica il grado di relazioni e non è particolarmente contaminata dalla dimensione del campione è probabilmente una misura della dimensione dell'effetto. Pertanto, i coefficienti beta, il quadrato R, la covarianza, le differenze medie grezze tra i gruppi e così via catturano tutti il ​​grado di effetto. Detto questo, trovo che alcuni ricercatori applichino le misure dell'effetto in modo piuttosto cieco e dimenticano che l'obiettivo più ampio è quello di dare ai lettori un senso del grado di effetto. Pertanto, spesso non si rendono conto che misure come differenze medie o coefficienti di regressione grezza sono in qualche modo una misura della dimensione dell'effetto. Un altro esempio di uso cieco delle dimensioni dell'effetto riguarda l'uso di misure della dimensione dell'effetto che non hanno un'interpretazione intuitiva, ma sono state raccomandate da alcuni libri di testo.

Dimensioni non effetto:

  • La maggior parte delle statistiche dei test non ha dimensioni di effetto. Ad esempio, test Chi-quadro, test t, test z, test F. Aumentano sia all'aumentare della dimensione dell'effetto della popolazione che all'aumentare della dimensione del campione. Per molti aspetti l'intero linguaggio delle dimensioni degli effetti è stato enfatizzato negli ultimi anni perché i ricercatori si stavano concentrando troppo sull'ampiezza delle loro statistiche dei test piuttosto che sull'ampiezza delle loro dimensioni degli effetti. Ciò è particolarmente importante quando si dispone di una grande dimensione del campione quando anche piccoli effetti possono essere statisticamente significativi.
  • La maggior parte delle statistiche univariate non ha dimensioni di effetto. Per la maggior parte degli scopi, la dimensione dell'effetto è preoccupata per la relazione tra almeno due variabili. Pertanto, la media del campione, la deviazione standard, l'inclinazione, la curtosi, il minimo, il massimo e così via non sono misure della dimensione dell'effetto.
  • Le statistiche che non riguardano il grado di relazione non sono misure di dimensioni dell'effetto. Ad esempio, i test di normalità multivariata, gli autovalori di una matrice e così via generalmente non mirano direttamente a quantificare un effetto nel senso ordinario della parola.

Considerazioni più ampie

  • Considerazioni sul ridimensionamento: l'utilità di una statistica come misura della dimensione dell'effetto è in gran parte correlata alla sua capacità di comunicare la dimensione di un effetto. A volte ciò si ottiene utilizzando misure familiari standardizzate di effetto (ad esempio, cohen's d). Altre volte, un'attenta considerazione del ridimensionamento delle variabili può produrre un'interpretazione ancora più chiara della dimensione dell'effetto. Ad esempio, supponiamo di avere uno studio che esaminava un programma di formazione sui livelli di reddito. Potrei riferire che il programma di formazione ha aumentato le entrate di 0,2 deviazioni standard o potrei dire che il programma ha aumentato le entrate di $ 3.500 dollari USA. Entrambi sono utili; entrambi sono misure di dimensioni dell'effetto. Il primo è standardizzato (cohen's d), il secondo non standardizzato (differenze medie del gruppo grezzo).
  • Precisione nella stima delle dimensioni dell'effetto: spesso estraiamo stime campione delle misure della dimensione dell'effetto (ad es. Cohen's d, pearson's r, ecc.). Questo contesto può portare a un contrasto tra test di significatività e misure di dimensioni dell'effetto. Tuttavia, l'obiettivo dovrebbe essere comunque quello di stimare in modo preciso e imparziale l'entità dell'effetto della popolazione. Dal punto di vista del frequentista, gli intervalli di confidenza attorno alle dimensioni dell'effetto forniscono una stima della precisione. Dal punto di vista bayesiano, ci sono densità posteriori sulle dimensioni dell'effetto. In molti casi, è necessario prestare attenzione per assicurarsi di utilizzare una misura della dimensione dell'effetto imparziale.

1
(+1) Bella risposta.
chl

Il terzo e ultimo punto probabilmente spiegano da dove provengono gli autori dell'articolo di Wikipedia. Data l'enfasi sulla psicologia, penso che il punto non sia tanto quello di contrastare la dimensione dell'effetto con altre statistiche descrittive, ma piuttosto con le statistiche dei test e i valori p (cioè le statistiche inferenziali) e sottolineare che le misure della dimensione dell'effetto non dicono nulla sulla variabilità del campionamento.
Gala,

Grazie mille per la tua bella risposta. Ho una domanda però: vuoi dire che l'intervallo di confidenza non può essere usato come misura della dimensione dell'effetto, perché è direttamente correlato alla dimensione del campione? (per intervallo di confidenza intendo il valore che viene aggiunto o sottratto dalla prevalenza, dalla media, ecc. - non dai limiti superiore e inferiore di un elemento della configurazione).
Vic,

2
@Vic puoi avere un intervallo di confidenza su una misura della dimensione dell'effetto, ma l'intervallo di confidenza stesso non è la dimensione dell'effetto.
Jeromy Anglim,

Molte grazie caro Jeromy. Per tutti questi anni mi sono sbagliato. :)
Vic,

6

Innanzitutto, le dimensioni degli effetti possono essere utilizzate in modo inferenziale e descrittivo. r e OR hanno tutte le dimensioni di effetto e sono certamente tutti usati nelle statistiche inferenziali.

Le statistiche univariate di solito non hanno dimensioni di effetto, sebbene possano esserlo. Ad esempio, se stai confrontando le età di uomini e donne che sono sposati tra loro, l'età media degli uomini non è una dimensione dell'effetto (quindi la differenza dei mezzi sarebbe una dimensione dell'effetto). Ma se vuoi vedere se la media di qualcosa è 0, allora la media sarebbe una dimensione dell'effetto.

Se misura un effetto, è una dimensione dell'effetto!


Immagino che sia vero @Peter, ma la dimensione dell'effetto è un termine che è stato definito più strettamente da Cohen: (Mean1-Mean2) / PooledSD. Questo suona un po 'come se la differenza fosse significativa, o solo statisticamente significativa - l'uso di parole comuni per definire un termine statistico.
doug.numbers,

2
Dove lo definisce Cohen in quel modo? Se intendi il suo libro su Power Analysis, penso che lo usi come una sorta di standard per convertire altre dimensioni di effetti. Ma ogni tabella di analisi della potenza in quel libro (e ce ne sono MOLTE) usa una certa dimensione dell'effetto (e non tutti la usano)
Peter Flom - Reinstalla Monica

1
Cohen è sempre il modo in cui l'ho capito. Simile a descritto en.wikipedia.org/wiki/Effect_size . Ma hai assolutamente ragione, ci sono molti metodi descritti come dimensioni dell'effetto.
doug.numbers,

4
Il test t e il test z non hanno dimensioni di effetto. la stessa dimensione dell'effetto produrrà valori t e z sostanzialmente diversi per diverse dimensioni del campione.
Jeromy Anglim,

1
@JeromyAnglim ha ragione; +1. Ho modificato la mia risposta
Peter Flom - Ripristina Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.