Segnalazione dei gradi di libertà per il test t di Welch


14

Il test t di Welch per varianze disuguali (noto anche come Welch – Satterthwaite o Welch-Aspin) ha generalmente un grado di libertà non intero . Come devono essere indicati questi gradi di libertà quando si riportano i risultati del test?

"È convenzionale arrotondare per difetto all'intero più vicino prima di consultare le tabelle t standard" secondo varie fonti * - il che ha senso in quanto questa direzione di arrotondamento è conservativa. ** Anche alcuni software statistici più vecchi farebbero questo (ad esempio Graphpad Prism prima della versione 6 ) e alcuni calcolatori online lo fanno ancora. Se fosse stata utilizzata questa procedura, la comunicazione dei gradi di libertà arrotondati per difetto sembra appropriata. (Anche se usare un software migliore potrebbe essere ancora più appropriato!)

Ma la stragrande maggioranza dei pacchetti moderni utilizza la parte frazionata, quindi in questo caso sembra che la parte frazionaria debba essere quotata. Non riesco a vedere che sia appropriato citare più di due cifre decimali, poiché un millesimo di grado di libertà avrebbe solo un impatto trascurabile sul valore p .

Guardando intorno allo studioso di Google, posso vedere documenti che citano il df come un numero intero, con un decimale o con due decimali. Ci sono delle linee guida su quanta accuratezza usare? Inoltre, se il software utilizzava l'intera parte frazionaria, il df citato deve essere arrotondato per al numero desiderato di cifre (ad es. 7,5845 ... → da 7,57.5845...7.5 a 1 dp o 7 come numero intero) come appropriato con il calcolo conservativo , o come mi sembra più sensato, arrotondato convenzionalmente ( al più vicino ) in modo che 7.5845...7.6 a 1 dp o 8 al totale più vicino?

Modifica: oltre a conoscere il modo più teoricamente corretto di riferire df non interi, sarebbe anche bene sapere cosa fanno le persone in pratica . Presumibilmente riviste e guide di stile hanno i loro requisiti. Sarei curioso di sapere quali guide di stile influenti come l'APA richiedono. Da quello che posso discernere (il loro manuale non è disponibile gratuitamente online), l'APA ha una preferenza generale che quasi tutto dovrebbe apparire con due decimali, tranne i valori p (che possono essere due o tre dp) e le percentuali (arrotondate alla percentuale più vicina) - che copre le pendenze di regressione, statistiche t , statistiche F , χ2statistiche e così via. Questo è abbastanza illogico, tenendo presente che il secondo decimale occupa una cifra significativa molto diversa e suggerisce una precisione piuttosto diversa, in 2,47 rispetto a 982,47, ma potrebbe spiegare il numero di Welch df con due cifre decimali che ho visto nel mio campione non scientifico .

ad esempio Ruxton, GD Il test t di varianza disuguale è un'alternativa sottoutilizzata al test t di Student e al test U di Mann-Whitney , Behavioral Ecology (luglio / agosto 2006) 17 (4): 688-690 doi: 10.1093 / beheco / ark016

Sebbene l'approssimazione di Welch-Satterthwaite stessa possa o meno essere conservatrice, e nel caso in cui non sia conservativa, arrotondare i gradi di libertà non è garanzia di compensazione complessiva.


1
Non ho studiato la pratica reale - motivo per cui questo è un commento e non una risposta - ma mi aspetto che si basi sul giudizio relativo alla segnalazione di cifre significative. Per df relativamente elevato, spesso una modifica nella prima cifra decimale non cambierebbe affatto il valore p (al livello di precisione riportato), quindi l'arrotondamento su un numero intero va bene. Per df molto basso e valori estremi di t , la derivata | νtpuò superare0,01, suggerendo in tali casi cheνdovrebbe essere riportato a una sola cifra meno significativa dipstesso. |νFν(t)|0.01νp
whuber

@whuber Questa è davvero un'osservazione utile, in particolare se presa insieme alla risposta di Glen_b. Quanto è basso "molto basso" per ? (Il mio sospetto dal campione di articoli che ho riscontrato è che molta "pratica effettiva" potrebbe non essere la stessa cosa di "buona pratica"! Sospetto che il seguito robotico delle linee guida abbia lo stesso effetto del giudizio, motivo per cui sarebbe interessante per sapere quali sono le linee guida comuni per la segnalazione.)ν
Silverfish,

Risposte:


10

Non ho studiato la pratica reale, quindi questa risposta non può affrontare questo aspetto della domanda. Come principio generale, mi aspetto che il trattamento di cifre significative nel riferire i gradi di libertà (df) sia basato sul giudizio relativo a cifre significative.

Il principio deve essere coerente : utilizzare la precisione in una quantità appropriata per la precisione utilizzata in un'altra ad essa correlata. Specificamente, quando riferito valori ed y = f ( x ) quando x è dato al multiplo più vicino di un piccolo valore h (ad esempio h = 1xy=f(x)xhper sei posizioni dopo il punto decimale), la precisione relativa inymediata dalla funzionefèh=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

L'approssimazione si applica quando è continuamente differenziabile nell'intervallo [ x - h , x + h ] .f[xh,x+h]

Nella presente applicazione, è il valore p , x è il grado di libertà ν eypxν

y=f(x)=f(ν)=Fν(t)

dove è la statistica di Welch-Satterthwaite e F ν è il CDF della distribuzione t di Student con ν gradi di libertà.tFνtν

Per relativamente elevata df , spesso un cambiamento della prima cifra decimale non cambierebbe il valore p affatto (al livello di precisione riportata), così arrotondamento in un numero intero è soddisfacente ( h = 1 / 2 , ma h | dνh=1/2è molto piccolo). Per df molto bassi e valori estremi della statisticat, l'entità della derivata| h|ddxf(x)|tpuò superare0,01, suggerendo in tali casi cheνdovrebbe essere riportato con un solo decimale in meno dipstesso.|νFν(t)|0.01νp

Guarda tu stesso con questo diagramma di contorno etichettato della grandezza della derivata per il più basso (ragionevole) df e intervalli di sarebbe interessante (perché possono portare a bassi valori p).|t|

figura

Le etichette mostrano il logaritmo in base 10 della derivata. Pertanto, nei punti compresi tra e - ( k +k su questo terreno, cambiando il df riportato nel j esimo posto dopo il punto decimale sarà probabilmente cambiare il p-value segnalati solo in ( j + k ) esimo e più tardi posti. Ad esempio, supponiamo di arrotondare il valore p a 10 - 6 (sei decimali). Considerate le statistiche ν = 2,5 e t = 8 . Si trovano vicino al - 3(k+1)jth(j+k)th106ν=2.5t=83contorno del tronco. Pertanto, deve essere riportato a 6 + ( - 3 ) = 3 cifre decimali.ν6+(3)=3

Le aree azzurre, per la più grande , sono quelle che destano preoccupazione, perché mostrano dove piccoli cambiamenti in ν hanno i maggiori effetti sul valore p.kν

Contrasta con la situazione per un df più elevato (da a 30 mostrati):430

figura 2

L'influenza di sulla precisione di p diminuisce rapidamente all'aumentare di ν .νpν


1
Questo è stato un contributo molto utile per stabilire con quali principi bisogna arrotondare i gradi di libertà (+50!); Spero che un risponditore successivo possa colmare le lacune sulla pratica reale.
Silverfish

7

È convenzionale arrotondare per difetto all'intero più vicino prima di consultare le tabelle t standard

Il motivo che era una convenzione è perché le tabelle non hanno df non integer. Non c'è motivo di farlo diversamente.

il che ha senso in quanto questo aggiustamento è conservativo.

Bene, la statistica in realtà non ha una distribuzione t, perché il denominatore quadrato non ha in realtà una distribuzione chi-quadrata in scala. È un'approssimazione che può o meno essere conservativa in alcuni casi particolari - l'arrotondamento di df down potrebbe non essere certo conservativo se consideriamo l'esatta distribuzione della statistica in un caso particolare.

(per interpolazione o sgranocchiando effettivamente i numeri per la distribuzione t con quella df?)

I valori p delle distribuzioni t (applicando il cdf a una statistica t) possono essere calcolati da una varietà di approssimazioni abbastanza accurate, quindi sono effettivamente calcolate anziché interpolate.

Non riesco a vedere che sia appropriato citare più di due cifre decimali

Sono d'accordo.

Ci sono delle linee guida su quanta accuratezza usare?

Una possibilità potrebbe essere quella di studiare l'accuratezza dell'approssimazione di Welch-Satterthwaite per il valore p in quella regione generale di rapporti di varianza e di non citare un'accuratezza sostanzialmente maggiore di quella che suggerirebbe era nel df (tenendo presente che il df nel chi-quadrato nel quadrato del denominatore sta solo dando un'approssimazione a qualcosa che non è comunque chi-quadrato).


1
Avrei dovuto chiarire "l'arrotondamento per difetto è conservativo". L'approssimazione di Welch-Satterthwaite stessa può o meno essere conservativa. Ma il processo di arrotondamento è sicuramente: se l'approssimazione non era prudente per cominciare, è almeno meno male dopo l'arrotondamento. Al contrario, l'arrotondamento (ad esempio "7.5845 giri più vicino a 8") è sicuramente non una regolazione conservativa. Potrei trovare un modo migliore per esprimerlo, ma spero che il mio punto sia chiaro!
Silverfish,

"Una possibilità potrebbe essere quella di indagare quanto sia accurata l'approssimazione di Welch-Satterthwaite per il valore p in quella regione generale di rapporti di varianza" - questo è molto ragionevole e sembra essere l'approccio di principio. È qualcosa che si fa comunemente? Alcuni suggerimenti per l'implementazione sarebbero graditi. In pratica sospetto che le linee guida sullo stile del diario spesso abbiano l'ultima parola in merito! Ma non so cosa dicono - c'era sicuramente una varietà di pratica sui giornali che la mia ricerca ha rivelato.
Silverfish,

Per cercare di evitare confusione con i futuri lettori, ho cercato di chiarire l'arrotondamento conservativo nel corpo della domanda. Grazie per averlo raccolto.
Silverfish,

Non penso che una cosa del genere sia fatta comunemente, ma non penso che ciò significhi che non dovrebbe esserlo. La spiegazione del motivo per cui un round / troncamento a un certo punto entra nel documento dipende chiaramente dal giornale / editore / arbitri.
Glen_b
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.