Cosa fai se i tuoi gradi di libertà superano la fine dei tuoi tavoli?


11

I gradi di libertà nella mia tabella F non salgono abbastanza in alto per il mio grande campione.

Ad esempio, se ho una F con 5 e 6744 gradi di libertà, come posso trovare il valore critico del 5% per un ANOVA?

E se stessi facendo un test chi-quadro con grandi gradi di libertà?

[Una domanda come questa è stata pubblicata qualche tempo fa ma l'OP ha commesso un errore e in realtà aveva un df più piccolo, riducendolo a un duplicato - ma la domanda df di grandi dimensioni originale dovrebbe avere una risposta da qualche parte sul sito]


1
Ottieni un tavolo più grande?
Federico Poloni,

Risposte:


16

Tabelle F :

  1. Il modo più semplice di tutti - se puoi - è usare un pacchetto di statistiche o un altro programma per darti il ​​valore critico. Ad esempio, in R, possiamo fare questo:

     qf(.95,5,6744)
    [1] 2.215425
    

    (ma puoi calcolare facilmente un valore p esatto per la tua F).

  2. Di solito i tavoli F hanno un "infinito" gradi di libertà alla fine del tavolo, ma alcuni no. Se hai un df davvero grande (ad esempio, 6744 è davvero grande), puoi usare la voce infinito ( ) al suo posto.

    Quindi potresti avere tabelle per che danno 120 df e df:ν1=5

          ...    5      ...
     ⁞
    120        2.2899   
     ∞         2.2141
    

    La riga df funzionerà per qualsiasi ν 2 (denominatore df) veramente grande . Se lo usiamo, abbiamo 2.2141 anziché 2.2154 esatti, ma non è poi così male.ν2

  3. Se non si dispone di un ingresso infinito di gradi di libertà, è possibile ricavarne uno da una tabella chi-quadrato, utilizzando il valore critico per il numeratore df diviso per quelli df

    Ad esempio, per un valore critico , prendi un valore critico χ 2 5 e dividi per 5 . Il valore critico del 5% per un χ 2 5 è 11.0705 . Se dividiamo per 5 questo è 2.2141 che è la riga dalla tabella sopra.F5,χ525χ5211,070552,2141

  4. Se i tuoi gradi di libertà potrebbero essere un po 'troppo piccoli per usare la voce "infinito" (ma comunque molto più grande di 120 o qualunque sia la tua tabella), puoi usare l' interpolazione inversa tra la più alta df finita e la voce infinito. Diciamo che vogliamo calcolare un valore critico per dfF5,674

       F       df     120/df    
     ------   ----    -------
     2.2899    120      1     
       C       674    0.17804
     2.2141     ∞       0    
    

    Quindi calcoliamo il valore critico sconosciuto, comeC

    C2,2141+(2,2899-2,2141)×(0,17,804 mila-0)/(1-0)2,2276

    (Il valore esatto è , quindi funziona abbastanza bene.)2,2274

    Maggiori dettagli su interpolazione e interpolazione inversa sono forniti in quel post collegato.


Tavoli Chi-quadrati :

Se il tuo chi-quadrato df è davvero grande, puoi usare tabelle normali per ottenere un'approssimazione.

Per grande df la distribuzione chi-quadrato è approssimativamente normale con media ν e varianza 2 ν . Per ottenere il valore superiore del 5%, prendi il valore critico del 5% a una coda per uno standard normale ( 1.645 ) e moltiplica per νν2ν1.645 e aggiungereν.2νν

Ad esempio, immagina di aver bisogno di un valore critico superiore del 5% per un .χ67442

1.645×2×6744+6744693556.936,2

Xχν22X~˙N(2ν-1,1)

674735,51

2ν-1

(1.645+2×674-1)2/2735,2

Come vediamo, questo è abbastanza vicino.

(Xν)13~˙N(1-29ν,29ν)


2
χ2Fχ2Rdf2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))2,2177χ2


... o è l'intento che gli errori dei due approcci saranno opposti nella direzione (suggerendo forse di combinare i due?).
Glen_b

Ricordo che mi riferivo al punto 4.
whuber

Ah, potrebbe avere più senso. Mi dispiace essere denso. Ci proverò di nuovo.
Glen_b -Restate Monica
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.