Antefatto: sto dando una presentazione ai colleghi al lavoro sui test delle ipotesi e ne capisco la maggior parte, ma c'è un aspetto che mi sto annodando cercando di capire e spiegare agli altri.
Questo è quello che penso di sapere (per favore correggilo se sbagli!)
- Le statistiche che sarebbero normali se fosse nota la varianza, seguono una distribuzione se la varianza è sconosciuta
- CLT (Teorema del limite centrale): la distribuzione campionaria della media campionaria è approssimativamente normale per sufficientemente grande (potrebbe essere , potrebbe essere fino a per distribuzioni fortemente distorte)30 300
- La distribuzione può essere considerata normale per gradi di libertà> 30
Si utilizza -test se:
- Popolazione normale e varianza nota (per qualsiasi dimensione del campione)
- Popolazione normale, varianza sconosciuta e (a causa del CLT)
- Binomio della popolazione, ,n q > 10
Si utilizza il test se:
- Popolazione normale, varianza sconosciuta e
- Nessuna conoscenza di popolazione o varianza e , ma i dati del campione sembrano normali / superano i test ecc., Quindi la popolazione può essere considerata normale
Quindi sono rimasto con:
- Per campioni e (?), Nessuna conoscenza della popolazione e della varianza è nota / sconosciuta.< ≈ 300
Quindi le mie domande sono:
A quale dimensione del campione puoi supporre (dove nessuna conoscenza sulla distribuzione o varianza della popolazione) che la distribuzione campionaria della media sia normale (cioè che il CLT abbia preso il via) quando la distribuzione campionaria sembra non normale? So che alcune distribuzioni hanno bisogno di , ma alcune risorse sembrano dire usare -test ogni volta che ...z n > 30
Per i casi di cui non sono sicuro, presumo di guardare i dati per normalità. Ora, se i dati del campione sembrano normali, uso -test (poiché si assume che la popolazione sia normale e poiché )?n > 30
Che dire di dove i dati di esempio per i casi di cui non sono sicuro non sembrano normali? Ci sono circostanze in cui useresti ancora un test o -test o cerchi sempre di trasformare / usare test non parametrici? So che, a causa di CLT, ad un valore di la distribuzione campionaria della media si avvicinerà alla norma ma i dati del campione non mi diranno quale sia quel valore di ; i dati del campione potrebbero non essere normali mentre la media del campione segue un valore normale / . Ci sono casi in cui dovresti trasformare / utilizzare un test non parametrico quando in realtà la distribuzione campionaria della media era normale / ma non riuscivi a dirlo? z n n t t