Sono interessato alla definizione di quartile che di solito viene utilizzata quando ci si trova nelle statistiche di base. Ho un libro di testo Stat 101 e dà solo una definizione intuitiva. "Circa un quarto dei dati cade sopra o sotto il primo quartile ..." Ma fornisce un esempio in cui calcola Q1, Q2 e Q3 per l'insieme di dati
5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37
Poiché ci sono 15 pezzi di dati, ne sceglie 15 come mediana, Q2. Quindi suddivide i dati rimanenti in due metà, da 5 a 14 e da 16 a 37. Ciascuno contiene 7 pezzi di dati e trovano la mediana di ciascuno di questi insiemi, 10 e 18, rispettivamente come Q1 e Q3. Ecco come lo calcolerei da solo.
Ho guardato l'articolo di Wikipedia e offre 2 metodi. Uno concorda con quanto sopra, e dice che potresti anche includere la mediana 15 in entrambi i set (ma non includeresti la mediana se fosse la media dei due numeri medi nel caso di un numero pari di punti dati). Tutto questo ha senso per me.
Ma poi ho controllato Excel per vedere come Excel lo calcola. Sto usando Excel 2010, che ha 3 diverse funzioni. Quartile era disponibile nel 2007 e versioni precedenti. Sembra che vogliano smettere di usarlo nel 2010, ma è ancora disponibile. Quartile.Inc è nuovo ma concorda esattamente con Quartile per quanto ne so. E c'è anche Quartile.Exc. Credo che entrambi gli ultimi 2 siano nuovi nel 2010. Questa volta, ho appena provato a utilizzare gli interi 1, 2, 3, ..., 10. Mi aspetto che Excel fornisca la mediana di 5,5, Q1 di 3 e Q3 di 8. Anche il metodo dal libro delle statistiche poiché entrambi i metodi su Wikipedia darebbero queste risposte, poiché la mediana è la media dei due numeri centrali. Excel dà
quartile number, Quartile.Inc, Quartile.Exc
1, 3.25, 2.75
2, 5.5, 5.5
3, 7.75, 8.25
Nessuno di questi è d'accordo con ciò di cui ho già parlato.
Le descrizioni nel file della guida per Excel sono:
Quartile.Inc: restituisce il quartile di un set di dati, basato su valori percentili compresi tra 0 e 1 inclusi.
Quartile.Exc: restituisce il quartile del set di dati, in base ai valori percentili da 0..1, esclusivo.
Qualcuno può aiutarmi a capire questa definizione che Excel sta usando?