Questa è la definizione di statistica su Wikipedia
Più formalmente, la teoria statistica definisce una statistica come una funzione di un campione in cui la funzione stessa è indipendente dalla distribuzione del campione; cioè, la funzione può essere dichiarata prima della realizzazione dei dati. Il termine statistico viene utilizzato sia per la funzione che per il valore della funzione su un dato campione.
Penso di aver compreso la maggior parte di questa definizione, tuttavia la parte - in cui la funzione è indipendente dalla distribuzione del campione non sono stata in grado di risolvere.
La mia comprensione della statistica finora
Un campione è un insieme di realizzazioni di un certo numero di variabili casuali indipendenti, identicamente distribuite (iid) con distribuzione F (10 realizzazioni di un tiro di un dado a 20 facce, 100 realizzazioni di 5 tiri di un dado a 6 facce, attirare casualmente 100 persone da una popolazione).
Una funzione, il cui dominio è quel set, e il cui intervallo sono i numeri reali (o forse può produrre altre cose, come un vettore o un altro oggetto matematico ...) sarebbe considerata una statistica .
Quando penso ad esempi, media, mediana, varianza hanno senso in questo contesto. Sono una funzione sul set di realizzazioni (misurazioni della pressione sanguigna da un campione casuale). Posso anche vedere come un modello di regressione lineare potrebbe essere considerato una statistica - non è solo una funzione su un insieme di realizzazioni?
Dove sono confuso
Supponendo che la mia comprensione dall'alto sia corretta, non sono stato in grado di capire dove una funzione potrebbe non essere indipendente dalla distribuzione del campione. Ho cercato di pensare a un esempio per dargli un senso, ma senza fortuna. Qualsiasi approfondimento sarebbe molto apprezzato!