Questa domanda va al cuore di cosa siano le statistiche e come condurre una buona analisi statistica. Solleva molte questioni, alcune della terminologia e altre della teoria. Per chiarirli, iniziamo notando il contesto implicito della domanda e proseguiamo da lì per definire i termini chiave "parametro", "proprietà" e "stimatore". Alle varie parti della domanda viene data risposta durante la discussione. La sezione conclusiva finale sintetizza le idee chiave.
Spazi di stato
Un uso statistico comune della "distribuzione", come in "la distribuzione normale con PDF proporzionale a "è in realtà un (grave) abuso dell'inglese, perché ovviamente questa non è una distribuzione: è un'intera famiglia di distribuzioniparametrizzatadai simboliμeσ. Una notazione standard per questo è lo "spazio degli stati"Ω, uninsiemeexp(−12(x−μ)/σ)2)dxμσΩdi distribuzioni. (Sto semplificando un po 'qui per motivi di esposizione e continuerò a semplificare man mano che andremo avanti, pur rimanendo il più rigoroso possibile.) Il suo ruolo è di delineare i possibili obiettivi delle nostre procedure statistiche: quando stimiamo qualcosa, siamo selezionando uno (o talvolta più) elementi di .Ω
A volte gli spazi degli stati sono esplicitamente parametrizzati, come in . In questa descrizione c'è una corrispondenza uno a uno tra l'insieme delle tuple { ( μ , σ )Ω = { N( μ , σ2) | μ ∈ R , σ> 0 } nel mezzo piano superiore e l'insieme delle distribuzioni che useremo per modellare i nostri dati. Un valore di tale parametrizzazione è che ora possiamo riferirci concretamente alle distribuzioni in Ω per mezzo di una coppia ordinata di numeri reali.{ ( μ , σ) }Ω
In altri casi gli spazi degli stati non sono esplicitamente parametrizzati. Un esempio potrebbe essere l'insieme di tutte le distribuzioni continue unimodali. Di seguito, affronteremo la questione se in questi casi sia possibile trovare un'adeguata parametrizzazione.
parametrizzazioni
Generalmente, una parametrizzazione di è una corrispondenza ( funzione matematica ) da un sottoinsieme di R d (con d finito) a Ω . Cioè, utilizza insiemi ordinati di d -tuple per etichettare le distribuzioni. Ma non è solo una corrispondenza: deve essere "ben educato". Per capirlo, considera l'insieme di tutte le distribuzioni continue i cui PDF hanno aspettative limitate. Questo sarebbe ampiamente considerato "non parametrico", nel senso che qualsiasi tentativo "naturale" di parametrizzare questo insieme implicherebbe una sequenza numerabile di numeri reali (usando un'espansione in qualsiasi base ortogonale). Tuttavia, poiché questo set ha cardinalità ℵΩRddΩd , che è la cardinalità dei reali, deve esistere una certa corrispondenza uno-a-uno tra queste distribuzioni e R . Paradossalmente, sembrerebbe rendere questo unospazio di statoparametrizzatocon unsingoloparametro reale!ℵ1R
Il paradosso si risolve osservando che un singolo numero reale non può godere di una "bella" relazione con le distribuzioni: quando cambiamo il valore di quel numero, la distribuzione a cui corrisponde deve in alcuni casi cambiare in modo radicale. Escludiamo tali parametrizzazioni "patologiche" richiedendo che le distribuzioni corrispondenti ai valori vicini dei loro parametri debbano essere "vicine" tra loro. Discutere le definizioni appropriate di "vicino" ci porterebbe troppo lontano, ma spero che questa descrizione sia sufficiente per dimostrare che c'è molto di più nell'essere un parametro oltre a nominare una particolare distribuzione.
Proprietà delle distribuzioni
Attraverso un'applicazione ripetuta, ci abituiamo a pensare a una "proprietà" di una distribuzione come a una quantità intelligibile che appare frequentemente nel nostro lavoro, come la sua aspettativa, la varianza e così via. Il problema con questa come possibile definizione di "proprietà" è che è troppo vago e non sufficientemente generale. (Questo è dove la matematica era a metà del 18 ° secolo, dove le "funzioni" erano pensate come processi finiti applicati agli oggetti.) Invece, l'unica definizione sensata di "proprietà" che funzionerà sempre è pensare a una proprietà come essendo un numero assegnato in modo univoco a ogni distribuzione inΩ. Ciò include la media, la varianza, ogni momento, qualsiasi combinazione algebrica di momenti, qualsiasi quantile e molto altro, comprese le cose che non possono nemmeno essere calcolate. Tuttavia, non include cose che non avrebbero alcun senso per alcuni degli elementi di . Ad esempio, se Ω è costituito da tutte le distribuzioni di Student t, la media non è una proprietà valida per Ω (poiché t 1 non ha media). Questo ci impressiona ancora una volta da quanto dipendono le nostre idee da ciò che Ω è veramente composto.ΩΩΩt1Ω
Le proprietà non sono sempre parametri
Una proprietà può essere una funzione così complicata da non fungere da parametro. Considera il caso della "distribuzione normale". Potremmo voler sapere se la media della vera distribuzione, quando arrotondata al numero intero più vicino, è pari. Questa è una proprietà. Ma non servirà come parametro.
I parametri non sono necessariamente proprietà
Quando i parametri e le distribuzioni sono in una corrispondenza uno-a-uno, ovviamente qualsiasi parametro e qualsiasi funzione dei parametri relativi a tale materia è una proprietà secondo la nostra definizione. Ma non è necessario che vi sia una corrispondenza uno a uno tra parametri e distribuzioni: a volte alcune distribuzioni devono essere descritte da due o più valori distintamente diversi dei parametri. Ad esempio, un parametro di posizione per i punti sulla sfera userebbe naturalmente latitudine e longitudine. Va bene, tranne che ai due poli, che corrispondono a una determinata latitudine e a qualsiasi longitudine valida. Il posizione(punto sulla sfera) è davvero una proprietà ma la sua longitudine non è necessariamente una proprietà. Sebbene ci siano varie schivate (dichiarare la longitudine di un polo come zero, per esempio), questo problema evidenzia l'importante differenza concettuale tra una proprietà (che è associata in modo univoco con una distribuzione) e un parametro (che è un modo di etichettare la distribuzione e potrebbe non essere unica).
Procedure statistiche
L'obiettivo di una stima è chiamato stimando . È semplicemente una proprietà. Lo statistico non è libero di selezionare lo stimando: questa è la provincia del suo cliente. Quando qualcuno viene da te con un campione di una popolazione e ti chiede di stimare il 99 ° percentile della popolazione, ti verrebbe probabilmente il rischio di fornire uno stimatore della media! Il tuo compito, come statistico, è identificare una buona procedura per stimare la stima che ti è stata data. (A volte il tuo compito è di convincere il tuo cliente che ha selezionato la stima sbagliata per i suoi obiettivi scientifici, ma questo è un problema diverso ...)
Per definizione, una procedura è un modo per ottenere un numero dai dati. Le procedure vengono generalmente fornite come formule da applicare ai dati, ad esempio "sommali tutti e dividi per il loro conteggio". Letteralmente qualsiasi procedura può essere definita uno "stimatore" di un dato stimatore. Ad esempio, potrei dichiarare che la media del campione (una formula applicata ai dati) stima la varianza della popolazione (una proprietà della popolazione, supponendo che il nostro cliente abbia limitato l'insieme delle possibili popolazioni per includere solo quelle che hanno effettivamente variazioni).Ω
stimatori
Uno stimatore non deve avere alcuna connessione evidente con lo stimatore. Ad esempio, vedi qualche connessione tra la media del campione e una varianza della popolazione? Nemmeno io. Tuttavia, la media del campione è in realtà uno stimatore decente della varianza della popolazione per alcuni Ω (come l'insieme di tutte le distribuzioni di Poisson). Qui sta una chiave per comprendere gli stimatori: le loro qualità dipendono dall'insieme dei possibili stati . Ma questa è solo una parte.Ω
Uno statistico competente vorrà sapere quanto bene eseguirà effettivamente la procedura che sta raccomandando. Chiamiamo la procedura " " e lasciamo che lo stimando sia θ . Non sapendo quale distribuzione sia effettivamente quella vera, contemplerà le prestazioni della procedura per ogni possibile distribuzione F ∈ Ω . Dato un tale F , e in ogni possibile esito s (cioè, un insieme di dati), che si confronta t ( s ) (quali le stime procedura) a θ ( F ) (il valore del estimand per Ftθ F∈ΩFst(s)θ(F)F ). È responsabilità del suo cliente dirle quanto sono vicini o lontani quei due. (Questo viene spesso fatto con una funzione di "perdita".) Può quindi contemplare l' aspettativa della distanza tra e θ ( F ) . Questo è il rischio della sua procedura. Poiché dipende da F , il rischio è una funzione definita su Ω .t(s)θ(F)FΩ
(Buoni) gli statistici raccomandano procedure basate sul confronto dei rischi. Ad esempio, supponiamo che per ogni , il rischio della procedura t 1 sia inferiore o uguale al rischio di t . Quindi non c'è motivo di usare t : è "inammissibile". Altrimenti è "ammissibile".F∈Ωt1tt
(Uno statistico "bayesiano" confronterà sempre i rischi facendo una media su una distribuzione "precedente" di possibili stati (di solito fornita dal cliente). Uno statistico "frequentista" potrebbe fare questo, se esiste un tale precedente giustificatamente, ma è anche disposto a confrontare i rischi in altri modi che i bayesiani evitano.)
conclusioni
Abbiamo il diritto di dire che ogni che è ammissibile per θ è uno stimatore di θ . tθθ Dobbiamo, ai fini pratici (perché le procedure ammissibili possono essere difficili da trovare), piegare questo a dire che qualsiasi che ha un rischio accettabilmente piccolo (se confrontato con θ ) tra le procedure praticabili è uno stimatore di θ . tθθ "Accettabilmente" e "praticabile" sono determinati dal cliente, ovviamente: "accettabilmente" si riferisce al loro rischio e "praticabile" riflette il costo (in definitiva pagato da loro) di attuazione della procedura.
Alla base di questa definizione concisa ci sono tutte le idee appena discusse: per capirlo dobbiamo tenere presente uno specifico (che è un modello del problema, processo o popolazione in studio), una stima definita (fornita dal cliente), un funzione di perdita specifica (che collega quantitativamente t al estimand ed è anche dato dal client), l'idea di rischio (calcolato dallo statistico), qualche procedura per confrontare funzioni di rischio (la responsabilità dello statistico di concerto con il cliente), e un senso di quali procedure possono essere effettivamente eseguite (la questione della "praticabilità"), anche se nessuna di queste è esplicitamente menzionata nella definizione.Ωt