Qual è la relazione tra stimatore e stima?
Qual è la relazione tra stimatore e stima?
Risposte:
EL Lehmann, nella sua teoria classica della stima puntuale , risponde a questa domanda a pagina 1-2.
Le osservazioni sono ora postulate per essere i valori assunti da variabili casuali che si presume seguano una distribuzione di probabilità congiunta, , appartenente ad una classe nota ...
... specializziamoci ora sulla stima puntuale ... supponiamo che sia una funzione a valore reale definita [sulla classe di distribuzione stipulata] e che vorremmo conoscere il valore di g [a qualunque sia la distribuzione effettiva in effetto, θ ]. Sfortunatamente, θ , e quindi g ( θ ) , non è noto. Tuttavia, i dati possono essere utilizzati per ottenere una stima di g ( θ ) , un valore che si spera sia vicino a g ( θ ) .
In parole: uno stimatore è una procedura matematica definita che fornisce un numero (la stima ) per ogni possibile insieme di dati che un particolare problema potrebbe produrre. Quel numero è destinato a rappresentare alcune proprietà numeriche definite ( ) del processo di generazione dei dati; potremmo chiamarlo "estimand".
Lo stesso stimatore non è una variabile casuale: è solo una funzione matematica. Tuttavia, la stima che produce si basa su dati che sono essi stessi modellati come variabili casuali. Questo rende la stima (ritenuta dipendente dai dati) in una variabile casuale e una stima particolare per un particolare insieme di dati diventa una realizzazione di quella variabile casuale.
In una formulazione (convenzionale) dei minimi quadrati ordinari, i dati sono costituiti da coppie ordinate . La x i è stata determinata dallo sperimentatore (ad esempio, possono essere quantità di un farmaco somministrato). Ciascun y i (una risposta al farmaco, per esempio) si presume provenire da una distribuzione di probabilità che è normale, ma con media incognita μ i e comune varianza σ 2 . Inoltre, si presume che i mezzi siano correlati alla x i tramite una formula μ i = β 0 . Questi tre parametri - σ , β 0 e β 1 - determinano la distribuzione sottostante di y i per qualsiasi valore di x i . Pertanto,qualsiasiproprietà di tale distribuzione può essere considerata come una funzione di ( σ , β 0 , β 1 ) . Esempi di tali proprietà sono l'intercetta β 0 , la pendenza β 1 , il valore di cos ( σ + β, o anche la media al valorex=2, che (secondo questa formulazione) deve essereβ0+2β1.
In questo contesto OLS, un non esempio di uno stimatore sarebbe una procedura per indovinare il valore di se x fosse impostato uguale a 2. Questo non è uno stimatore perché questo valore di y è casuale (in un modo completamente separato da la casualità dei dati): non è una proprietà (definita numerica) della distribuzione, anche se è correlata a quella distribuzione. (Come abbiamo appena visto, tuttavia , si può stimare l' aspettativa di y per x = 2 , pari a β 0 + 2 β 1 ).
Nella formulazione di Lehmann, quasi ogni formula può essere uno stimatore di quasi tutte le proprietà. Non esiste alcun legame matematico inerente tra uno stimatore e uno stimatore. Tuttavia, possiamo valutare - in anticipo - la possibilità che uno stimatore sia ragionevolmente vicino alla quantità che intende stimare. I modi per farlo, e come sfruttarli, sono oggetto della teoria della stima.
In breve: uno stimatore è una funzione e una stima è un valore che riassume un campione osservato.
Uno stimatore è una funzione che mappa un campione casuale alla stima dei parametri:
Si noti che uno stimatore dinvariabili casualiX1,X2,. . . ,Xnè una variabile casuale Θ . Ad esempio, uno stimatore è la media del campione: ¯ X =1
Ad esempio, una stima del campione osservatox1,x2,. . . ,Xnè il campione medio: μ = ¯ x =1
Potrebbe essere utile illustrare la risposta di Whuber nel contesto di un modello di regressione lineare. Supponiamo che tu abbia alcuni dati bivariati e usi i minimi quadrati ordinari per elaborare il seguente modello:
Y = 6X + 1
A questo punto, puoi prendere qualsiasi valore di X, collegarlo al modello e prevedere il risultato, Y. In questo senso, potresti pensare ai singoli componenti della forma generica del modello ( mX + B ) come stimatori . I dati di esempio (che presumibilmente hai inserito nel modello generico per calcolare i valori specifici per m e B sopra) hanno fornito una base su cui potresti fornire stime per m e B rispettivamente.
Coerentemente con i punti di @ whuber nel nostro thread di seguito, qualunque sia il valore di Y generato da un particolare insieme di stimatori, nel contesto della regressione lineare, viene considerato come valore previsto.
(modificato - alcune volte - per riflettere i commenti qui sotto)
Supponiamo di aver ricevuto alcuni dati e di avere una variabile osservata chiamata theta. Ora i tuoi dati possono provenire da una distribuzione di dati, per questa distribuzione c'è un valore corrispondente di theta che tu deduci che è una variabile casuale. È possibile utilizzare la MAP o la media per calcolare la stima di questa variabile casuale ogni volta che cambia la distribuzione dei dati. Quindi la variabile casuale theta è conosciuta come una stima , un singolo valore della variabile non osservata per un particolare tipo di dati.
Mentre lo stimatore sono i tuoi dati, che è anche una variabile casuale. Per diversi tipi di distribuzioni hai diversi tipi di dati e quindi hai una stima diversa e quindi questa corrispondente variabile casuale è chiamata stimatore .