Cosa possiamo dire della media della popolazione da una dimensione del campione di 1?


45

Mi chiedo cosa possiamo dire, se non altro, della popolazione media, quando tutto quello che ho è una misurazione, (dimensione del campione di 1). Ovviamente, ci piacerebbe avere più misurazioni, ma non possiamo ottenerle.y 1μy1

Mi sembra che dato che la media del campione, , è banalmente uguale a , allora . Tuttavia, con una dimensione del campione pari a 1, la varianza del campione non è definita, e quindi anche la nostra fiducia nell'uso di come stimatore di è definita, giusto? Ci sarebbe un modo per limitare la nostra stima di ? y1E[ ˉ y ]=E[y1]=μ ˉ y μμy¯y1E[y¯]=E[y1]=μy¯μμ


Sì, un intervallo di confidenza su può essere costruito in base a determinati presupposti. Se nessuno lo pubblica, lo rintraccio. μ
Soakley,

5
Vedi stats.stackexchange.com/questions/1807 per un'altra versione della stessa domanda (la media di un campione è disponibile, ma non la sua dimensione del campione, quindi effettivamente la media è una singola osservazione dalla distribuzione di campionamento sconosciuta) e stats.stackexchange .com / questions / 20300 per una discussione correlata.
whuber

un recente articolo che discute dell'ottimalità di questi stimatori nel caso normale: tandfonline.com/doi/full/10.1080/00031305.2017.1360796
user795305

Risposte:


9

Ecco un articolo nuovissimo su questa domanda per il caso Poisson, adottando un approccio pedagogico piacevole:

Andersson. Per Gösta (2015). Un approccio di classe alla costruzione di un intervallo di confidenza approssimativo di una media di Poisson usando un'osservazione. The American Statistician , 69 (3), 160-164, DOI: 10.1080 / 00031305.2015.1056830 .


... purtroppo dietro un paywall.
Tim

@Tim: è così. Ancora una volta, un abbonamento ASA non è terribilmente costoso e puoi accedere a The American Statistician , JASA e ad alcune altre riviste a un prezzo molto ragionevole, che personalmente pago molto felicemente di tasca mia. Penso davvero che valga i tuoi soldi qui. YMMV, ovviamente.
S. Kolassa - Ripristina Monica il

4
+1 ma il caso di Poisson è radicalmente diverso dal caso normale perché la varianza deve essere uguale alla media. Il risultato di Poisson è piuttosto semplice mentre il risultato per il caso normale è contro-intuitivo e misterioso. x±9.68|x|
ameba dice di reintegrare Monica il

@amoeba: abbastanza corretto, ma il PO non ha specificato alcuna restrizione alla distribuzione.
S. Kolassa - Ripristina Monica il

Questo è così breve che sarebbe meglio servire come commento. Ma poiché è la risposta accettata, probabilmente non vorrai convertirla in un commento. Potresti forse riassumere i punti principali dell'articolo?
Richard Hardy,

42

Se la popolazione è nota per essere normale, un intervallo di confidenza del 95% basato su una singola osservazione è dato da x ± 9,68 | x |x

x±9.68|x|

Questo è discusso nell'articolo "Un efficace intervallo di confidenza per la media con campioni di taglia uno e due", di Wall, Boen e Tweedie, The American Statistician , maggio 2001, vol. 55, n . 2 . ( pdf )


5
Odio sembrare stupido ma ... sicuramente no. Questo dipende dalle unità e non si comporta affatto correttamente (per intendendo correttamente moltiplicazione scalare ....)
Alec Teal,

8
@Alec Solo perché una procedura dipende dalle unità di misura (cioè non è invariante) non significa che sia automaticamente non valida o addirittura difettosa. Questo è valido: leggi l'articolo e fai i conti. Molti garantiranno che è un po ' inquietante , però. Ancora più sorprendentemente, non devi nemmeno supporre che la distribuzione sottostante sia normale: un risultato simile vale per qualsiasi distribuzione unimodale (ma 9.68 deve essere aumentato a circa 19 circa): vedi i link che ho fornito in un commento a questo domanda.
whuber

4
Un numero successivo del diario aveva tre lettere all'editore, una delle quali sollevava il punto di Alec Teal sulle unità. La risposta di Wall dice questo: "L'intervallo di confidenza non è equivalente (ovvero, la sua probabilità di copertura dipende dal rapporto di ...) "Più tardi dice" L'intervallo di confidenza non si basa su una quantità fondamentale ... "È un approccio e un risultato insoliti, senza dubbio!|μ|σ
soakley,

5
Solo per risparmiare un po 'di lavoro: le lettere all'editore e le risposte alle note di @soakley sono apparse su The American Statistician , vol. 56, n. 1 (2002) .
S. Kolassa - Ripristina Monica il

3
Questo sembra dare intervalli di confidenza che coprono la media con probabilità circa del quando σ | μ | > 0 ma con probabilità molto più alte in caso contrario. Se μ = 0, allora chiaramente la probabilità è del 100 % poiché gli intervalli di confidenza contengono sempre 0 . 95%σ|μ|>0μ=0100%0
Henry,

28

Certo che c'è. Usa un paradigma bayesiano . Le probabilità sono di avere almeno qualche idea di ciò che potrebbe essere - per esempio, che fisicamente non può essere negativo, o che, ovviamente, non può essere più grande di 100 (forse si sta misurando l'altezza dei membri del team di football del liceo locale in piedi). Metti un precedente su quello, aggiornalo con la tua osservazione solitaria e hai un posteriore meraviglioso.μ


18
(+1) Un'osservazione sarà sopraffatta dal priore, quindi sembrerebbe che ciò che si esce dal posteriore non sarà molto più di quello che si inserisce nel priore.
whuber

x±9.68|x|

x±9.68|x|x

@StephanKolassa No, questo intervallo (e la distribuzione associata) costituisce la probabilità. Il nostro priore è separato.
Simon Kuang,

@SimonKuang: sì, hai ragione, errore mio. Sfortunatamente, non ho il tempo di esaminarlo in questo momento, ma se lo fai, ti preghiamo di pubblicare ciò che trovi!
S. Kolassa - Ripristina Monica il

14

Un piccolo esercizio di simulazione per illustrare se la risposta di @soakley funziona:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

Su un milione di prove casuali, l'intervallo di confidenza include la vera media un milione di volte, cioè sempre . Ciò non dovrebbe accadere nel caso in cui l'intervallo di confidenza fosse un intervallo di confidenza al 95% .

Quindi la formula non sembra funzionare ... O ho fatto un errore di programmazione?

(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)


2
μμ=0

2
α1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)

2
μμμsim(0.1)μ

2
P(Xζ|X|μX+ζ|X|)1αμ

2
μμ=0

0

Vedi Edelman, D (1990) 'Un intervallo di confidenza per il centro di una distribuzione unimodale sconosciuta basata su una dimensione del campione uno' The American Statistician, Vol 44, n. 4. L'articolo copre i casi normali e non parametrici.


3
Benvenuto in Stats.SE. Puoi per favore modificare la tua risposta per espanderla, al fine di includere i punti principali del libro che citi? Sarà più utile sia per il poster originale che per le altre persone che effettuano ricerche in questo sito. A proposito, cogli l'opportunità di fare il tour , se non l'hai già fatto. Consulta anche alcuni suggerimenti su Come rispondere , sulla guida alla formattazione e sulla scrittura di equazioni utilizzando LaTeX / MathJax .
Ertxiem - ripristina Monica il

Benvenuto sul nostro sito, David. Il tuo contributo, come autore di quell'articolo (che credo sia stato citato in diversi thread qui), è molto apprezzato, quindi qualsiasi prospettiva o commento che puoi fornire in questa risposta sarebbe il benvenuto.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.