Disuguaglianza Oracle: in termini di base


14

Sto esaminando un documento che usa la disuguaglianza dell'oracolo per dimostrare qualcosa ma non riesco a capire cosa stia nemmeno cercando di fare. Quando ho cercato online "Oracle Inequality", alcune fonti mi hanno indirizzato all'articolo "Candes, Emmanuel J." Stima statistica moderna tramite disuguaglianze oracolari ". "che può essere trovato qui https://statweb.stanford.edu/~candes/papers/NonlinearEstimation.pdf . Ma questo libro sembra troppo pesante per me e credo di non avere alcuni prerequisiti.

La mia domanda è: come spiegheresti che cosa è una disuguaglianza oracolare per un non specialista in matematica (inclusi gli ingegneri)? In secondo luogo, come consiglieresti loro di approfondire i prerequisiti / argomenti prima di provare a imparare qualcosa di simile al libro sopra menzionato.

Consiglio vivamente che qualcuno che abbia una conoscenza concreta e una buona esperienza nelle statistiche ad alta dimensione dovrebbe rispondere a questa domanda.


2
Chiunque abbia più di 1k di reputazione può offrire generosità a questa domanda. Sarebbe davvero d'aiuto. Non penso che gli utenti di CV in generale conoscano questo concetto poiché la maggior parte degli utenti usa le statistiche per l'analisi dei dati e non per l'analisi teorica, anche se come comunità completamente basata sulle statistiche, credo che ci debba essere qualcuno in grado di rispondere adeguatamente. Credo che la domanda non abbia ricevuto abbastanza attenzione.
Wolcott,

1
Avevo pensato alla stessa domanda
Jeza

La "definizione" fornita a p.22 del collegamento "Una disuguaglianza dell'oracolo mette in relazione le prestazioni di uno stimatore reale con quello di uno stimatore ideale che si basa su informazioni perfette fornite da un oracolo e che non sono disponibili nella pratica." Questo non ti trasmette l'essenza della definizione?
Mark L. Stone,

2
@Mark L. Stone per me, no
jeza

1
Nemmeno quando guardi l'esempio e la discussione forniti nelle frasi precedenti, vale a dire l'affermazione e la discussione del Teorema 4.1, come esempio di disuguaglianza oracolare? In parole povere: Accidenti, non conosciamo il valore ottimale (fornito da un oracolo) del fattore di restringimento che dovremmo usare. Ma sapere che il valore ottimale del fattore di contrazione potrebbe migliorare l'MSE di non più di 2 rispetto a non avere il fattore di contrazione ottimale dall'oracolo.
Mark L. Stone,

Risposte:


8

Yi=j=1pβjXi(j)+ϵi,i=1,...,n.
pnb
b^=(XTX)1XTY
EX( b -β0) 2 2
X(b^β0)22σ2
β 0 j σ2/n,j=1,. . . ,p. (σ2/n)p.
EX(b^β0)22n=σ2np.
βj0σ2/n,j=1,...,p.(σ2/n)p.

E se il numero di osservazioni fosse inferiore al numero di variabili indipendenti ? "Crediamo" che non tutte le nostre variabili indipendenti abbiano un ruolo nello spiegare , quindi solo alcune, diciamo , sono diverse da zero. Se dovessimo sapere quali variabili sono diverse da zero, potremmo trascurare tutte le altre variabili e, per l'argomento precedente, l'accuratezza al quadrato complessiva sarebbe(p>n)Yk(σ2/n)k.

Poiché l'insieme di variabili diverse da zero è sconosciuto, è necessaria una penalità di regolarizzazione (ad esempio ) con il parametro di regolarizzazione (che controlla il numero di variabili). Ora vuoi ottenere risultati simili a quelli discussi sopra, vuoi stimare la precisione al quadrato. Il problema è che lo stimatore ottimale ora dipende da . Ma il fatto è che con una scelta appropriata per è possibile ottenere un limite superiore dell'errore di previsione con alta probabilità, ovvero la "disuguaglianza dell'oracolo" Nota un ulteriore fattorel1λβ^λλlogpconst. pn

X(β^β0)22nconst.σ2logpnk.
logp, che è il prezzo per non conoscere l'insieme di variabili diverse da zero. " " dipende solo da o .const.pn

A rigor di termini, non è necessario che il numero di osservazioni sia inferiore al numero di variabili indipendenti affinché tutte le parti successive siano corrette.
jbowman,

Puoi spiegare come hanno ottenuto l'equazione delle aspettative (seconda all'ultima equazione) e la disuguaglianza (ultima equazione)?
user13985

(σ2/n)pX(b^β0)22σ2 ha distribuzione chi-quadro con p gradi di libertà, quindi la sua aspettativa è . L'ultima disuguaglianza è una disuguaglianza oracolo. La prova non è così banale, posso raccomandare questo libro: Statistiche per dati ad alta dimensione: metodi, teoria e applicazioni, capitolo 6.(σ2/n)p
Dato Gogolashvili,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.