Nello spirito di questa domanda Comprendere la prova di un lemma usato nella disuguaglianza di Hoeffding , sto cercando di capire i passi che portano alla disuguaglianza di Hoeffding.
Ciò che ha più mistero per me nella dimostrazione è la parte in cui vengono calcolati i momenti esponenziali per la somma delle variabili iid, dopo di che viene applicata la disuguaglianza di Markov.
Il mio obiettivo è capire: perché questa tecnica offre una forte disuguaglianza, ed è la più stretta che possiamo raggiungere? Una spiegazione tipica si riferisce al momento che genera le proprietà dell'esponente. Tuttavia, lo trovo troppo vago.
Un post nel blog di Tao, http://terrytao.wordpress.com/2010/01/03/254a-notes-1-concentration-of-measure/#hoeff , potrebbe contenere alcune risposte.
Con questo obiettivo in mente, la mia domanda riguarda tre punti nel post di Tao, a cui sono bloccato e che spero di poter dare un'idea una volta spiegata.
Tao deriva la seguente disuguaglianza usando il k-esimo momento Se questo è vero per qualsiasi k, conclude un limite esponenziale. Questo è dove mi sono perso.
Viene presentato il lemma di Hoeffding: Lemma 1 (il lemma di Hoeffding) Sia una variabile scalare che assume valori in un intervallo . Quindi per qualsiasi , In particolare La dimostrazione di Lemma 1 inizia prendendo in considerazione l'espansione di Taylor Perché l'espansione può essere limitata da quel termine quadratico? E come segue l'equazione 10?
Infine, viene dato un esercizio:
Esercizio 1 Mostra che il fattore in (10) può essere sostituito con e che questo è forte. Ciò fornirebbe una prova molto più breve di quella in Comprensione della prova di un lemma usato nella disuguaglianza di Hoeffding , ma non so come risolverlo.
Altre intuizioni / spiegazioni circa la prova della disuguaglianza o il motivo per cui non possiamo derivare un limite più stretto sono sicuramente ben accetti.