Dopo aver semplificato il problema mediante procedure di routine, può essere risolto convertendolo in un doppio programma di minimizzazione che ha una risposta ben nota con una prova elementare. Forse questa dualizzazione è il "passo sottile" cui si fa riferimento nella domanda. La disuguaglianza può anche essere stabilita in modo puramente meccanico massimizzando tramite i moltiplicatori di Lagrange.|Ti|
Per prima cosa, offro una soluzione più elegante basata sulla geometria dei minimi quadrati. Non richiede alcuna semplificazione preliminare ed è quasi immediato, fornendo un'intuizione diretta nel risultato. Come suggerito nella domanda, il problema si riduce alla disuguaglianza di Cauchy-Schwarz.
Soluzione geometrica
Considera come un vettore n- dimensionale nello spazio euclideo con il solito prodotto punto. Let y = ( 0 , 0 , ... , 0 , 1 , 0 , ... , 0 ) essere il i esimo vettore base e 1 = ( 1 , 1 , ... , 1 ) . Scrivix=(X1,X2,…,Xn)ny=(0,0,…,0,1,0,…,0)ith1=(1,1,…,1) ed y per le proiezioni ortogonali dixedynel complemento ortogonale di1. (Nella terminologia statistica, sono i residui rispetto ai mezzi.) Quindi, poichéXi- ˉ X = x ⋅yeS=| | x | | /√x^y^xy1Xi−X¯=x^⋅y ,S=||x^||/n−1−−−−−√
|Ti|=n−1−−−−−√|x^⋅y|||x^||=n−1−−−−−√|x^⋅y^|||x^||
è la componente y in x direzione. Da Cauchy-Schwarz, viene massimizzata esattamente quando x è parallelo y = ( - 1 , - 1 , ... , - 1 , n - 1 , - 1 , - 1 , ... , - 1 ) / n , per cui T i = ± √y^x^x^y^=(−1,−1,…,−1,n−1,−1,−1,…,−1)/nQED.
Ti=±n−1−−−−−√y^⋅y^||y^||=±n−1−−−−−√||y^||=±n−1n−−√,
Per inciso, questa soluzione fornisce una caratterizzazione esauriente di tutti i casi in cui è massimizzato: sono tutti della forma|Ti|
x=σy^+μ1=σ(−1,−1,…,−1,n−1,−1,−1,…,−1)+μ(1,1,…,1)
per tutto il vero .μ,σ
{1}Tiy||y^||
Semplificazione
TiXin−1|Ti||Xi|S1|Ti|2=T2i=X2ii=1Xi
Soluzione tramite una doppia formulazione
X21Xj,j≠1∑nj=1X2j∑nj=1Xj=0X1∑nj=2X2j∑nj=2Xj=−X1
La soluzione è facilmente reperibile in molti modi. Uno dei più elementari è scrivere
Xj=−X1n−1+εj, j=2,3,…,n
∑nj=2εj=0
∑j=2nX2j=∑j=2n(−X1n−1+εj)2=∑(−X1n−1)2−2X1n−1∑εj+∑ε2j=Constant+∑ε2j,
εj=0j
(n−1)S2=X21+(n−1)(−X1n−1)2=(1+1n−1)X21=nn−1X21
e
|Ti|=|X1|S=|X1|n(n−1)2X21−−−−−−−√=n−1n−−√,
QED .
Soluzione tramite macchinari
Torna al programma semplificato che abbiamo iniziato con:
Maximize X21
soggetto a
∑i=1nXi=0 and ∑i=1nX2i−(n−1)=0.
Il metodo dei moltiplicatori di Lagrange (che è quasi puramente meccanico e semplice) equivale a una combinazione lineare non banale dei gradienti di queste tre funzioni a zero:
(0,0,…,0)=λ1D(X21)+λ2D(∑i=1nXi)+λ3D(∑i=1nX2i−(n−1)).
n
0000=2λ1X1+==⋯=λ2λ2λ2+2λ3X1+2λ3X2+2λ3Xn.
n−1X2=X3=⋯=Xn=−λ2/(2λ3)λ2=λ3=0λ1=0X1=−(n−1)X2
X1=±n−1n−−√; X2=X3=⋯=Xn=∓1n−−√.
Entrambi cedono
|Ti|=|X1|≤|±n−1n−−√|=n−1n−−√.