Qual è il minimo su tutte le distribuzioni di vettori unitari della varianza del prodotto punto dei vettori?


10

nx1,,xnkn>kmaxijVar(xiTxj)E[xiTxj]=0

Ho provato alcune distribuzioni e quasi tutte hanno varianza . Ad esempio, sia la distribuzione in cui ciascuna coordinata di ogni viene scelta in modo indipendente e uniforme da e la distribuzione in cui ogni è un vettore uniforme indipendente sulla sfera unitaria dimensionale con varianza .1/kxi{1/k,1/k}xik1/k

È la varianza minima tra tutte le distribuzioni?1/k


Quanto sei interessato a un limite? Cioè, un limite inferiore di 1 / 100k che funziona solo per n> 100k sarebbe interessante o no?
daniello,

@daniello, intendi un limite inferiore di 1 / ck per n> ck dove c è una costante? Come dimostrarlo?
peng

Qualcosa che non capisco nella domanda: all'inizio dici distribuzione su vettori di unità , ma non tutte le distribuzioni che dici di aver provato a generare vettori di unità ... Vuoi dire che per tutti , E [ | x i | ] = 1 ? XioE[|Xio|]=1
daniello,

@deniello, intendevo fare in modo che tutti i vettori fossero "unità" .. Mi dispiace, ho dimenticato di fare la normalizzazione sul vettore "gaussiano", dopo la normalizzazione, sarà lo stesso del vettore uniforme. Grazie per aver segnalato questo errore.
peng

Risposte:


8

Presenterò una formulazione equivalente ma più semplice del problema e mostrerò un limite inferiore di ( n / k - 1) / ( n −1). Mostro anche una connessione a un problema aperto nell'informazione quantistica. [Modifica nella revisione 3: Nelle revisioni precedenti, ho affermato che una caratterizzazione esatta dei casi in cui è raggiunto il limite inferiore mostrato di seguito è probabilmente difficile perché una domanda analoga nel caso complesso include un problema aperto relativo ai SIC-POVM in informazione quantistica. Tuttavia, questa connessione ai SIC-POVM era errata. Per i dettagli, vedere la sezione "Collegamento errato ai SIC-POVM nelle informazioni quantistiche" di seguito.]

Formulazione equivalente

Innanzitutto, come già indicato nella risposta di daniello, nota che Var ( x i T x j ) = E [( x i T x j ) 2 ] - E [ x i T x j ] 2 = E [( x i T x j ) 2 ]. Quindi, nel resto della risposta, dimentichiamo la varianza e invece minimizziamo al massimo ij E [( x i T x j ) 2 ].

Poi, una volta che decidiamo il nostro obiettivo è di ridurre al minimo massimo ij E [( x i T x j ) 2 ], possiamo ignorare il vincolo che E [ x i T x j ] = 0. Questo perché se abbiamo casuale unità vettori x 1 ,…, x n , quindi possiamo negare ognuna di esse in modo indipendente con probabilità 1/2 per soddisfare E [ x i T x j ] = 0 senza modificare il valore della funzione obiettivo max ij E [( x i T x j) 2 ].

Inoltre, cambiando la funzione obiettivo da max ij E [( x i T x j ) 2 ] a (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ] non cambia il valore ottimale. Il secondo è al massimo il primo perché la media è al massimo il massimo. Tuttavia, possiamo sempre fare i valori di E [( x i T x j ) 2 ] per diverse scelte di ( i , j ) ( ij ) uguale permettendo i n vettori x 1 ,…, x n in modo casuale.

Quindi, per ogni n e k , il valore ottimale del problema in questione è uguale al minimo di (1 / ( n ( n −1))) ∑ ij E [( x i T x j ) 2 ] dove x 1 ,…, x n sono variabili casuali che prendono i vettori unitari in ℝ k come valori.

Tuttavia, per linearità di aspettativa, questa funzione oggettiva è uguale al valore atteso E [(1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2 ]. Poiché il minimo è al massimo la media, non è più necessario considerare le distribuzioni di probabilità. Cioè, il valore ottimale del problema sopra è uguale al valore ottimale di quanto segue:

Scegli vettori unità x 1 ,…, x n ∈ ℝ k per ridurre a icona (1 / ( n ( n −1))) ∑ ij ( x i T x j ) 2 .

Limite inferiore

Usando questa formulazione equivalente, proveremo che il valore ottimale è almeno ( n / k - 1) / ( n −1).

Per 1≤ in , sia X i = x i x i T il proiettore di rango 1 corrispondente al vettore unità x i . Quindi, sostiene che ( x i T x j ) 2 = Tr ( X i X j ).

Sia Y = ∑ i X i . Quindi, sostiene che ∑ ij Tr ( X i X j ) = ∑ i , j Tr ( X i X j ) - n = Tr ( Y 2 ) - n .

La disuguaglianza di Cauchy – Schwarz implica che Tr ( Y 2 ) ≥ (Tr Y ) 2 / k = n 2 / k , e quindi ∑ ij Tr ( X i X j ) = Tr ( Y 2 ) - nn 2 / k - n . Dividendo per n ( n −1), otteniamo che il valore obiettivo sia almeno ( n / k - 1) / ( n −1).

In particolare, quando n = k +1, la risposta di daniello è entro un fattore 2 dal valore ottimale.

Quando è possibile raggiungere questo limite inferiore?

Raggiungimento di questo limite inferiore ( n / k - 1) / ( n -1) è equivalente a fare Y = ( n / k ) I . Non conosco la caratterizzazione esatta quando è raggiungibile, ma esistono le seguenti condizioni sufficienti:

  • Quando n = k +1, è raggiungibile considerando i vettori di unità k +1 che formano un normale k -simplex centrato sull'origine, migliorando da 2 / ( k ( k +1)) nella risposta di daniello all'1 / k ottimale 2 .
  • Quando n è un multiplo di k , è chiaramente raggiungibile fissando una base ortonormale di ℝ k e assegnando ciascuno dei vettori di base a n / k di v 1 ,…, v n .
  • Più in generale dell'ultimo punto elenco, se è ottenibile con una certa scelta di k ed entrambi n = n 1 e n = n 2 , è raggiungibile anche per lo stesso k e n = n 1 + n 2 . In particolare, è raggiungibile se n = un k + b dove un e b sono numeri interi che soddisfano unb ≥0.

Anche se non ho controllato i dettagli, sembra che qualsiasi disegno sferico 2 offra una soluzione per raggiungere questo limite inferiore.

Connessione errata ai SIC-POVM nelle informazioni quantistiche

Nelle revisioni precedenti, ho dichiarato:

Ho il sospetto che rispondere a questa domanda sia una domanda difficile. Il motivo è che se invece consideriamo il complesso spazio vettoriale ℂ k , questa domanda è correlata a un problema aperto nell'informazione quantistica.

Ma questa relazione non era corretta. Spiegherò perché.

Più precisamente, considera il seguente problema:

Scegli vettori unità x 1 ,…, x n ∈ ℂ k per ridurre a icona (1 / ( n ( n −1))) ∑ ij | x i * x j | 2 .

Il limite inferiore sopra vale ugualmente in questa versione complessa. Considera il caso in cui n = k 2 nella versione complessa. Quindi il limite inferiore è uguale a 1 / ( k +1).

Finora era corretto.

Un insieme di k 2 unità vettori x 1 ,…, x k 2 ∈ ℂ k che raggiunge il limite inferiore è chiamato SIC-POVM nella dimensione k ,

Questa parte non era corretta. Un SIC-POVM è un insieme di k 2 unità vettori x 1 ,…, x n ∈ ℂ k per le quali | x i * x j | 2 = 1 / ( k +1) per tutti ij . Si noti che qui il requisito deve valere per tutte le coppie ij , non solo per la media su tutte le coppie ij . Nella sezione "Formulazione equivalente", abbiamo mostrato l'equivalenza tra minimizzare il massimo e minimizzare la media, ma questo è stato possibile perché x 1, ..., x n erano variabili casuali che portavano lì vettori di unità. Qui x 1 , ..., x n sono solo vettori di unità, quindi non possiamo usare lo stesso trucco.


5

v1,v2,...,vK{1,2,...,K+1}Xio=Xj=v1Xtt{io,j}v2,...,vKt{1,...,K+1}Xio-Xio12

E[Xun'XB]=0Xun'XB12

Vun'r[Xun'XB]=E[(Xun'XB)2](Xun'XB)2=1{a,b}={i,j}1(k+12)(xaxb)2=0ab

Var[xaxb]=E[(xaxb)2]=1(k+12)

xi

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.