È possibile accelerare la generazione della matrice di ponderazione usando un algoritmo quantico?

In questo ^[1] documento, a pagina 2, menzionano che stanno generando la matrice di ponderazione come segue:

W = \frac{1}{M d} [\sum_{m = 1}^{m = M} x^{(m)} {(x^{(m)})}^{T}] - \frac{I_{d}}{d}

$W = \frac{1}{Md}[\sum_{m=1}^{m=M} \mathbf{x}^{(m)}\left(\mathbf{x}^{(m)}\right)^{T}] - \frac{\Bbb I_d}{d}$

dove sono i campioni di addestramento dimensionali (es. dove ) e ci sono campioni di allenamento in totale. Questa generazione di matrice di ponderazione che utilizza la moltiplicazione di matrice seguita da una somma su termini sembra essere un'operazione costosa in termini di complessità temporale, cioè immagino intorno a (?). $\mathbf{x}^{(m)}$ $d$ $\mathbf{x} := \{x_1,x_2,...,x_d\}^{T}$ $x_i \in \{1,-1\} \ \forall \ i\in \{1,2,...,d\}$ $M$ $M$ $O(Md)$

Esiste un algoritmo quantistico in grado di offrire una notevole accelerazione per la generazione della matrice di ponderazione? Penso che nel loro articolo la loro maggiore velocità derivi dall'algoritmo di inversione della matrice quantistica (che sarà menzionato più avanti nel documento), ma non sembrano aver preso in considerazione questo aspetto della generazione della matrice di ponderazione.

[1]: A Quantum Hopfield Neural Network Lloyd et al. (2018)

algorithm neural-network

— Sanchayan Dutta
fonte

Prendendo la matrice di densità molti dei dettagli sono tutti contenuti nel seguente paragrafo a pagina 2:

ρ = W + \frac{I_{d}}{d} = \frac{1}{M} \sum_{m = 1}^{M} | x^{(m)} ⟩ ⟨ x^{(m)} |,

$\rho=W+\frac{I_d}{d}=\frac 1M \sum_{m=1}^M\left|x^{\left(m\right)}\rangle\langle x^{\left(m\right)}\right|,$

Fondamentale per gli adattamenti quantistici delle reti neurali è la lettura da classica a quantistica dei modelli di attivazione. Nella nostra impostazione, leggere in un modello di attivazione equivale a preparare lo stato quantico . In linea di principio, ciò potrebbe essere ottenuto utilizzando le tecniche di sviluppo della memoria ad accesso casuale quantistico (qRAM) [33] o una preparazione efficiente dello stato quantico, per la quale esistono risultati limitati, basati sull'oracolo, [34]. In entrambi i casi, l'overhead computazionale è logaritmico in termini di . In alternativa, si può adattare una prospettiva completamente quantistica e prendere i modelli di attivazione $x$ $|x〉$ $d$ $|x〉$ direttamente da un dispositivo quantistico o come uscita di un canale quantico. Per il primo, il nostro tempo di esecuzione della preparazione è efficiente ogni volta che il dispositivo quantistico è composto da un numero di porte scalabili al massimo polinomialmente con il numero di qubit. Invece, per quest'ultimo, in genere vediamo il canale come una forma di interazione sistema-ambiente fissa che non richiede un sovraccarico computazionale per implementare.

I riferimenti sopra riportati sono:

[33]: V. Giovannetti, S. Lloyd, L. Maccone, memoria ad accesso casuale quantistico, Physical Review Letters 100, 160501 (2008) [ collegamento PRL , collegamento arXiv ]

[34]: AN Soklakov, R. Schack, Preparazione efficiente dello stato per un registro di bit quantici, Physical Review A 73, 012307 (2006). [ Collegamento PRA , collegamento arXiv ]

Senza entrare nei dettagli di come, entrambi i precedenti sono in effetti schemi rispettivamente per l'implementazione di un qRAM efficiente; ed efficiente preparazione dello stato che ricrea lo stato nel tempo . $\left|x\right>$ $\mathcal O\left(\log_2 d\right)$

Tuttavia, questo ci porta solo finora: può essere usato per creare lo stato , mentre vogliamo una somma su tutte le possibili . $\rho^{\left(m\right)} = \left|x^{\left(m\right)}\rangle\langle x^{\left(m\right)}\right|$ $m$

Fondamentalmente, è misto, quindi non può essere rappresentato da un singolo stato puro, quindi il secondo dei due precedenti riferimenti sulla ricostruzione di stati puri non si applica e il primo richiede che lo stato sia già in qRAM. $\rho = \sum_m\rho^{\left(m\right)}/M$

Pertanto, gli autori fanno una delle tre ipotesi possibili:

Hanno un dispositivo che accade proprio per dare loro lo stato di input corretto
O hanno gli stati in qRAM, $\rho^{\left(m\right)}$
Sono in grado di creare quegli stati a piacimento, usando il secondo dei riferimenti precedenti. Lo stato misto viene quindi creato utilizzando un canale quantico (ovvero una mappa CPTP) completamente positiva.

Dimenticando per il momento le prime due delle opzioni sopra (la prima risolve magicamente il problema), il canale potrebbe essere:

un sistema ingegnerizzato, in quanto sarebbe stato creato per un'istanza specifica in qualcosa di simile a una simulazione analogica. In altre parole, hai un canale fisico che richiede un tempo fisico (al contrario di una certa complessità temporale). Questa è "l'interazione sistema-ambiente fissa che non richiede un overhead computazionale per implementare". $t$
Il canale stesso è simulato. Ci sono alcuni articoli su questo, come la simulazione approssimativa dei canali quantistici di Bény e Oreshkov ( collegamento arXiv - questo sembra un documento approfondito, ma non sono riuscito a trovare dichiarazioni di complessità temporale), Lu et. al. di simulazione canale quantistico sperimentale (nessuna versione arXiv sembra esistere) e Wei, Xin e arXiv di Long preprint efficiente simulazione canale quantistico universale nel cloud computer quantistico di IBM , che (per numero di qubit ) dà una complessità temporale di $n=\lceil\log_2 d\rceil$ . La dilatazione di Stinespring può anche essere usata, con una complessità di . $\mathcal O\left(\left(8n^3+n+1\right)4^{2n}\right)$ $\mathcal O\left(27n^34^{3n}\right)$

$a$ $\sum_j\psi_j\left|j\right>_a$ $d$ $\sum_j\psi_j\left|j\right>_a\left|D_j\right>_d$ $\rho$ $\left|x^{\left(m\right)}\right>$ $\mathcal O\left(n\right)$ $\left|x^{\left(m\right)}\right>$ $\rho$ $\mathcal O\left(n\right)$

^{1 Grazie a @glS per aver segnalato questa possibilità in chat}

$e^{-iAt}$

UN = (\begin{matrix} W - γ {io}_{d} & P \\ P & 0 \end{matrix})

$A=\begin{pmatrix}W-\gamma I_d && P\\ P&& 0\end{pmatrix}$

— Mithrandir24601
fonte

| D_{j} ⟩

$|D_j\rangle$