Altopiani sterili in paesaggi di formazione di reti neurali quantistiche


9

Qui gli autori sostengono che gli sforzi per creare una rete neurale quantistica scalabile usando una serie di gate parametrizzati sono considerati falliti per un gran numero di qubit. Ciò è dovuto al fatto che, a causa del Lemma di Levy , il gradiente di una funzione in spazi ad alta dimensione è quasi zero ovunque.

Mi chiedevo se questo argomento potesse essere applicato anche ad altri metodi ibridi di ottimizzazione quantistica-classica, come VQE (Variational Quantum Eigensolver) o QAOA (Quantum Approximate Optimization Algorithm).

Cosa ne pensi?


"utilizzo di una serie di porte parametrizzate" Quale serie? È casuale per caso?
rrtucci,

L'articolo è stato scritto da Jarrod McClean, che è anche il pioniere di VQE. Immagino che Jarrod non creda che VQE sia ritenuto fallito per un numero maggiore di qubit. Penso che la tua descrizione del Lemma di Levy sia un po 'diversa da quanto suggerisce il documento. Dici "il gradiente di una funzione in spazi ad alta dimensione è quasi zero dappertutto", ma il documento dice solo che questo è il caso nel particolare contesto delle QNN descritte nel documento.
user1271772

Per elaborare un po 'il mio ultimo commento: si può semplicemente costruire una funzione ad alta dimensione che cambia molto rapidamente ovunque, non avrà un gradiente di "quasi zero" ovunque. La conclusione basata sul lemma di Levy nel documento, è per la funzione specifica che stanno ottimizzando, non per "qualsiasi" funzione in uno spazio ad alta dimensione.
user1271772

1
@asdf: dopo aver trascorso gran parte della giornata a guardare avanti e indietro sul giornale, ho finalmente trovato una risposta per te. Guarda.
user1271772

Risposte:


4

Primo : l'articolo fa riferimento a [ 37 ] per Levy Lemma, ma non troverai alcuna menzione di "Levy's Lemma" in [37]. Lo troverete chiama "La disuguaglianza di Levy", che si chiama Lemma di Levy in questo , che è non è citato nel documento si parla.

|Ψ(p)

Ep=Ψ(p)|H|Ψ(p)Ψ(p)|Ψ(p).

p

p1010p1012, in cui i parametri sono coefficienti dei determinanti di Slater. È generalmente noto che il panorama energetico non è così piatto (come sarebbe se il gradiente fosse 0 quasi ovunque) anche quando ci sono trilioni di parametri o anche di più.

H|Ψ(p)H|Ψ

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.