Complessità dei giochi di informazione parziale allo stato finito


12

Dato un gioco deterministico a somma zero a informazione parziale con solo finitamente molti stati, i
cui possibili risultati sono [perdi, pareggia, vinci] con valori [-1,0, + 1] rispettivamente,
qual è la complessità dell'approssimazione del valore di tale un gioco additivo all'interno di ?ϵ

In particolare, non riesco a trovare alcun algoritmo per farlo.
Il resto di questo post è interamente dedicato a fornire una descrizione più approfondita
del problema, quindi se puoi già capire cosa significa la domanda nella parte superiore
di questo post, allora non c'è motivo per leggere il resto di questo post.

Data una macchina di arbitro con gli Stati , con uno stato iniziale designato s 0 , uno stato s a la cui coppia di punteggi è [ - 1 , + 1 ] , uno stato s b la cui coppia di punteggi è [ + 1 , - 1 ] e stati della forma{1,2,3,...,S}s0sa[1,+1]sb[+1,1]

dove:[p1_info,p2_info,num_of_choices,player_to_move,next_state_table]

  • player_to_move{1,2}
  • è una funzione da { 1 , 2 , 3 , . . . , Num_of_choices } { 1 , 2 , 3 , . . . , S }next_state_table{1,2,3,...,num_of_choices}{1,2,3,...,S}
  • p1_info,p2_info,num_of_choices1

Quando la macchina è in uno stato di quella forma:

  • invia a Player_1 e invia p2_info a Player_2,p1_infop2_info
  • num_of_choices{1,2,3,...,num_of_choices}
  • next_state_table

sasb

  • si ferma con la coppia di punteggi di quello stato come output

s0=1





Qual è la complessità del seguente problema?
Dato un tale arbitro e un intero positivo N, genera un numero razionale
che è (addizionalmente) entro 1 / N del valore del gioco naturale per il Giocatore 1.

Come accennato in precedenza in questa domanda, non riesco a trovare
alcun algoritmo per farlo.


I giocatori conoscono la struttura interna? Qual è il vantaggio di avere informazioni aggiuntive, offre più mosse possibili?
domotorp,

Sì. Dà loro un'idea migliore di quello che è lo stato attuale.

Scusa ma ancora non capisco. Quindi conoscono la struttura interna ma non sanno dove si trovano in questo momento? Per favore, chiarisci la descrizione, sono sicuro di non essere il solo a non riuscire a capire il problema.
domotorp,

3
Il tuo modello è uguale a un "gioco stocastico a turni di somma zero con informazioni parziali"?
Kristoffer Arnsfelt Hansen,

1
@Kristoffer: Non è ovvio (almeno per me) che il mio modello consenta la codifica probabilità irrazionali, sebbene il mio modello sia altrimenti equivalente a quello.

Risposte:


6

NOTA: il mio presunto algoritmo non era corretto; L'ho cancellato.

pp

Per un limite inferiore della complessità, la questione del ravvicinamento del valore di un semplice gioco stocastico è non noto per essere in P . Usando il trucco di randomizzazione che ho dato sopra, è facile scrivere un semplice gioco stocastico come un gioco arbitrato con una tabella di ricerca di dimensioni polinomiali.


Quell'idea di randomizzazione (almeno, come l'hai descritta) non può che dare probabilità razionali. Inoltre, le definizioni utilizzate nei primi due articoli che hai collegato implicano che i loro giochi hanno un albero di gioco finito, mentre sto solo richiedendo uno spazio di stati finito (dove "stato" non include la storia del gioco).

Hai ragione ... la prima parte della mia risposta è errata. Lasciami eliminare. Sono abbastanza sicuro che l'approssimazione del valore dei semplici giochi stocastici non sia nota in P anche quando tutte le lancette di monete hanno probabilità 1/2.
Peter Shor,

1


ϵ0<ϵ

Input: un gioco come descritto nella mia domanda
deve generare SÌ se: il valore del gioco per il Giocatore 1 è maggiore di 1-ϵ
ϵ

rimane RE -hard anche quando

player_to_move è sempre 1 (cioè è necessario solo 1 giocatore)
e
s 0 ≠ s a e s a non è nel raggio (next_state_table)
(cioè, è letteralmente impossibile per il giocatore perdere)
e
p1_info e p2_info e number_of_choices sono indipendenti dallo stato
(vale a dire, l' unico feedback del giocatore è se ha appena vinto o meno)

.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.