Scegliere un argomento di ricerca usando la teoria dei giochi


19

Questa recente domanda sulla teoria dei giochi mi ha fatto pensare (questa è una tangente, ovviamente): è possibile ottimizzare in modo efficiente una strategia personale per scegliere le domande di ricerca su cui lavorare usando la teoria dei giochi?

Per avanzare verso una formalizzazione della domanda, farò le seguenti ipotesi (dichiarate in modo informale):

  • Anch'io "mi diverto" a risolvere qualsiasi particolare problema disponibile (per evitare la risposta "morbida" (e corretta!) Di "Fai quello che ti piace!").
  • Potrei o meno riuscire a trovare una risposta a qualsiasi dato problema su cui scelgo di lavorare. Per ogni dato problema, ho una stima della probabilità di quanto sarò bravo a risolvere un problema (dopo aver investito del tempo in esso).
  • Il mio obiettivo è massimizzare il mio guadagno quando viene valutato in linea di principio (fare domanda per un lavoro, fare domanda per un mandato, fare domanda per una borsa di studio, ecc.), Che è una funzione di quanti problemi risolvo e di quanto importanti o difficili siano i problemi . Non ho un'idea chiara dell'esatto esborso per problema, ma posso fare una stima ragionevole.
  • Esiste una relazione inversa libera tra payoff problematico e difficoltà problematica. Un'altra affermazione del mio obiettivo è quella di "giocare" le differenze (cioè cercare "frutta bassa").
  • Un'istanza di questo problema generale è specificata da un elenco di domande di ricerca (possibilmente in numero infinito), a cui allego fermamente (senza alcun costo computazionale; viene fornito come input) una stima del valore della domanda e della difficoltà della domanda. Sto giocando a questo gioco contro un avversario (la persona che mi sta valutando); la natura decide, data la probabilità che io risolva un determinato problema, se lo risolvo con successo dopo aver scelto di provarlo.

Nel tentativo di formalizzare davvero quello che sta succedendo (e di eludere le risposte poco interessanti o argomentative / di tipo discussione), vedrò questo problema come un gioco in forma estesa con informazioni incomplete con un set di azioni infinito .


Domanda : presumo che giochi di questo tipo non siano calcolabili in modo efficiente. Tuttavia, esiste un algoritmo di tempo polinomiale per massimizzare approssimativamente il mio profitto? Che dire di un PTAS?

Oppure, in alternativa, esiste un modello teorico di gioco più accurato per questo problema? In tal caso, la stessa domanda vale: posso (approssimativamente) massimizzare il mio payoff in modo efficiente? Se é cosi, come?


4
Un potenziale problema con la formulazione di questo come gioco è che il tuo avversario, la persona che ti sta valutando, non sta necessariamente giocando contro di te. In effetti, spesso accade che siano dalla tua parte e disposti a vederti fallire solo se non hai superato il minimo indispensabile. Un altro possibile avversario sono tutti gli altri ricercatori , poiché potrebbero lavorare (possibilmente in collaborazione) allo stesso problema e quindi lavorare contro di te per raggiungere il successo, cercando di ottenere i risultati prima di te.
Dave Clarke,

Ai fini di questa domanda (mi piacerebbe eludere quanta più discussione possibile, quindi questa è una buona domanda ...), supponiamo che la persona che mi sta valutando sia davvero sotto una seria pressione per scegliere uno e solo un individuo migliore per una ricompensa particolare, quindi sono contraddittorie. Inoltre, supponiamo che "tutto ciò che è veramente originale sarà proprio questo: originale", quindi altri ricercatori non sono una preoccupazione seria. Sono (ovviamente!) Personalmente interessato ad altre possibilità, ma penso che lasciarlo aperto inviterà cattive risposte. :)
Daniel Apon,

Un fattore nel problema che potrebbe meritare un modello diverso: una valutazione della probabilità di successo / struttura di ricompensa per problema su cui scelgo di lavorare.
Daniel Apon,

2
Quindi un modo per modellare il gioco è: si sta cercando di raccogliere punti di ricerca prima che l'orologio mandato scade al momento . Ogni domanda si potrebbe lavorare è un valore punti di ricerca, e per ogni domanda c'è una funzione , che fornisce la probabilità di risolverlo, se si passa il tempo su di esso. Massimizza le tue possibilità di raccogliere abbastanza punti prima che scada il tempo. Potresti essere in grado di dire qualcosa sulla migliore strategia per questo gioco. T r i P i ( t ) tRTrioPio(t)t
Peter Shor,

2
Naturalmente, nella vita reale, ogni domanda a cui rispondi sblocca più domande, che non puoi prevedere in anticipo ma che sono probabilmente molto più facili e / o che valgono più del set di domande che hai iniziato, ma una volta che inizi a creare alberi di strategia in questo modo la possibilità di trovare qualcosa di interessante che puoi dire sul gioco diminuisce drasticamente.
Peter Shor,

Risposte:


4

Proverò a rispondere alla tua domanda proponendo un modello alternativo per la domanda. Solitamente faccio più domande di quelle a cui rispondo qui, quindi spero che perdonerai se la mia risposta non è ottimale, anche se sto facendo del mio meglio.

Penso che il modo per formulare la domanda che sarebbe ottimale per consentire alla teoria dei giochi di essere utile sarebbe quello di assumere uno scenario più competitivo. Cioè, ci deve essere competizione tra una varietà di attori diversi. Quindi, suppongo che:

  • V'è un numero grande, ma finito n di altri ricercatori che tentano di perseguire la stessa serie di domande di ricerca disponibili, che io chiamo Q , che si interessa.
  • Ogni problema di ricerca è definito dalle seguenti caratteristiche:
    • Investimento nel tempo , o io , richiesto per ottenere visibilità sull'opportunità o meno di risolvere il problema
    • Probabilità di successo , o S , nel risolvere il problema; una volta raggiunto il "momento della verità" e dopo aver investito abbastanza tempo, la Natura deciderà a caso se sarà in grado di risolvere il problema o no
    • Approfitta della tua carriera , o U (come in utility), a condizione che il successo sia raggiunto
  • Ognuno di questi ricercatori ha livelli diversi delle seguenti quantità:
    • Tempo disponibile per investimenti nella ricerca, t
    • Talento alla ricerca, r
    • Abilità interpersonali e altre qualità di supporto alla carriera, l (come in modo simpatico), che determineranno quanto bene il ricercatore trarrà profitto dai loro successi di ricerca per il loro avanzamento di carriera

Ora, supponendo che non sia possibile alcuna cooperazione su alcun problema, considera quello che chiamerò "gioco iterato dinamico". Questo è un gioco che si gioca ripetutamente, ma che cambia leggermente ogni volta che si gioca.

Lascia che M sia il numero di mosse o turni nel gioco. La manifestazione iniziale del gioco potrebbe essere rappresentata come un elenco che contiene tutti gli attori (ricercatore) e tutti i problemi su cui potrebbero lavorare, oltre a tutti i valori associati a ciascun attore e ogni problema che ho elencato sopra. (Sto presumendo, ovviamente, che ogni ricercatore sappia tutto ciò che è attualmente noto su tutti i problemi e su tutti gli altri ricercatori, rendendo questo un gioco di informazioni perfette.)

Durante ogni iterazione del gioco, un determinato attore sceglie una domanda di ricerca su cui lavorare. A ciascun attore è consentito cambiare domanda in qualsiasi momento e, se un problema viene risolto, il vantaggio per la carriera U viene ridotto a 0 per tutti gli altri giocatori. Se un giocatore investe tempo sufficiente e non riesce a risolvere il problema, a quel particolare giocatore è vietato provare a risolverlo di nuovo ... anche se a qualsiasi altro giocatore è permesso continuare a lavorare sul problema, e un altro attore potrebbe essere in grado di risolvere con successo. Il gioco termina dopo che sono stati effettuati tutti i turni M.

Ogni turno in cui un ricercatore ha selezionato un problema farà sì che quel giocatore si avvicini al raggiungimento del "momento della verità" e, possibilmente, alla risoluzione del problema. Un problema, una volta risolto, aggiunge un certo vantaggio alla carriera del ricercatore basato su l . Il talento di ricerca amplifica la probabilità di successo, mentre il tempo libero amplifica la capacità di fare progressi in un determinato turno.

Dubito che esista un algoritmo temporale polinomiale per risolverlo; Non vedo alcun motivo per cui i ricercatori dovrebbero essere limitati a giocare equilibri di Nash a strategia pura, quindi il problema coinvolgerebbe gli equilibri di Nash a strategia mista e quindi nel peggiore dei casi PPAD completo, se si considera che "risolvere il problema" significa "trovare un Nash equilibrio per il problema ". (Si potrebbe immaginare che se sei il ricercatore più proattivo in circolazione, potresti andare avanti e calcolare il tuo equilibrio di Nash preferito e poi segnalarlo a tutti gli altri giocatori ... dandoti così la sicurezza che nessuno cambierà le strategie lontano dalla strategia profilo che hai segnalato.)

Ad ogni modo, questa è la risposta più coinvolta che io abbia mai pubblicato. Spero che abbia almeno un certo valore. Per favore fatemi sapere se qualcuno ha qualche risposta o ad esso o raccomandazioni per migliorarlo.


1
Filippo, grazie per la risposta! Questa è una grande prospettiva sul problema; Mi chiedo: puoi pensare a un modo per aggiungere una nozione di "informazione parziale" al problema in modo che mantenga il suo stato di completezza PPAD? Qualcosa per modellare il fatto che come giocatore in questo gioco, non so necessariamente cosa stanno facendo tutti i miei avversari (cioè non ho una conoscenza perfetta di quali domande stanno prendendo in considerazione e di quale forza credono di avere rispondere ad ogni domanda)? L'aggiunta di questo influenza la complessità del calcolo di un equilibrio di Nash? (Non lo so!)
Daniel Apon,

1
@Daniel Apon: grazie per il commento! Non penso che sarebbe difficile modificare le condizioni, quindi semplicemente non sai cosa stanno facendo i tuoi avversari o quali sono le loro caratteristiche. L'unica avvertenza è, penso che la garanzia dell'esistenza di un equilibrio di Nash scompaia quando si ha a che fare con un gioco di informazioni imperfette. Non so molto su quelli che sono noti come "giochi Stackelberg", ma penso che possano essere rilevanti per la modifica proposta. In realtà mi sono chiesto quale sia il miglior concetto di soluzione nei giochi di informazioni imperfette ... Ci penserò su.
Philip White,

Ho letto un po 'di più su questo ... Penso che i giochi bayesiani possano essere rilevanti qui, perché sono usati per gestire i giochi con informazioni imperfette. Ecco un link alla pagina di Wikipedia che ho dato un'occhiata a: en.wikipedia.org/wiki/Bayesian_game
Philip White il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.