Quando un ricevitore dovrebbe randomizzare tra le azioni in un gioco di segnalazione?


10

Supponiamo che ci sia un gioco di segnalazione con uno spazio finito messaggio , finito spazio di azione , e finito lo spazio di tipo . Ancora più semplice, tutti i tipi di mittente hanno preferenze identiche (il destinatario preferisce semplicemente azioni diverse in risposta a tipi diversi). Il destinatario potrà mai fare di meglio rigorosamente randomizzando tra le risposte? Quando esiste un equilibrio in cui il ricevitore intraprende solo azioni pure?MAT

Ubiquitous ha riassunto bene la mia domanda: "È sempre vero che l'equilibrio con i più alti profitti del ricevitore comporta necessariamente strategie miste?"

Andiamo con equilibrio sequenziale. Se vuoi iniziare con qualche notazione.

σt(m) è la probabilità che manda .tTmM

σRm(a) è la probabilità che il ricevitore risponda a con fornisce le credenze del ricevitore dopo aver osservato .maA. μmΔTm

Un equilibrio sequenziale richiede che fornisca risposte ottimali dato , è ottimale dato e è bayesiano dato . Questa è davvero la definizione di un sequenziale debole, ma non c'è distinzione in un gioco di segnalazione.σtσRσRμμσ

La mia intuizione dice no quando esiste un equilibrio in cui il ricevitore svolge solo azioni pure, ma sono sempre stato orribile con questo tipo di cose. Forse dobbiamo anche stabilire che non è un gioco a somma zero, ma lo dico solo perché ricordo che i giocatori stavano meglio con la possibilità di randomizzare in quei giochi. Forse questa è una nota a piè di pagina in un documento da qualche parte?

Considera il gioco di seguito in cui le preferenze del mittente non sono identiche. Mi scuso per la bassa qualità. Esistono tre tipi di mittente, ognuno ugualmente probabile. Possiamo creare quello che credo sia l'equilibrio ottimale del ricevitore (giocatore 2) solo se si randomizzano alla ricezione del messaggio 1. Quindi i tipi 1 e 3 suoneranno , creando un equilibrio di separazione. Se il ricevitore utilizza una strategia pura in risposta a , un tipo 1 o 2 devia e peggiora il ricevitore.m 1m2m1

σRm1(a)=.5=σRm1(r)=.5

inserisci qui la descrizione dell'immagine


Le azioni intraprese dal destinatario in funzione del tipo hanno un impatto sul messaggio inviato dal mittente o sono indipendenti?
Martin Van der Linden,

Non sono esattamente sicuro di cosa intendi. C'è un tipo di ricevitore. La loro strategia mappa i messaggi in una distribuzione rispetto alle azioni. Hanno un impatto solo sul messaggio in quanto i mittenti stanno rispondendo meglio.
Pburg,

2
Supponiamo che esista un equilibrio in cui il ricevitore si randomizza su un insieme di azioni . Ciò significa, per definizione, che deve essere indifferente tra due distribuzioni di probabilità rispetto a comprese quelle in cui tutto il peso è posto su una singola azione (strategie pure). Quindi no, una strategia mista non può mai essere strettamente migliore della migliore strategia pura. O ho capito male la domanda? ααα
Ubiquo

@Ubiquitous Questo ha senso per me, ma mi chiedevo se potessero esserci alcuni strani casi patologici. Ad esempio, ho potuto trovare solo un teorema, "Per le scelte generiche di payoff in un gioco a forma estesa finito con richiamo perfetto, i payoff sono costanti su ogni componente connessa degli equilibri sequenziali". Il generico avvertimento mi ha fatto meravigliare.
Pburg,

1
@Pburg Sì, capisco. Sembra che abbiamo in mente diverse domande. Stavo pensando "è mai il caso che la migliore risposta unica del destinatario a una determinata strategia del mittente sia una strategia mista?", Mentre sembra che la tua domanda sia in realtà "è sempre il caso che l'equilibrio con i più alti profitti del ricevitore implichi necessariamente strategie miste? "
Ubiquo

Risposte:


3

Forse ho un controesempio!

Lascia che ci siano tre messaggi, e e tre tipi di mittente dove , e . L'invio di traduce in un payoff per i mittenti, possiamo pensarlo come uscire dal gioco.m1,m2,m3t1,t2,t3Pr(t=t3)=12ϵPr(t=t2)=14Pr(t=t1)=14+ϵm30

L'insieme delle risposte del destinatario a un messaggio èm=m1,m2{a,r}

ut(a,m1)=1>ut(a,m2)=β>ut(r,)=0

u R ( t 3 , m i , a ) = 1uR(t1,m1,a)=uR(t2,m2,a)=2 , ,uR(t3,mi,a)=1

u R ( t 3 , m i , r ) = 2uR(t2,m1,a)=uR(t2,m1,a)=0 , ,uR(t3,mi,r)=2

uR(t1,mi,r)=uR(t2,mi,r)=1 .

Quindi, in equilibrio, tutti i mittenti devono ottenere la stessa utilità, giusto ?. Altrimenti, uno imiterà la strategia dell'altro.

Quindi, l'unico puro equilibrio strategico è che tutti i mittenti scelgano . In un equilibrio di pool su o , la risposta migliore è scegliere . Non esiste una strategia pura separazione di equilibrio, tranne se e invio , e gli risponde ricevitore con . Quindi è indifferente tra tutti i messaggi, perché sicuramente incontrerà il payoff . Tutto ciò dà al destinatario payoffm 1 m 2 r t 1 t 2 m 2 r t 3 0 3m3m1m2rt1t2m2rt3032ϵ

Quindi considera il caso in cui eOra, i mittenti sono indifferenti tra l'invio di questi due messaggi. Quindi, lascia che e per . Quindi la strategia del ricevitore è razionale.σ m 2 R ( a ) = 1. σ t 3 ( m 1 ) = ε + 1 / 4σRm1(a)=βσRm2(a)=1.σti(mi)=1i=1,2σt3(m1)=ϵ+1/4ϵ+1/2=1σt3(m1)σti(mi)=1i=1,2

L'utilità prevista per il destinatario da dato o è 1.5. L'utilità prevista da è leggermente superiore a 1,5, dato . Quindi il payoff atteso ex ante è superiore a , migliore del puro equilibrio sopra descritto. Inoltre, questa separazione viene mantenuta solo miscelando. Qualsiasi altra strategia pura adottata dal destinatario indurrà il pooling del mittente, il che significa che solo un equilibrio di strategia pura è quando il destinatario sceglie . a r m 2 a 3m1arm2ar32ϵr

Dovrei avere s nella foto qui sotto per le sinistre payoff lato mittente ad . Penso che sia l'ingrediente chiave.a β < 1βaβ<1

inserisci qui la descrizione dell'immagine


3

Penso che ciò non possa accadere con mittenti avversi al rischio, ricevitori neutrali al rischio e abbastanza ricchi.A

Ad esempio, e per attenerci al modello di segnalazione canonica, supponiamo che sia la linea reale positiva e che l'utilità dei mittenti stia aumentando in istante mentre quella del ricevitore ha un'utilità lineare che diminuisce in .u un unAuaa

(Certo, questa è solo una risposta parziale in quanto il framework è molto meno generale di quello in questione, quindi potrebbe non essere soddisfacente per te. Fornisco comunque un argomento nel caso in cui tu fossi d'accordo con questi presupposti)

Per derivare una contraddizione, si supponga che a un equilibrio e per un po' . PermettereσRm(a)>0σRm(a)>0aaA

aσRm(a)σRm(a)+σRm(a)a+σRm(a)σRm(a)+σRm(a)a.

Per avversione al rischio

u[a]>σRm(a)σRm(a)+σRm(a)u(a)+σRm(a)σRm(a)+σRm(a)u(a).
[σRm(a)+σRm(a)]u(a)>σRm(a)u(a)+σRm(a)u(a).

Sotto alcuni presupposti di continuità, deve esistere anche

a<a

tale che

[σRm(a)+σRm(a)]u(a)=σRm(a)u(a)+σRm(a)u(a).

Quindi considera costruito nel modo seguenteσRm

  • σRm(a)=σRm(a)=0 ,
  • σRm(a)=σRm(a)+[σRm(a)+σRm(a)]
  • Per tutti gli altri ,a~σRm(a~)=σRm(a~)

I ricevitori preferirebbero rispetto a se non alterasse i segnali inviati dai mittenti, poiché comporta compensazioni attese inferiori. Ma per costruzione, i mittenti sono indifferenti tra e , quindi dovrebbero inviare gli stessi segnali di . Quindi non può essere un equilibrio che dimostra che non possiamo avere due diverse azioni giocate con probabilità positiva ad un equilibrio. Σ m R σ m RσRmσRm Σ m R σ m R σ m RσRmσRmσRmσRm


In questo modello, il ricevitore non sceglierebbe sempre solo ? a=0
Pburg,

Non è necessariamente così. Se il ricevitore sceglie sempre , non importa il segnale, che non incentivare tipi "alta" a rivelare il loro tipo attraverso un segnale "superiore". Ciò può essere ottimale in un equilibrio di raggruppamento, ma non in un equilibrio di separazione. Vedi ad esempio la sezione 13.C di Mas-Colell, Whinston e Green, sebbene l'installazione sia di nuovo un po 'diversa dalla tua (ad esempio ci sono due aziende in competizione per i lavoratori di diversi tipi)a
Martin Van der Linden,

Che cosa significa allora "l'utilità lineare del ricevitore che diminuisce in" significa?
Pburg,

Mi dispiace che non sia stato molto chiaro. Nel modello di segnalazione di Spence che ho in mente, l'azione che il destinatario intraprende consiste nel pagare un salario al mittente. L'utilità del destinatario dipende dal tipo di mittente t, meno il salario pagato t-w. Fondamentalmente, la ricevente è neutrale al rischio: si preoccupa solo del salario previsto che dovrà pagare e del tipo previsto che impiegherà.
Martin Van der Linden,

Ok, suppongo di aver visto questo come perdita quadratica,Grazie per il suggerimento, anche se sto cercando qualcosa di un po 'più generale ma con azioni discrete. (tw)2.
Pburg,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.