Charla barata - Cheap talk

En la teoría de juegos , la charla barata es una comunicación entre jugadores que no afecta directamente los beneficios del juego. Proporcionar y recibir información es gratuito. Esto contrasta con la señalización en la que enviar ciertos mensajes puede ser costoso para el remitente dependiendo del estado del mundo.

Un actor tiene información y el otro tiene capacidad para actuar. El jugador informado puede elegir estratégicamente qué decir y qué no decir. Las cosas se vuelven interesantes cuando los intereses de los jugadores no están alineados. El ejemplo clásico es el de un experto (digamos, un ecologista) que intenta explicar el estado del mundo a un tomador de decisiones desinformado (digamos, un político que vota sobre un proyecto de ley de deforestación ). El tomador de decisiones, después de escuchar el informe del experto, debe tomar una decisión que afecte las ganancias de ambos jugadores.

Este escenario básico establecido por Vincent Crawford y Joel Sobel ha dado lugar a una variedad de variantes.

Para dar una definición formal, hablar barato es comunicación que es:

  1. gratis para transmitir y recibir
  2. no vinculante (es decir, no limita las opciones estratégicas de ninguna de las partes)
  3. no verificable (es decir, no puede ser verificado por un tercero como un tribunal)

Por lo tanto, un agente que se dedica a hablar barato podría mentir impunemente, pero en equilibrio puede optar por no hacerlo.

Artículo original de Crawford y Sobel

Configuración

En la forma básica del juego, hay dos jugadores que se comunican, un emisor S y un receptor R .

Escribe. El remitente S obtiene conocimiento del estado del mundo o de su "tipo" t . El receptor R no conoce t  ; solo tiene creencias ex ante al respecto y se basa en un mensaje de S para posiblemente mejorar la precisión de sus creencias.

Mensaje. S decide enviar el mensaje m . El mensaje m puede revelar información completa, pero también puede brindar información limitada y borrosa: normalmente dirá "El estado del mundo está entre t 1 y t 2 ". Puede que no proporcione ninguna información.

La forma del mensaje no importa, siempre que exista un entendimiento mutuo, una interpretación común. Podría ser una declaración general del presidente de un banco central, un discurso político en cualquier idioma, etc. Cualquiera que sea la forma, eventualmente se toma como "El estado del mundo está entre t 1 y t 2 ".

Acción. El receptor R recibe el mensaje m . R actualiza sus creencias sobre el estado del mundo dada la nueva información que podría obtener, utilizando la regla de Bayes . R decide emprender una acción a . Esta acción afecta tanto su propia utilidad como la utilidad del remitente.

Utilidad. La decisión de S con respecto al contenido de m se basa en maximizar su utilidad, dado lo que espera que R haga. La utilidad es una forma de cuantificar la satisfacción o los deseos. Pueden ser beneficios económicos o satisfacción no económica, por ejemplo, la medida en que se protege el medio ambiente.

→ Utilidades cuadráticas:

Las respectivas utilidades de S y R se pueden especificar de la siguiente manera:

La teoría se aplica a formas de utilidad más generales, pero las preferencias cuadráticas facilitan la exposición. Por tanto, S y R tienen objetivos diferentes si b ≠ 0 . El parámetro b se interpreta como un conflicto de intereses entre los dos jugadores o, alternativamente, como un sesgo.

U R se maximiza cuando a = t , lo que significa que el receptor desea realizar una acción que coincida con el estado del mundo, que no conoce en general. U S se maximiza cuando a = t + b , lo que significa que S quiere que se lleve a cabo una acción ligeramente superior. Dado que S no controla la acción, S debe obtener la acción deseada eligiendo qué información revelar. La utilidad de cada jugador depende del estado del mundo y de las decisiones de ambos jugadores que eventualmente conducen a la acción a .

Equilibrio de Nash. Buscamos un equilibrio donde cada jugador decida de forma óptima, asumiendo que el otro jugador también decida de forma óptima. Los jugadores son racionales, aunque R solo tiene información limitada. Las expectativas se hacen realidad y no hay ningún incentivo para desviarse de esta situación.

Teorema

Figura 1: Configuración de comunicación de conversación barata

Crawford y Sobel caracterizan los posibles equilibrios de Nash .

  • Por lo general, existen múltiples equilibrios , pero en un número finito.
  • Separar , que significa revelación de información completa, no es un equilibrio de Nash.
  • Balbucear , que significa que no se transmite información, es siempre un resultado de equilibrio.

Cuando los intereses están alineados, la información se divulga por completo. Cuando el conflicto de intereses es muy grande, toda la información se mantiene oculta. Estos son casos extremos. El modelo que permite un caso más sutil cuando los intereses son cercanos, pero diferentes y, en estos casos, el comportamiento óptimo conduce a que se revele parte de la información, pero no toda, lo que lleva a varios tipos de oraciones cuidadosamente redactadas que podemos observar.

Más generalmente :

  • Existe N * > 0 tal que para todo N con 1 ≤ N ≤ N * ,
  • existe al menos un equilibrio en el que el conjunto de acciones inducidas tiene cardinalidad N ; y además
  • no hay equilibrio que induzca más de N * acciones.

Mensajes. Si bien los mensajes podrían asumir ex ante un número infinito de valores posibles µ (t) para el número infinito de estados posibles del mundo t , en realidad pueden tomar solo un número finito de valores (m 1 , m 2 ,..., m N ) .

Así, un equilibrio puede caracterizarse por una partición (t 0 (N), t 1 (N) ... t N (N)) del conjunto de tipos [0, 1], donde 0 = t 0 (N) < t 1 (N) <. . . <t N (N) = 1 . Esta partición se muestra en el segmento superior derecho de la Figura 1.

Los t i (N) son los límites de los intervalos donde los mensajes son constantes: para t i-1 (N) <t <t i (N), µ (t) = m i .

Comportamiento. Dado que las acciones son funciones de los mensajes, las acciones también son constantes en estos intervalos: para t i-1 (N) <t <t i (N) , α (t) = α (m i ) = a i .

La función de acción ahora se caracteriza indirectamente por el hecho de que cada valor a i optimiza el rendimiento de R , sabiendo que t está entre t 1 y t 2 . Matemáticamente (asumiendo que t se distribuye uniformemente en [0, 1]),

Utilidades cuadráticas:

Teniendo en cuenta que R sabe que t está entre t i-1 y t i , y en la utilidad cuadrática caso especial donde R quiere acción de un a estar tan cerca de t como sea posible, podemos mostrar que bastante intuitiva la acción óptima es el medio de el intervalo:

Condición de indiferencia. ¿Qué sucede en t = t i ? El remitente tiene que ser indiferente entre enviar el mensaje m i-1 o m i . 1 ≤ i≤ N-1      

Esto proporciona información sobre N y t i .

→ Prácticamente:

Consideramos que una partición de tamaño N . Uno puede demostrar que

N debe ser lo suficientemente pequeño para que el numerador sea positivo. Esto determina el valor máximo permitido

donde es el techo de , es decir, el menor entero positivo mayor o igual a .

Ejemplo: asumimos que b = 1/20 . Entonces N * = 3 . Ahora describimos todos los equilibrios para N = 1 , 2 o 3 (ver Figura 2).

Figura 2: Mensaje y utilidades para conflictos de intereses b = 1/20 , para N = 1 , 2 y 3

N = 1: Este es el equilibrio balbuceante. t 0 = 0, t 1 = 1 ; a 1 = 1/2 = 0,5 .

N = 2: t 0 = 0, t 1 = 2/5 = 0.4, t 2 = 1 ; a 1 = 1/5 = 0,2, a 2 = 7/10 = 0,7 .

N = N * = 3: t 0 = 0, t 1 = 2/15, t 2 = 7/15, t 3 = 1 ; a 1 = 1/15, a 2 = 3/10 = 0.3, a 3 = 11/15 .

Con N = 1 , obtenemos el mensaje más burdo posible, que no proporciona ninguna información. Entonces todo es rojo en el panel superior izquierdo. Con N = 3 , el mensaje es más fino . Sin embargo, sigue siendo bastante burdo en comparación con la revelación completa, que sería la línea de 45 °, pero que no es un equilibrio de Nash.

Con una N más alta y un mensaje más fino, el área azul es más importante. Esto implica una mayor utilidad. Revelar más información beneficia a ambas partes.

Aplicaciones

Teoría de juego

El lenguaje vulgar puede, en general, agregarse a cualquier juego y tiene el potencial de mejorar el conjunto de posibles resultados de equilibrio. Por ejemplo, se puede agregar una ronda de charlas baratas al comienzo de la Batalla de los sexos . Cada jugador anuncia si tiene la intención de ir al partido de fútbol oa la ópera. Debido a que la Batalla de los Sexos es un juego de coordinación , esta ronda inicial de comunicación puede permitir a los jugadores seleccionar entre múltiples equilibrios, logrando así mayores recompensas que en el caso descoordinado. Los mensajes y estrategias que producen este resultado son simétricos para cada jugador. Son: 1) anunciar ópera o fútbol con probabilidad uniforme 2) si una persona anuncia ópera (o fútbol), entonces al escuchar este mensaje la otra persona dirá también ópera (o fútbol) (Farrell y Rabin , 1996). Si ambos anuncian diferentes opciones, entonces no se logra ninguna coordinación. En el caso de que solo un jugador envíe mensajes, esto también podría darle a ese jugador la ventaja de ser el primero en moverse.

Sin embargo, no está garantizado que las conversaciones vulgares tengan un efecto sobre los beneficios del equilibrio. Otro juego, el Dilema del Prisionero , es un juego cuyo único equilibrio está en las estrategias dominantes. Cualquier charla barata previa al juego será ignorada y los jugadores jugarán sus estrategias dominantes (Defecto, Defecto) independientemente de los mensajes enviados.

Aplicaciones biologicas

Se ha argumentado comúnmente que la charla barata no tendrá ningún efecto sobre la estructura subyacente del juego. En biología, los autores a menudo han argumentado que la señalización costosa explica mejor la señalización entre animales (ver Principio de desventaja , Teoría de la señalización ). Esta creencia general ha recibido algunos desafíos (ver el trabajo de Carl Bergstrom y Brian Skyrms 2002, 2004). En particular, varios modelos que utilizan la teoría de juegos evolutivos indican que el habla barata puede tener efectos sobre la dinámica evolutiva de juegos particulares.

Ver también

Notas

Referencias