Buenas tardes, soy Julio López, tutor del Centro de Sociedad Operativa de Ayud. Estamos en la asignatura de Introducción a la Meta-Economía del Tratado de A. Hoy vamos a continuar con el tema 6 de los oligopolios, viendo un poco lo que es la teoría de juegos y haciendo algún ejercicio para que sepáis cómo se resuelven de una forma. Bueno, ¿de dónde sale esta teoría de juegos? Pues este es un enfoque que inicialmente se ha visto en las ramas de las matemáticas y que se ha utilizado en distintas situaciones o son distintas aplicaciones de esta teoría y que implican un conflicto o antagonismo entre los intereses de las distintas partes implicadas en la situación. En nuestro caso es como un... una situación en la que se puede aplicar que da muy buenos resultados, es la de los oligopólicos, cuando solo consideramos dos participantes en el juego, un duopolo. Conceptos básicos relativos a la teoría del juego. La situación o la estructura de competencia económica que en la que se encuentren los jugadores es lo que se denomina juego. Y las reglas del mismo están descritas por el conjunto de acciones estratégicas factibles para cada uno de estos jugadores. ¿Qué es lo que puede hacer cada uno de estos jugadores? En nuestro caso los consideramos como duopolistas, utilizaremos una matriz de dos formas. Las reglas también estarán formadas por la información de mercado y las estimaciones de los resultados de estas estrategias por parte de los participantes. El conjunto de todo esto, de las acciones que tenga cada participante, los resultados que obtenga de dichas acciones y la información del mercado, es lo que se llama, utilizamos el nombre de matriz de pago. La solución de este juego consiste en la elección del conjunto de estrategias decididas por los jugadores, de modo que ninguno de ellos pueda mejorar su resultado. Los resultados también los llamaremos pago, cambiando de estrategia, siempre que estén dadas las estrategias, tanto de uno como del otro. Es decir, estrategias... Estaremos considerando, si estamos hablando de un duopolio, estaremos considerando que los duopolistas actual deciden simultáneamente. ¿Recordáis la tutoría anterior? Hablábamos de duopolistas de elección simultánea o sucesiva. Pues bueno, aquí consideramos que deciden simultáneamente. Aunque conocen los resultados de las elecciones de los competidores. De esta forma, los participantes en el juego, estos dos bolistas, consideraremos que son adversos al riesgo, o sea, que son conservadores. De forma que eligen lo mínimo de lo peor que les puede suceder. O sea, no se lanza ni a la estrategia que más resultados tenga, sino a la que el perjuicio sea menor. Los tipos de juegos que nos vamos a encontrar van a ser de los dos. Pueden ser cooperativos si producen un acuerdo, o no cooperativos si el acuerdo no es posible. Los juegos cooperativos a su vez pueden ser de suma constante o de suma no constante. Un juego cooperativo de suma constante podría ser, es aquel en el que el resultado total no varía. A ver... Por ejemplo, si en un mercado regateamos el precio, es decir, por ejemplo, el que vende el producto como mínimo, porque es el coste de producción, imaginemos que no vendería el producto por debajo de 10 euros, porque es el coste de producción. Y el comprador que acude al mercado, que no sabe ese coste de producción, pero sí que sabe lo que está dispuesto a pagar como máximo por ese producto que quiere comprar. Imaginemos que el máximo precio que se quiere gastar o la máxima cantidad de dinero que se quiere gastar en ese producto es de 15 euros. Entonces tenemos el mínimo al que lo quiere vender el productor. Que es 10 y el máximo que está dispuesto a pagar el consumidor que es de 15. Si el precio se establece entre esos dos valores, en 11, 12, 13 o 14 unidades... Ambos han salido ganando, porque el productor lo vende por encima del precio de coste, el vendedor lo compra por debajo del precio máximo que quería obtener, con lo cual ambos ganan. Y es de suma constante porque las ganancias que ambos, sea cual sea el precio que se establezca finalmente, permanecen constantes. O sea, si lo venden a 11 euros, por ejemplo, el productor gana 1 euro. Y el comprador gana, si lo quería vender a 15, gana 4 euros. La suma de datos es 1,45. Si en lugar de venderlo a 11 euros, lo vende a 14, el productor está ganando 4 euros y el consumidor está ganando 1 euro. La suma, 4, lo que gana 1 y lo que gana 2. Si gana 1 y lo gana 2, vuelve a hacer 5. Pues es de suma constante. Y un todo cooperativo de suma no cero o no constante... Eso que es suma constante también se llama suma permanente. Pues los otros pueden generar unos beneficios para las partes que en conjunto no se pueden precisar a priori. En cualquier caso, los juegos cooperativos permiten la posibilidad de firmar un acuerdo, mientras que los no cooperativos no lo permiten. No son estrategias de acuerdo, sino más bien todo lo contrario. Ahora, los secuestros que vamos a introducir en esta teoría van a ser Los globoquistas conocen y contemplan el resultado de sus opciones para cada movimiento de sus competidores. Veremos que tenemos dos competidores y cada uno de ellos tiene, por ejemplo, dos opciones. Entonces, cada uno de ellos sabe los resultados de sus propias opciones, de elegir la fuma o la acción. Incluso para cada uno de los movimientos del competidor. O sea, elija lo que elija el otro competidor. El primero va a saber cuál va a ser su propio resultado. Bien, entonces lo que se dice es que los competidores conocen la matriz de pagos o ganancias que será lo que utilizaremos nosotros para resolver los ejercicios. El segundo supuesto es que el objetivo de cada jugador está bien definido y entra en conflicto con los objetivos del oponente. Lo que quiere decir que no puede optar cada uno de ellos por el mayor valor de las casillas de la matriz, como veremos después, sino que se ven limitados a las opciones mostradas tal y como aparezcan en la matriz de pagos. Todo esto queda un poco teórico, pero luego cuando hagamos ejercicios lo veréis más fácil. Y tercera, el tercer supuesto es que se espera que el competidor se comporte de forma racional. O sea, ambos. Competidores se van a comportar de forma racional, evaluando correctamente sus opciones a partir de la información disponible. O lo que es lo mismo, cada jugador va a esperar lo peor del contrario. Es decir, se piensa que los competidores elegirán siempre la mejor contraestrategia de las disponibles para lograr sus objetivos. Vamos a empezar con el juego del dilema del prisionero. Es un tipo de juego muy común. Bueno, bien. Bien, supongamos que tenemos dos delincuentes que son culpables. O sea, no será aquí el caso de que uno sea inocente y lo hayan encapsulado por nosotros. No, los dos son culpables. Los dos, por ejemplo, han cometido un robo cúnico y han sido capturados los dos. Y ambos, como es natural, dicen que ellos no han sido. No confiesan en él. No confiesan en la participación en el robo. Entonces, ¿qué hace la policía? La policía los encierra por separado. El prisionero A por un lado y el prisionero B por el otro. No saben lo que está haciendo el otro prisionero. O sea, el A no sabe lo que hace el B y el B no sabe lo que hace el A. Entonces, les plantea lo siguiente. Les ofrece una reducción de condena si confiesan. Supongamos que la condena máxima por el delito fueran 10 años de cárcel, pues bueno, pues les ofrece que si confiesan el delito, se les traduzca la condena. En este caso, esto lo expresamos aquí en esta matriz de pago. Tenemos el prisionero A que tiene en cuenta las líneas horizontales y el prisionero B lo que tiene en cuenta son las columnas. Confesar y no confesar aquí son las opciones para el prisionero A y para el prisionero B están aquí en las columnas. Y los números que se expresan en cada una de ellas... ...en cada una de esas casillas indican el número de años de rebaja de la condena. Perdón, lo que les quedará de condena... Aunque está con un negativo, pero es lo que les queda de condena en las distintas situaciones. Así, por ejemplo, si el prisionero A confiesa, pues le caerá una condena de cuatro años siempre y cuando el prisionero B también confiese. O sea, si los dos eligen la opción de confesar, a cada uno de ellos les caerán cuatro años. Si no confiesa a ninguno, pues les caerían dos años. Supongamos que no pueden probarlo con la misma certeza que su confesante. Entonces, lo que aparece ahí son los números de condena. A los dos prisioneros se les presenta la opción de confesar y reducir su condena. Pero supongamos... Si confiesan los dos, las penas de cárcel son mayores que si no confiesa a ninguno. O sea, si confiesan los dos, la pena de cárcel que les cae son de cuatro años. Si no confiesa a ninguno, las penas de cárcel que les va a caer a cada uno es de dos años. De forma que los prisioneros tienen un cierto incentivo a no confesar, porque aún podrían tener una condena más baja si no confiesan ninguno de los dos. Claro, ese incentivo de la condena más baja de dos años de cárcel funciona siempre y cuando ninguno de los dos confiese. ¿Por qué? Porque en el momento en que uno de ellos confiesa, por ejemplo, confiesa al prisionero A, o sea, elige la opción confesar, y el prisionero B elige la opción no confesar. ¿Qué es lo que sucede? Pues que en este caso la casilla relevante es la que tenemos aquí, esta de aquí, que es la de confesar y no confesar, confesar del A y no confesar del B. ¿Y en esta qué pasa? Pues que el prisionero A, que es el que ha confesado, tiene una condena de sólo un año. Y el que no ha confesado, como le han pillado por todo el equipo, pues le cae una condena de 10 años. Con lo cual, si no confesaba ninguno, les caía en dos años. Pero cada uno de ellos por su canal puede decir, ah, pues si yo confieso y tengo suerte que el otro no lo hace, me cae solamente un año. Con lo cual, puede haber un incentivo a no confesar, esperando que el otro no lo haga, por supuesto. Lo que sí que os puedo adelantar es que, en cada una de las características de este juego, tal y como está definido con esta matriz de pagos, lo que harán los dos prisioneros será confesar. Porque es lo mejor que pueden hacer si no saben lo que hace el otro. Claro, si ellos se pudieran poner de acuerdo, hablar entre ellos, podrían llegar a un acuerdo y decir, pues no confesamos. Entonces tenemos algo de lo tal. Pero como no saben, no puede llegar a ese acuerdo porque están separados. La estrategia mejor para ellos, sin saber lo que hace el otro, es confesar. Porque si confiesan, saben que van a tener o cuatro años si confiesa el otro o un año nada más si el otro no confiesa. Bueno, pues esta estrategia que nos va a salir en este caso, de que para los dos es interesante confesar, es lo que se llama una estrategia dominante. Que es lo que nos interesará buscar en los dos. ¿Cuál es la estrategia dominante? Pero también esta estrategia es lo que se llama un equilibrio tenaz, porque una vez que sepan el resultado de la situación, cuando ya les digan, pues mira tu compañero también ha confesado, pues se sentirán muy aliviados, porque si no hubiera confesado, pues tendría una condena de diez años. Bien, entonces es una estrategia dominante porque es lo mejor que pueden hacer si no saben lo que hace el otro y además es un equilibrio tenaz porque... Una vez que sepan, o sea, a posteriori, una vez que se sepan lo que ha sucedido en realidad, los dos estarán contentos y no querrán cambiar la situación. Es decir, no sean arrepentidos. Vamos a ir con más detalle y vamos a ir analizando un poco estos dos conceptos que son los dos. Estrategias dominantes y equilibrio de no. Empezamos con la estrategia dominante. Aquí tenemos otro dilema. Tenemos dos empresas, la empresa A y la empresa B. Y las opciones del juego son o lanzar una campaña publicitaria o no lanzarla. Y las cifras que aparecen ahí son los resultados que se obtienen dadas las opciones realizadas por los dos. O sea, en esta primera casilla de la izquierda. Y de arriba tendríamos, si la empresa A lanza la campaña y la empresa B también la lanza. Entonces la empresa A obtiene un rendimiento de 12 y la empresa B un rendimiento de 10. Siguiendo con esa misma línea, si la empresa A lanza la campaña y la empresa B no la lanza, la empresa A obtiene un rendimiento de 18 y la empresa B un rendimiento de 10. ¿Vale? Estas serían las posibles acciones de las empresas y los resultados que podrían obtener. Bueno, pues vamos a fijarnos un poquito en las cifras que nos han llegado. Bueno, nos fijamos en la empresa A en primer lugar. La empresa A va a ganar... La empresa A va a ganar siempre más si lanza la campaña. Haga lo que haga la empresa B, porque si lanza la campaña y la empresa B la lanza también, pues va a ganar 12. Y si no la hubiera lanzado la empresa A, pues solo tendría 8. Si la empresa B no lo lanza, no lanza la campaña, la empresa A gana 18 lanzando la campaña y si no la lanzara, pues ganaría solo 12. Con lo cual siempre obtiene un mayor rendimiento lanzando la campaña, porque 12 es mayor que 8 en la vertical y 18 es mayor que 12. 12, 18, 8, entonces son los resultados de la empresa A. Entonces la horizontal 12, 18 es mayor que la horizontal de no lanzarla, que es 8, 9. Con relación a la empresa B, ahora nos tenemos que fijar en este 6, en el 6, en este 10, en el 3 y en el 0. Pues aquí fijándonos en la vertical vemos que... Y también le interesa lanzar la campaña porque va a obtener siempre, independientemente de lo que haga la empresa A, va a obtener más. Fijándonos en la horizontal, va a obtener más lanzando la campaña que no lanzando la campaña. Porque por un lado saca 6, por el otro 10. Y si la empresa A no lo lanza, la empresa B va a ganar 10 y si no lo lanza, ganaría solo 3. Con lo cual, también es una estrategia dominante para la empresa B. Por tanto, si suponemos que se comportan ambos de forma racional y disponen de toda la información que está en esta matriz de pago, ¿qué es lo que harán ambas empresas? Pues lanzar la campaña. Porque para cada una de ellas, la estrategia dominante es lanzar la campaña. Porque independientemente de lo que hagan los otros, la otra empresa obtiene más rendimiento que si no lanza la campaña. Por lo tanto, una forma extensa de expresar todo esto es mediante este árbol de decisiones. Que es ir detallando paso a paso, pues la empresa A decide entre lanzar y no lanzar. Si decide lanzar, pues la empresa B no lo hace, pues la empresa B también lo hace. Y lo que se obtiene con cada una de ellas. Es lo mismo, un poco más extenso y quizá un poco más complicado de ver estrategias dominantes. Aquí tenemos otro caso, es distinto, ¿eh? O sea, cambiamos los números con relación a la anterior, ¿no? Sí, cambiamos el 24 de abril. En el juego que habíamos hecho antes, esto era un 2, ¿vale? Nosotros hemos cambiado un número. Vamos a ver ahora qué pasa con las estrategias dominantes de cada una de las empresas. Bueno, ¿qué sucede en este caso? Si nos fijamos en la empresa B, para empezar. Pues a la empresa B está igual que antes. Le interesa lanzar la campaña. Nos fijamos en el 6, el 10, el 0 y el 10. Y vemos que esta columna de lanzar la campaña. 6, 10, que es mayor respectivamente para cada uno de los valores. Y no la otra, la anterior. ¿Qué pasa? Con lo cual, la empresa B tiene una estrategia dominante que es la alcanza de la campaña. Con relación a la empresa A, ¿qué es lo que sucede? Ahora nos tenemos que fijar en el 12, en el 8, el 24, este, lo marco ahí, pero este es un valor en trozo, lo voy a marcar en trozo porque es un valor de la empresa A, y el 18. Bueno, pues ahora, aquí ya no podemos ver que tenga la empresa una estrategia dominante, porque si elige como estrategia al alzar la campaña, resulta que si no la hace, si no la alza, la empresa B obtiene más rendimiento. Si no lanza la campaña, también obtiene más rendimiento si no lo lanza la empresa B. O sea, nos tenemos que fijar ahora aquí, o sea, buscar una estrategia dominante fijándonos en cómo es cada fila con relación a lo que sucede en función de lo que haga la empresa B. ¿Ok? Si la empresa B pone de toda información, sabrá que la estrategia dominante de la empresa B va a ser lanzar la campaña. Y entonces A, ¿qué es lo que hará? Pues lo mismo, porque sabiendo que va a lanzar la campaña, entonces le interesa más lanzarla porque va a obtener 2T de resultado y si no la lanza... Solo obtendrá 8. ¿Veis? En este caso la empresa A está condicionada por la acción de la empresa B, porque la empresa B tiene una estrategia dominante. Entonces la empresa B va a lanzar la campaña. Entonces la empresa A, sabiendo eso, conociendo la materia de pago, pues elige también lanzar la campaña porque si no la lanza obtiene menos. Bueno, esto en cuanto a estrategias dominantes. ¿Qué es el equilibrio de Nash? Que es algo que también hemos comentado. Bueno, pues el equilibrio de Nash, el nombre de Nash viene de este matemático que es el que desarrolló toda esta teoría de juego. Este es el mismo matemático que le dieron el premio Nobel de Economía por esta teoría de juego y es en el que está basada la película Una mente maravillosa. Que a lo mejor habéis visto en televisión, que es La vida de un matemático. Un matemático que tiene un problema mental, de que ve visiones, y ve a un personaje, a una niña, a un compañero suyo en la habitación que no existe, ni tal. Pues esa película, ese Nash que aparece en la película es el de... El de este equilibrio de Nash. Bueno, el equilibrio de Nash es una situación en la que se encuentran una serie de empresas como consecuencias de decisiones propias, pero que a la vista de lo que han decidido las demás, se muestra como las mejores opciones que podrían haber tomado cada una de ellas. O sea, las estrategias dominantes conducen a un equilibrio de Nash siempre. Porque la otra empresa adopta esa estrategia dominante que la conduce a la mejor opción para ella independientemente de lo que haga. Es decir, la estrategia dominante, de lo que hemos visto hasta ahora, nos permite saber a priori qué debemos hacer para alcanzar el óptimo. Es la constatación a posteriori, una vez que se han ejercido las acciones y se han tomado las restricciones, y entonces cada jugador constata que está en la situación óptima dado lo que han hecho los demás. Y por tanto no se atendiente el exorcismo. Los equilibrios de NARC son estables porque no hay ningún incentivo por parte de ninguno de los intervinientes en querer cambiar esa situación. Vamos a ver cómo podemos distinguir lo que son las estrategias dominantes y el equilibrio de NARC. Para ello vamos a utilizar, porque lo que hay a continuación son preguntas de examen relativas a esto, a juego, a teoría de juego. Por cierto, ya que veo esta de aquí, en este caso, esto que pone 4,4, 8,1, lo que indica es... El resultado de cada uno de los, en este caso son prisioneros, pues bueno, en esta casilla, para verlo, el 8 indica el resultado del prisionero 1 y el 1 indica el resultado del prisionero 2. ¿Eh? Es lo que poníamos antes con la barra. En los, en las matices de pagos que hemos puesto antes, poníamos una diagonal ahí, aquí poníamos el 8 y aquí poníamos el 1, ¿vale? Pues esto es lo mismo para que no digáis, ¿y esto qué significa? Pues bueno, no es que sea 8,1, sino que la primera cifra es el resultado del prisionero 1 y el 1 es el resultado del prisionero 2. Bueno, vamos a ver, ahí tenéis unos ejercicios, vamos a volver con este ejercicio, por ejemplo, y vamos a ver cómo lo resolveríamos un poco ya en la práctica. Por supuesto. y bueno vamos a ver cómo podemos distinguir lo que son estrategias dominantes y lo que es el equilibrio para eso una vez que tenemos ahí la matriz de pagos nos empezamos dejando primero en el jugador en la empresa tomamos la primera de las columnas la de lanzar la campaña de la empresa y rodeamos con un título y la mejor solución para el jugador en este caso la mejor solución para el jugador es el 2 dentro de la columna lanzar la campaña o sea estamos por la empresa está en las horizontales pero nos fijamos en la mejor opción que tiene en la columna en la primera columna luego hacemos lo mismo para la segunda columna si es la empresa viendo la cara Y elegimos entre 18 y 12 su mejor opción. Nuevamente está en esta horizontal, ahí tenemos también la opción en ese lugar. ¿Vale? ¿Está claro? O sea, cogemos para la empresa A y elegimos la mejor opción entre 12 y 8 y entre 18 y 12 para cada una de las columnas. Ahora pasamos a la empresa B. Y nos fijamos en la fila, para cada una de las filas, cuál es su mejor opción. Entonces, en la fila que he marcado en azul, la mejor opción para él es el 6, ¿no? Es mejor el 6 que el 0. Pues marcamos el 6. Y ahora nos fijamos en la segunda fila. Para la empresa B tenemos que elegir entre 10 y 10C. Pues bueno, el 10. Es mejor opción que el 3. ¿Vale? Pues ya tenemos, esto es lo que tenemos que hacer. Marcar con círculos, o como queramos, las mejores opciones de cada empresa para cada una de las respuestas del adversario. Bien, si nos encontramos con una fila o con una columna que tenga los dos números del mismo color, o sea, referidos al mismo jugador, esos son estrategias dominantes para ese jugador. O sea, en rojo que he marcado con el jugador 1, vemos que en esta fila las dos cifras están rodeadas por un círculo. Con lo cual, para la empresa, lanzar la campaña es una estrategia dominante. En cuanto al jugador B, vemos que esta columna, lanzar la campaña, tiene también las dos cifras. Las dos cifras que le corresponden al jugador B, 6 y 10, marcadas por un círculo. Entonces, eso quiere decir que lanzar la campaña es también una estrategia dominante para el jugador B. Vale. Bien, así es como identificamos las estrategias dominantes. Si en la misma fila o en la misma colina están marcadas las dos cifras con el mismo color, con un círculo del mismo color. Vale, con eso marcamos las estrategias dominantes. Y ahora, ¿cómo sabemos si hay un equilibrio de edad? Bueno, pues si en una casilla los dos números están rodeados con un círculo, entonces ahí tenemos un equilibrio de edad. Entonces, en esta casilla que tenemos aquí, las dos cifras están rodeadas por un círculo, con lo cual esa casilla es un equilibrio de edad. O sea, en este ejemplo, la empresa... La empresa A tiene como estrategia dominante lanzar la campaña, la empresa B también tiene como estrategia dominante lanzar la campaña y existe un equilibrio de edad en esa situación. Si hiciéramos lo mismo con este juego de aquí, a ver qué pasa aquí. Y antes, recordad que había cambiado aquí el número 24. Empezamos con la empresa A y nos fijamos en las columnas. Aquí tenemos que comparar el 12 y el 8, el 18 y el 24. Y rodeamos con un círculo la más interesante para él. El 12, porque es mejor que el 8, y aquí el 24. Y el 4, porque es mejor que el 18. Ahora cogemos y en azul marcamos la empresa B. Y nos fijamos en la fila y comparamos el 6 con el 0, con lo cual el 6 es el mejor opción, y el 10 con el 3, con lo cual el 10 es también mejor opción. Y es lo que nos decía antes. La empresa A, la empresa B, tiene una estrategia dominante porque hay una columna en la que los dos valores están rodeados con un círculo. El 6 y el 10. Entonces, la estrategia dominante para la empresa B es avanzar la campaña. Sin embargo, la empresa A no tiene en las filas ninguna, ninguna de las dos tiene los dos valores marcados por un título. Con lo cual, la estrategia B no tiene, perdón, la empresa A no tiene estrategia dominante. Y aquí vemos también que esta casilla inicial está en los dos títulos marcados por un título, con lo cual ese será equilibrio de nada. ¿Sí? Porque las dos casillas, los dos números, los dos números de la casilla están rodeados con un título. Entonces, ¿qué es lo que hará? La empresa B lanza la campaña, pero como hemos visto antes, la empresa A, que no tenía estrategia dominante, sabiendo que la empresa B va a lanzar la campaña, lanzará también la campaña. Y ese equilibrio será el... equilibrio de las porque la empresa no va a querer cambiar una vez que se han tomado las decisiones no va a querer cambiar su postura y la empresa ve tampoco porque la opción que tiene es no lanzarlo y si no la lanza aún está en la situación pues así es como numéricamente o gráficamente obtenemos estrategias dominantes de equilibrio y lo último que tenéis ahí son preguntas de examen que han salido en exámenes relativas a teoría de acuerdos que os pueden servir para reportar lo que es la acción bueno pues con esto hemos acabado el tema 6, el de oligopolios con la teoría de acuerdos nos queda una última tutoría que es el próximo día 16 y con eso habremos acabado las teorías de este curso pues hasta el próximo lunes un saludo nos vemos el próximo lunes