Apostila teoria dos jogos

Page 1

Notas em Teoria dos Jogos e Informaçãoy Guilherme Hamdan Departamento de Economia, PUC-Minas e EPGE/FGV Emanuel Ornelas Departament of Economics, University of Georgia, USA 13 de novembro de 2006

Sumário 1 Introdução 1.1 O Que é Um Jogo? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Os Elementos Básicos de Um Jogo . . . . . . . . . . . . . . . . . . . . .

3 6 7

2 Jogos Estáticos de Informação Completa 11 2.1 Representação de Jogos Estáticos de Informação Completa: Forma Normal ou Estratégica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.2 Resolução de Jogos Estáticos de Informação Completa . . . . . . . . . . 17 2.2.1 Estratégias Estritamente Dominantes . . . . . . . . . . . . . . . 18 2.2.2 Estratégias Estritamente Dominadas . . . . . . . . . . . . . . . . 21 2.2.3 Estratégias racionalizáveis (análise de "melhores respostas") . . . 27 2.3 Equilíbrio de Nash . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.3.1 Estabilidade, existência e unicidade do equilíbrio de Nash . . . . 32 2.3.2 Equilíbrio de Nash e Eliminação de Estratégias . . . . . . . . . . 35 2.3.3 Equilíbrio de Nash com três jogadores . . . . . . . . . . . . . . . 38 2.3.4 Discussão do conceito de equilíbrio de Nash . . . . . . . . . . . . 39 2.4 Estratégias Mistas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.5 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.5.1 Oligopólio de Cournot . . . . . . . . . . . . . . . . . . . . . . . . 56 2.5.2 Oligopólio de Bertrand . . . . . . . . . . . . . . . . . . . . . . . . 67 2.5.3 Oligopólio de Bertrand com bens diferenciados . . . . . . . . . . 69 2.5.4 O problema dos comuns . . . . . . . . . . . . . . . . . . . . . . . 71 y

Preliminar e incompleto. Gentileza não citar sem a permissão expressa dos autores. Todos os direitos reservados.

1


3 Jogos Dinâmicos de Informação Completa 3.1 Forma Extensiva . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Indução Retroativa: jogos de informação completa e perfeita . 3.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 O modelo de Stackelberg . . . . . . . . . . . . . . . . 3.3.2 Barganha sequencial . . . . . . . . . . . . . . . . . . . 3.4 Equilíbrio Perfeito em Subjogos . . . . . . . . . . . . . . . . . 4 Jogos Repetidos 4.1 Jogos repetidos …nitos . . . . . . . . . . . . . . . . . . 4.2 Jogos repetidos in…nitamente . . . . . . . . . . . . . . 4.3 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Duopólio de Cournot repetido in…nitamente . . 4.3.2 Política Monetária Temporalmente Consistente

. . . . .

. . . . .

. . . . .

. . . . .

. . . . . .

. . . . .

. . . . . .

. . . . .

. . . . . .

. . . . .

. . . . . .

. . . . .

. . . . . .

. . . . .

. . . . . .

74 75 77 85 85 87 92

. . . . .

101 101 107 112 112 114

5 Jogos bayesianos estáticos e equilíbrio bayesiano de Nash 118 5.1 Cournot sob informação incompleta . . . . . . . . . . . . . . . . . . . . 118 6 Informação assimétrica e teoria dos contratos 6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.1 Dinâmica do relacionamento . . . . . . . . . . . . . . . . . . . . 6.2 Informação simétrica: …rst-best . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Descrição do modelo . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.2 O contrato de informação simétrica . . . . . . . . . . . . . . . . . 6.3 Trade-o¤ entre incentivos e risk-sharing: moral hazard . . . . . . . . . . 6.3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.2 Moral Hazard: otimalidade em second best . . . . . . . . . . . . 6.4 Seleção adversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Um modelo discreto de discriminação de preços: Mussa-Rosen (1978) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.3 First-best: discriminação perfeita . . . . . . . . . . . . . . . . . . 6.4.4 Informação imperfeita: discriminação de segundo grau (preços não-lineares) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.5 Sinalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2

123 123 124 125 125 126 131 131 132 136 136 138 139 140 143


1

Introdução

Essas notas pretendem dar uma visão compreensiva da noção de comportamento estratégico e de como essa noção se relaciona intimamente com as ciências sociais em geral e com economia em particular. Na verdade, no que podemos caracterizar como uma de…nição “cotidiana” do que entende-se por um jogo, poderíamos dizer que a primeira idéia que geralmente nos ocorre é que um jogo é “uma disputa de qualquer espécie”. No entanto isso apenas não basta: uma noção razoável do que seria um jogo por certo nos informaria que jogos também são jogados de acordo com algumas regras particulares associadas à cada jogo ou a um conjunto deles. Isto é, se observamos dois jovens trocando “sopapos” na rua ou em alguma casa noturna qualquer, não diríamos que se caracteriza um jogo, mas tão somente um destempero ou uma estupidez. No entanto, se os levarmos para um ringue, selecionarmos oponentes com características físicas relativamente próximas às deles, colocarmos luvas e especi…carmos quanto tempo eles têm para lutar, o que vale e o que não vale, tudo isso sob o julgo de um terceiro que chamamos juíz ou árbitro, então uma boa parcela das pessoas vai concordar que aquilo pode ser chamado de um jogo - no caso, um esporte. Posto isso, não é exatamente um problema pensarmos em exemplos imediatos a partir da caracterização sugerida. Jogos incluem jogos esportivos, de cartas, de mesa, etc. A grande maioria dos jogos de…nidos de acordo com essa lógica possuem um elemento competitivo e outro interativo. Isto é, um jogador deve levar em conta o comportamento do(s) outro(s) jogador(res) envolvidos no jogo. Nesse sentido, seu grau de sucesso nesse jogo dependerá não apenas da forma como ele próprio se comporta, mas também e efetivamente das ações dos demais jogadores que estão no jogo. Por exemplo, no tênis, não basta meramente tentar devolver a bola para o outro jogador, mas sim devolvê-la de uma maneira tal que o adversário não consiga retorná-la. Portanto, notemos, no tênis, a questão “aonde jogar a bola?”dependerá, dentre vários fatores, de aonde o outro jogador está localizado. Da mesma forma ocorre no “War”, quando não devemos apenas atacar as regiões em função do nosso objetivo sorteado (e lembre-se, a vitória de um jogador nesse jogo signi…ca a derrota de todos os demais participantes), mas também em função do poder de fogo do(s) adversário(s), que pode(m) retaliar um ataque qualquer. Esse elemento de interação é a principal característica das situações que estudamos em teoria dos jogos e é o que a distingue das outras áreas cujo elemento objeto de análise é algum tipo de processo de tomada de decisão por parte de agentes racionais, em um sentido que …cará claro no decorrer do texto. Há várias características que são comuns a um grande leque de jogos. Primeiro, os jogos possuem regras, mas exatamente o quê essas regras irão especi…car? Sabemos que as regras de uma situação de interação estratégica podem ser as mais diversas possívies, mais ou menos pormenorizadas e também mais ou menos complexas. No entanto podemos sugerir algumas características mais gerais que vão estar incorporadas 3


pela quase totalidade dos jogos tais quais a gente os conhece. Primeiro, quais são os jogadores. Em todo jogo há dois ou mais jogadores1 , cada um deles consciente do que é melhor para si próprio. Logo, para a gente, um jogador é tão somente um agente inserido em um processo de tomada de decisão, de escolha, no qual o comportamento alheio importa. Segundo, as regras especi…cam a ordem nas quais as ações são tomadas, assim como que ações são essas, que ações que cada jogador pode escolher. Nós vamos chamar essas ações passíveis de escolha por um jogador de estratégia. E terceiro, as regras de…nem qual(is) é(são) o(s) resultado(s) do jogo em função das escolhas tomadas por cada um dos jogadores. Observe então que o resultado que um jogador (ou um grupo de jogadores com o mesmo objetivo, uma equipe) qualquer obterá depende não apenas de seu comportamento como também das escolhas (ações) feitas pelos demais jogadores. Cada jogador sabe disso, e sabe que escolher a sua melhor ação possível requer uma “previsão” e…ciente do que ele acha que os outros jogadores irão escolher. Essas características gerais de jogos tipi…cam várias situações do mundo real que não são jogos no sentido esportivo ou de diversão. Por exemplo, quando um representante patronal e um líder sindical se engajam em um processo de barganha sobre a formação de um novo contrato, pode-se caracterizar facilmente uma situação de jogo. As regras, nesse ambiente, não são tão detalhadas e formais como um “Scotland Yard”, por exemplo, mas há regras: ofertas e contra-ofertas são feitas pelas partes interessadas, que buscam um acordo …nal o mais favorável possível para o seu lado. E mais, a formulação da oferta por um dos lados da negociação deve considerar qual será a reação do outro lado em função dessa oferta que ele recebeu. Outros exemplos de barganha podem ser extraídos no nosso dia-a-dia, como é o caso quando compramos ou vendemos um automóvel, fazemos um contrato de aluguel etc. Obviamente cada situação tem suas especi…cidades, mas há vários elementos comuns em todos esses tipos de negociação. A moderna teoria dos jogos iniciou sua evolução já há algum tempo. Um primeiro marco teórico da sua fase moderna constituiu-se na contribuição de Von Neumann e Morgenstern (1944). Entretanto, seu conceito mais difundido surgiu de um artigo de John Nash - um dos três2 agraciados com o Prêmio Nobel de economia em 1994, devido aos trabalhos na área de teoria dos jogos -, em 1951. Depois disso, muito já se fez, embora a teoria dos jogos tenha alcançado a importância que hoje detém apenas em períodos mais recentes, especialmente a partir da década de 1980. Atualmente, o arcabouço de jogos ganha valor crescente, à medida em que aumentam suas possibilidades de aplicação. Ele é hoje amplamente utilizado em economia - em análises de consistências intertemporais de políticas econômicas, em organização industrial, política antitruste e regulação, em teoria de leilões, em estrutura penal ótima e em 1

Se você estiver pensando em algum jogo no qual não há outros jogadores em “carne e osso” como você, como é o caso de diversos vídeo-games, lembre-se que você está jogando contra a máquina. Da mesma forma, alguém que está jogando “paciência” está jogando contra o baralho. 2 Os outros dois foram John Harsany e Reinhard Selten.

4


muitos outros casos -, mas não se restringe a ela: envereda-se também por outras área das ciências sociais, como a sociologia, ciência política e direito, por exemplo. Um motivo para não estudá-la não pode ser, portanto, alguma eventual falta de abrangência e aplicabilidade. Outro ponto relevante a se ressaltar aqui nessa introdução diz respeito à taxanomia da disciplina. Podemos dividir o estudo de teoria dos jogos em dois grandes grupos ditos jogos cooperativos e os não-cooperativos, cuja distinção formal foge do escopo do nosso estudo. Apenas o segundo grupo será estudado. Essa escolha baseia-se no fato de que são sobre os jogos não-cooperativos que a teoria é mais desenvolvida e tem maior aplicabilidade de interesse especí…co à economia. Além disso, pode-se, com algumas hipóteses adicionais, tratar os jogos cooperativos como se também fossem não-cooperativos. Por trás desses, a idéia básica é que cada indivíduo é eminentemente egoísta, ou seja, procura sempre agir de modo a obter o maior benefício possível para si mesmo, independente do que possa acontecer às outras pessoas. Evidentemente nem sempre se veri…cam situações como essas. Pode ocorrer de um indivíduo preocupar-se com o que acontecerá com outros indivíduos, alterando por isso a sua forma de agir em função de algum tipo deliberado de altruísmo - pense, por exemplo, em situações que envolvam familiares próximos. Todavia, essas possibilidades podem ser abordadas também pela ótica individualista. Para isso, basta supor que todos os aspectos que afetam (positiva ou negativamente) outras pessoas já estejam considerados nos números referentes aos níveis de ganhos (ou utilidade) relacionados a cada situação (que chamaremos de “payo¤s”). Essa é a abordagem que utilizaremos em todo o texto: cada jogador escolherá suas ações de modo a ter o maior benefício para si mesmo em cada situação, sendo que esse termo “maior benefício” considerará todos os aspectos da realidade relacionados à própria pessoa e às outras pessoas que o indivíduo leva em consideração de alguma forma. Agindo assim, esse indivíduo poderá ser chamado de “racional”, hipótese que adotaremos indiscriminadamente. Uma vez que esteja claro que trataremos apenas de jogos não-cooperativos, vamos adotar um taxonomia padrão nos cursos de teoria dos jogos e que decorre basicamente de duas noções associadas respectivamente à dinâmica (ao “timing”) das escolhas do jogadores e à idéia de “informação”que adotaremos. Com relação ao “timing”do jogo, classi…camos os jogos como jogos estáticos e jogos dinâmicos. No primeiro caso as escolhas dos jogadores são simultâneas (como em um jogo de par ou ímpar) e no segundo são sequenciais, no sentido de que algum jogador, ao tomar sua decisão, já observou alguma escolha alheia que é relevante para essa sua escolha. Por outro lado, para cada tipo de jogo que venhamos a analisar nesse curso, estará associada, explícita ou implicitamente, alguma caracterização informacional do ambiente. Essa caracterização é fundamental e para termos uma idéia inicial da explicação de sua relevância basta focarmos mais uma vez no caráter de interdependência da interação entre os agentes: se é verdade que o

5


comportamento alheio importa para cada jogador em particular, então o processamento das informações (ou seja, o conhecimento) que cada um tem sobre esse comportamento alheio é em si um elemento relevante de análise. Jogos não-cooperativos são portanto classi…cados de acordo com uma série de conceitos associados à cada situação, como informação completa ou incompleta, perfeita ou imperfeita, simétrica ou assimétrica etc. Para nós aqui nesse curso será de fato importante entender o que signi…ca “conhecer um fato sequencialmente” e trabalharmos com as idéias de jogos estáticos e dinâmicos de informação completa (e perfeita/imperfeita) e jogos estáticos e dinâmicos de informação incompleta, nessa ordem. Para cada uma dessas noções especi…caremos um conceito de equilíbrio segundo o qual faremos previsões sobre o comportamento dos jogadores envolvidos de forma a inferir alguma coisa sobre o resultado daquele jogo. Isto posto, tenha em mente que o objetivo deste texto é apresentar os principais desenvolvimentos e aplicações da teoria dos jogos. Para tanto seus conceitos mais importantes são apresentados, no sentido de possibilitar a previsão dos resultados de alguns jogos, com maior ou menor acuidade. O texto procurará se ater às formalizações apenas na medida em que as consideramos necessárias para de…nir precisamente o objeto em estudo, mas espera-se que em momento algum o aluno se veja em di…culdades em função de algum tipo de formalização. Praticamente nenhuma demonstração matemática é desenvolvida, uma vez que a nossa meta é apresentar um texto de nível introdutório, acessível àqueles com razoável domínio dos conceitos básicos de (micro)economia. Vale ressaltar também que não é um objetivo apresentar qualquer inovação teórica, mas apenas sistematizar alguns dos aspectos mais importantes e já consolidados de teoria dos jogos, uma vez que ainda não existe nenhum texto satisfatório publicado em português que tenha as características de referência básica e, ao mesmo tempo, trate do assunto com a profundidade mínima requerida. Obviamente, uma in…nidade de desenvolvimentos recentes da teoria não serão incorporados no texto, que, pode-se dizer, tenta simplesmente cumprir o papel de um “livro-texto”para estudantes de graduação em economia - e nada mais além disso.

1.1

O Que é Um Jogo?

Seguindo a de…nição de Mas-Collel et.al. (1995, p.219), pode-se de…nir um jogo como “uma representação formal de uma situação onde um número de indivíduos interagem em um cenário de interdependência estratégica”. Isto é, o bem-estar de cada um depende não apenas das próprias ações, mas também das ações dos demais envolvidos. Assim, a melhor ação que cada jogador pode escolher em geral dependerá da expectativa sobre o que os demais jogadores irão fazer. Situações como essa são, claramente, muito distintas daquelas estudadas nos cursos de microeconomia tradicional: tanto na teoria do consumidor quanto na de mercados concorrenciais e monopolizados, essa interdependência não é explicitamente incorpo6


rada. Sendo assim, naqueles casos os indivíduos, as …rmas ou as instituições (governo, por exemplo), ao de…nirem suas escolhas ótimas, não se preocupam com o que os outros agentes poderão fazer. Por outro lado, se existe a interdependência, caracteriza-se então uma situação onde há externalidades nas ações dos agentes, e por isso cada um, ao fazer suas escolhas, preocupa-se com como os outros irão (ou poderão) agir. Dessa forma o que estamos buscando em última instância é tão somente emprestar à anàlise das situações de interesse um elemento a mais de realismo que decorre do fato de que pessoas, empresas e instituições interagem entre si e que essas interações têm implicações relevantes do ponto de vista individual e social. Com essa de…nição, podemos perceber que praticamente todas as situações que usualmente as pessoas chamam correntemente de “jogo” de fato são aqui também caracterizadas como tal. Todavia, muitas outras situações, inclusive (mas não apenas) econômicas e jurídicas, também se enquadram na de…nição.

1.2

Os Elementos Básicos de Um Jogo

Em geral (mas nem sempre), um jogo deve fornecer ao analista algumas informações elementares, quais sejam: 1. os jogadores (quem são os envolvidos?), 2. as regras (quem move quando? O que se sabe quando for sua vez de jogar? etc.), 3. os resultados (para cada conjunto de ações dos jogadores, quais são os resultados?), 4. os payo¤s (quais são as preferências - representadas em suas funções de utilidade - dos jogadores em relação aos resultados possíveis de forma que tenhamos uma ordenação inequívoca dos resultados?). Antes de apresentarmos exemplos que ilustrarão os elementos acima, faremos uma pequena digressão sobre o ponto (4), em relação aos ganhos (payo¤s3 ) que cada agente tem ao se engajar em um processo de interação estratégica. Preferências e utilidade: Em quase toda a teoria que abordaremos nesse curso, fundamentalmente estaremos tratando de processos de escolhas feitas por agentes4 3

A opção por se utilizar na maioria das vezes o termo "payo¤ "e não "ganho"decorre do fato de que quase a totalidade dos artigos e textos em português que utilizam a linguagem de jogos também faz isso. Isso é verdade para outros termos corriqueiros na linguagem de jogos, como "players"(jogadores), por exemplo. 4 A partir daqui utilizaremos os termos agentes e jogadores indiscriminadamente como similares. Podem ser consumidores, …rmas, governo ou qualquer outra pessoa física ou jurídica (mesmo informal,

7


racionais. Sem perda de generalidade, considere por enquanto que agentes racionais são aqueles que, tendo que escolher uma opção dentre um conjunto de possibilidades, escolhe aquela que melhor lher convier - ou dito de outra forma, aquela que lhe dá a maior utilidade. Vamos rapidamente quali…car esse processo de escolha5 . Considere um cidadão que está sendo acusado pelo Estado de um delito qualquer. Em um depoimento à autoridade legal constituída, ele pode contar três estórias que são igualmente críveis, não importando se alguma delas é ou não verídica. Chamemos essas opções de escolha de 1; 2; 3. Por algum motivo qualquer, esse cidadão sabe que sua pena no caso de escolher cada uma das opções é de 3,6 ou 9 meses, respectivamente. Considerando que no caso dele …car preso lhe confere um custo (crescente no tempo de prisão, de maneira que esse indivíduo está tanto pior quanto maior for o seu tempo de prisão), então podemos dizer que a opção 1 é (estritamente) preferível à opção 2, que a opção 1 é (estritamente) preferível à opção 3 e que a opção 2 é (estritamente) preferível à opção 36 . Logo, se esse cidadão escolhe a opção 1, dizemos que ele é racional. Se as penas fossem de 3,3 e 6 meses , respectivamente, então diríamos que a opção 1 é preferível à opção 2, que a opção 2 é preferível à opção 1 (de modo que as opções 1 e 2 são opções semelhantes do ponto de vista de quem está escolhendo - dizemos que o agente é indiferente entre 1 e 2), que a opção 1 é (estritamente) preferível à opção 3. e que a opção 2 é (estritamente) preferível à opção 3. Nesse caso, se o cidadão escolhesse a opção 1 ou a opção 2 diríamos que ele é racional. Na verdade o que estamos propondo aqui é tão somente uma forma de organizar teoricamente o processo de escolha de um agente qualquer. Adotamos a hipótese de que, no caso em que ele tem que fazer uma escolha dentre um leque de opções, esse agente é capaz de ordenar todas essas opções de acordo com suas preferências7 . Essas preferências, por sua vez, são formalmente representadas por funções matemáticas ditas "funções utilidade". Antes que alguém se assuste com algum argumento formal, vamos logo dizer que uma função utilidade apenas traduz de maneira numérica o processo através do qual um agente, um jogador, faz a sua escolha. No exemplo acima, suponha que essa função fosse dada por 1 u (x) = , onde x 2 f3; 6; 9g . x no sentido de não estar inserido em algum sistema legal constituído, como por exemplo uma …rma que opera no setor informal da economia ou um criminoso) que possa ser representada em alguma situação de comportamento estratégico. 5 Essa seção é uma inserção muito breve de textos encontrados comumente em livros-textos de microeconomia. Os alunos interessados devem recorrer a esses livros para uma exposição mais completa do assunto. 6 Dizemos que as preferências de um agente qualquer são "transitivas"quando, por exemplo, dadas três opções 1,2 e 3 tais que 1 é prefeível a 2 e 2 é preferível a 3, podemos dizer que 1 é preferível a 3. 7 Nesse caso dizemos que as preferências são "completas": entre um conjunto de duas ou mais opções no processo de escolha, o agente é sempre capaz de ordenar essas opções de acordo com um índice indica seu bem-estar, uma função utilidade.

8


Isso é, a utilidade do agente depende das escolhas que ele deve fazer e que, cada uma, lhe custarão algum tempo de cadeia, x = 3; 6 ou 9 meses. Então 8 1 > < u (3) = 3 u (6) = 16 tal que, observe, u (3) > u (6) > u (9) > : u (9) = 1 9 de maneira que, por esse critério, o agente seria racional8 se escolhesse a opção 1, na medida em que a sua utilidade seria maior do que se escolhesse qualquer das outras duas possibilidades. É importante notar que a função acima, u (x) = x1 , não é a única função que pode representar as preferências do nosso agente - na verdade há inúmeras possibilidades. Por exemplo, suponha que u (x) = Nesse caso,

a , onde a > 1é uma constante e x 2 f3; 6; 9g . x

8 > < u (3) = u (6) = > : u (9) =

a 3 a 6 a 9

tal que, novamente, u (3) > u (6) > u (9)

Segue então que para a gente não importa exatamente o quanto um agente prefere uma opção à outra, mas tão somente a ordem na qual ele estabelece essas opções. Nesse sentido, ambas as funções utilidades representam as preferências do mesmo agente descrito acima. Faça a mesma coisa para o segundo ordedamento proposto acima, 3,3 e 6 meses, e veri…que o que se dá. Isto posto, uma função de ganho ("payo¤") é tão somente uma representação numérica das preferências dos jogadores em função de suas possibilidades de escolha. No entanto, como se trata de situações de interdependência estratégica, essa função depende também das possibilidades de escolha dos demais jogadores envolvidos. Mas no …nal o número associado àquelas opções escolhidas na verdade re‡etem um conjunto de preferências subjacentes que nos permitirão ordenar as opções de escolha de cada jogador de uma forma clara que …cará expressa nos exemplos abaixo. 8

Nesse ponto do texto, sem considerarmos elementos de interação estratégica, dizemos que um agente é racional se suas preferências são completas e transitivas.

9


Exemplos: De…nidos os elementos principais e feita essa breve explanação sobre a representação das preferências dos jogadores, podemos sugerir alguns exemplos simples para começarmos a pensar em situações passíveis de serem modeladas como jogos. Exemplo 1 - Casamento de moedas (este é usualmente um dos primeiros exemplos de jogos que os textos mais didáticos sobre o tema apresentam) 1. há dois jogadores, ditos 1 e 2, 2. cada jogador joga simultaneamente uma moeda para cima, 3. se o resultado das duas moedas for o mesmo, 1 paga R$1,00 para 2; caso contrário, a ordem do pagamento se inverte, 4. depende da especi…cação da função utilidade, de como cada jogador avalia a importância que tem para si ganhar ou perder R$1,00. Exemplo 2 - Jogo da Velha 1. novamente há dois jogadores, ditos X e O; 2. como todos quase certamente conhecem o jogo, de…na você mesmo(a) como um exercício os seus elementos básicos. Os exemplos acima são situações de claro con‡ito, uma vez que o que um jogador ganha o outro perde: são exemplos do que chamamos de jogos de soma zero. Essa é uma possibilidade, mas que não necessariamente sempre ocorrerá. O exemplo abaixo fornece um caso diferente, onde dois jogadores ou ganham juntos ou perdem juntos. Exemplo 3 - Encontro em BH 1. dois jogadores: João e Maria; 2. os dois jogadores estão separados e incomunicáveis. Eles marcaram de se encontrar em algum lugar no centro às 12:00 hs para almoçar. Mas deixaram o lugar em aberto, dentre duas opções e então perderam a comunicação. Cada um tem de decidir aonde ir; 3. se eles se encontrarem, almoçam juntos. Caso contrário, sozinhos; 4. eles teriam payo¤ s iguais a uma unidade (qualquer que seja) almoçando juntos, e de zero almoçando sozinhos. Como se percebe nesse último caso, os jogadores têm interesses alinhados - o problema a se tentar superar é a falta de coordenação entre eles. Claramente, portanto, esse não é um jogo de soma zero. 10


2

Jogos Estáticos de Informação Completa

A primeira classe de jogos que serão apresentados são chamados jogos estáticos, em comparação com os sequenciais (ou dinâmicos), que serão vistos mais à frente. Esses jogos são ditos também jogos simultâneos, uma vez que os jogadores de…nem suas formas de agir “ao mesmo tempo”. O exemplo imediato é o jogo de “par ou ímpar”, no qual os dois jogadores revelam suas estratégias ao mesmo tempo. Antes que se faça alguma restrição sobre a realidade dessa premissa, note que não é necessário que de fato os jogadores façam suas escolhas literalmente ao mesmo tempo, mas tão somente que cada um dos jogadores, ao fazer a sua escolha sobre qual estratégia adotar, não tenha observado as escolhas feitas pelos demais jogadores. Nesse caso poderíamos ter um jogo de “par ou ímpar”, estático, em que um dos jogadores fez a escolha, digamos, 10 minutos antes do outro. Basta que o outro jogador, ao escolher o seu número, não saiba qual foi a escolha daquele que jogou primeiro. Quanto ao caráter de informação completa, refere-se ao fato de que cada um dos envolvidos conheçam as funções de ganho de todos os outros. Sendo um pouco mais rigoroso, isso signi…ca que a “função payo¤ de cada jogador é de conhecimento comum (common knowledge)”. Como exemplo, considere um jogo com dois jogadores, 1 e 2. Como já sabemos, esses jogadores têm um conjunto de opções dentre as quais cada um deve escolher uma da melhor forma que lhe convier. Mas sabemos cada par de escolhas possíveis associa a cada jogador uma utilidade, um número de acordo com o qual pode-se identi…car se cada um está em melhor ou pior situação do que nas demais opções. Nesse contexto, dizer que o jogo é de informação completa signi…ca dizer que cada jogador sabe não apenas a sua utilidade para cada combinação de escolha mas conhece também a utilidade do outro jogador em cada situação. Mas mais do que isso: cada jogador sabe também que o outro conhece a sua utilidade associada a essas opções. E mais ainda: cada jogador sabe que o outro sabe que ele sabe a utilidade do outro jogador em cada situação. E assim sucessivamente. Sendo um pouco mais formal, dizemos que um jogo qualquer é de informação completa quando a função de ganho (payo¤) de cada jogador é de "conhecimento comum". Para entendermos o que esse termo signi…ca, considere como exemplo uma situação com apenas dois agentes, 1 e 2. Nós dizemos que um evento X qualquer é de “conhecimento comum” nesse jogo se 1 sabe que X ocorreu; 2 sabe que X ocorreu. 1 sabe que 2 sabe que X ocorreu; 2 sabe que 1 sabe que X ocorreu. 1 sabe que 2 sabe que 1 sabe que X ocorreu; 2 sabe que 1 sabe que 2 sabe que X ocorreu

11


e assim in…nitamente. Sendo assim, um jogo estático com dois jogadores, 1 e 2, é de informação completa se, na de…nição acima X = função de ganho (payo¤) do outro jogador. Ou seja, 1 conhece a função payo¤ de 2; 2 conhece a função payo¤ de 1. 1 sabe que 2 conhece a função payo¤ de 1; 2 sabe que 1 conhece a função payo¤ de 2. 1 sabe que 2 sabe que 1 sabe a função payo¤ de 2; 2 sabe que 1 sabe que 2 sabe a função payo¤ de 1. e assim sequencialmente. Nesse jogos estáticos de informação completa (por de…nição, a função de ganho é de conhecimento comum) assumimos também que a racionalidade9 dos jogadores é de conhecimento comum. Nesse caso, 1 sabe que 2 é racional; 2 sabe que 1 é racional. 1 sabe que 2 sabe que 1 é racional; 2 sabe que 1 sabe que 2 é racional. 1 sabe que 2 sabe que 1 sabe que 2 é racional; 2 sabe que 1 sabe que 2 sabe que 1 é racional e assim in…nitamente. Logo adiante, quando começarmos a analisar a resolução de jogos estáticos de informação completa, …cará claro porque a noção de conhecimento comum de um determinado evento é relevante. Essa hipótese (informação completa) será utilizada em quase todo o texto, sendo ‡exibilizada apenas no …nal - isso se houver tempo hábil. O motivo fundamental dessa restrição é que a sua não utilização di…cultaria signi…cativamente a análise, fugindo do escopo do texto e do curso - embora a teoria dos jogos de informação incompleta já tenha sido signi…cativamente desenvolvida e consolidada, mas de…nitivamente está em um patamar de complexidade superior ao aqui pretendido. Vamos a partir de agora propor uma estrutura que será seguida ao longo dessas notas: uma vez entendido o conceito mais amplo (aqui, jogos estáticos de informação completa), vamos fazer uma exposição sobre a forma correta de representar esse tipo de jogo e posteriormente discutir como solucionar essa classe de jogos, com diversas nuances especí…cas associadas a cada uma das situações. Disso tratamos agora. 9

A de…nição de racionalidade nesse contexto de interdependência está descrita na próxima seção do texto.

12


2.1

Representação de Jogos Estáticos de Informação Completa: Forma Normal ou Estratégica.

A forma que utilizamos para representar jogos estáticos de informação completa é dita forma normal (ou estratégica). De acordo com a forma normal, devemos ter as seguintes informações sobre um jogo com n > 1 jogadores: 1. Os jogadores: 1; 2; :::; n. 2. O espaço (ou conjunto) de estratégia de cada jogador. Esse conjunto vai nos dizer quais são as possibilidade de escolha de cada um dos jogadores. Por exemplo, no jogo “par ou ímpar” o espaco de cada jogador i = 1; 2 é Si = fpar, ímparg Nesse ponto deve estar claro que o que chamamos de estratégia é apenas uma opção, uma escolha, uma ação possível que cada jogador pode tomar. 3. A função de ganho (payo¤) para cada jogador i = 1; 2; :::; n. Essa função, para um jogador i qualquer, associa um número em função das possibilidades de escolha de cada jogador. É ela que caracteriza o elemento de comportamento estratégico dos jogos na medida em que o ganho de cada jogador é afetado pela sua própria escolha mas também é afetado em alguma medida pelas estratégias adotadas por cada cada um dos demais jogadores. Nos jogos estáticos, o conjunto das estratégias disponíveis a cada jogador são de fácil visualização, correspondendo às opções de ação que cada jogador pode escolher. Veremos posteriormente que nem sempre elas serão tão claras, como no caso dos jogos dinâmicos. Sendo um pouco mais rigoroso, tome a de…nição abaixo: De…nição: A representação na forma normal de um jogo J com n jogadores especi…ca para cada jogador i = 1; 2; :::; n um conjunto de estratégias Si e uma função de ganho ui (s1 ; :::; sn ), onde si 2 Si . Formalmente, escreve-se J = (Si ; ui (si ; s i ))i=1;2;:::;n Em suma, a representação na forma normal ou estratégica de…ne quais são os jogadores envolvidos, quais são as estratégias disponíveis a cada um deles e os payo¤s para cada jogador referentes a todos os resultados possíveis. 1. os jogadores 1,2,...,n.

13


2. os espaçoes de estratégias, 8 > S1 = fs11 ; s12 ; :::; s1k1 g > > < S = fs ; s ; :::; s g 2 21 22 2k2 > ::: > > : Sn = fsn1 ; sn2 ; :::; snkn g

onde sij 2 Si é a j-ésima opção (estratégia) que o jogador i pode adotar no jogo.

3. a função de ganhos e os payo¤s de cada jogador, u i : Si S | {z ui (si ;s

i

!R }

i )2R

Ou seja, uma função especí…ca a cada jogador que associda um nível de utilidade a partir da sua escolha (si 2 Si ) e das escolhas dos demais n 1 jogadores (s i 2 S i ). Aqui o termo s i denota as escolhas de todos o jogadores que não o jogador i. Exemplo 4 - Dilema dos Prisioneiros: este constitui certamente o exemplo mais conhecido em teoria dos jogos, em função da sua estrutura simples e do seu resultado intrigante. Há inúmeras versões do jogo, que pode ser adaptado a situações muito distintas entre si. Mostraremos aqui primeiro a versão de Dixit e Nalebu¤ (1994), uma das mais criativas. Depois analisamos a estória padrão. A idéia é que havia um maestro que viajava de trem na antiga URSS. Com aparência não convencional, foi interpelado pelos policiais da KGB, que imaginaram poder tratarse de um espião. Revistando suas bagagens, os policiais encontraram partituras, que interpretaram como códigos. Apesar do maestro insistir que eram apenas partituras de músicas de Tchaikóvski que ele interpretava, acabou sendo preso. Passado algum tempo na prisão, chegaram os o…ciais ao maestro e disseram-lhe que ele teria um dia para decidir-se entre confessar ou não, mas que seria melhor confessar, uma vez que eles já haviam prendido o tal de “Tchaikóvski”. A proposta, feita aos dois prisioneiros, era a seguinte: se ambos confessassem, cada um …caria preso seis anos; se ninguém confessasse, como não haveriam provas concretas, …cariam ambos presos por um ano; se um confessasse e o outro não, o primeiro seria solto imediatamente, como prêmio à sua colaboração com a KGB, enquanto o outro, que além de culpado não havia colaborado, …caria detido por nove anos. O jogo é representado abaixo na forma normal em uma (bi)matriz, que é uma matriz aonde cada entrada possui dois números:

Maestro

NC C

Tchaiskóvski NC C 1; 1 9; 0 0; 9 6; 6 14


Logo, se está na forma normal, devemos extrair as três informações: (i) os jogadores: Maestro e Tchaiskóvski; (ii) para cada um dos jogadores, as estratégias possíveis: confessar (C) e não confessar (NC) e (iii) a função de ganho de cada jogador: os payo¤s do jogador 1 - Maestro - situam-se à esquerda em cada célula. Por sua vez, os payo¤s do jogador 2 - o que teve o azar de se chamar Tchaikóvski - encontram-se à direita. Essa será a regra utilizada em todo o texto e que é padrão na representação na forma estratégica: o jogador 1 e suas estratégias à esquerda, o jogador 2 e suas estratégias acima e, em cada célula, os payo¤s dos jogadores 1 e 2 à esquerda e à direita, respectivamente. Aqui, portanto, o número de jogadores é igual a dois, o conjunto de estratégias do Maestro é fC; N Cg, assim como o é o do jogador Tchaikóvski também é esse. Os resultados possíveis e os payo¤s para cada um deles são os mostrados no quadro acima: por exemplo, se ambos não confessam, cada jogador ganha ( 1; 1), que é uma medida do “bem-estar”, da “utilidade (ou desutilidade, no caso)” dos jogadores Maestro e Tchaiskóvski, respectivamente, caso ambos de declaram inocente. A lógica é que se ambos confessam, …cam cada um 6 anos presos. Se ambos se declaram inocentes, não há provas su…cientes mas em função do processo cada um …ca 1 ano preso. E se um jogador confessa e o outro não, então aquele que confessou tem um prêmio por ter confessado e é imediatamente libertado, enquanto que aquele que não confessou é punido por sua atitude de suposta não-cooperação e …ca preso por 9 anos. Essa é tão somente uma primeira representação do Dilema dos Prisioneiros adaptada para a estória acima. Outra estória, mais simples e recorrente, é tão somente que duas pessoas foram presas pela polícia e acusadas de cometer um delito qualquer - mas nós não sabemos (nem ninguém, a não ser os próprios jogadores) se efetivamente eles (ou um deles) são ou não culpados. Eles estão presos em celas separadas e cada um tem a opção de confessar ou não a autoria do delito. Sendo um jogo estático de informação completa, quando cada jogador faz a sua escolha ele não sabe a escolha do outro jogador (jogo estático). Além disso, a matriz de ganhos é de conhecimento comum (jogo de informação completa), de modo que ambos os jogadores visualizam sem nenhuma incerteza a matriz de ganhos, com as estratégias de cada jogador e os payo¤s de cada um para cada combinação de estratégias possíveis. Note que esses payo¤s são representações relativas das preferências de cada jogador e de forma alguma é único observe que os payo¤s no jogo acima são distintos dos payo¤s no jogo abaixo. O que importa é que toda representação possível dessa estória preserve o ordenamento dos ganhos dos jogadores. Por exemplo, a matriz

Jogador 1

Não Confessa (N C) Confessa (C)

Jogador 2 Não Confessa (N C) Confessa (C) 5; 5 1; 7 7; 1 4; 4

15


também pode ser a forma normal da mesma estória que descreve o Dilema dos Prisioneiros. Esse jogo, veremos adiante, tem um resultado surpreendente: ainda que ambos os jogadores.sejam inocentes e que ambos estejam melhor quando ambos jogam não confessar, N C, o melhor que cada um pode fazer individualmente é se declarar culpado e jogar C. Esse resultado decorre em função do elemento de interdependência estratégica que caracteriza o Dilema dos Prisioneiros. Exemplo 5 - Par ou ímpar. Como exercício, descreva o jogo de par ou ímpar a partir da matriz abaixo. Quais são os jogadores? E as estratégias de cada um? Quem jogou par e quem jogou ímpar?

Jogador 1

Par Ímpar

Jogador 2 Par Ímpar 1; 1 1; 1 1; 1 1; 1

Exemplo 6 - Guerra dos sexos. Um homem e uma mulher (na verdade um casal) devem decidir o programa que farão hoje à noite. Eles podem ir ao teatro ou ir ao Mineirão ver um jogo de futebol. A matriz abaixo descreve o jogo:

Homem

Mineirão Teatro

Mulher Mineirão Teatro 3; 2 1; 1 1; 1 2; 3

Descreva o jogo (jogadores, estratégias e payo¤ s) e note que o homem prefere ir ao futebol acompanhado da mulher. Mas ele prefere ir ao teatro acompanhado da mulher do que ir sozinho ao Maracanã. O mesmo acontece com a mulher, só que ela dá preferência pelo teatro. Exemplo 7 - O jogo do covarde ("the chicken game"). Nesse jogo dois motoristas, 1 e 2, se encontram em um estrada. Naquele lugar especí…co, há uma ponte estreita, de modo que apenas um veículo passa de cada vez. Logo, cada um pode avançar ou esperar o outro passar primeiro. Se algum dos jogadores, 1 por exemplo, avança e o outro espera, ele segue sua viagem e o outro espera um pouco mais - e vice-versa. Mas se ele avança e o oponente também, então há uma colisão e ambos perdem. O jogo é representado na bimatriz abaixo:

Motorista 1

Avança Espera 16

Motorista 2 Avança Espera 5; 5 5; 0 0; 5 1; 1


Exemplo 8 - Pedra x Papel x Tesoura. Neste jogo (um par ou ímpar mais so…sticado), cada jogador escolhe simultaneamente um dos três objetos relacionados abaixo (suas estratégias). Dependendo da combinação …nal, pode-se ganhar 1, -1 ou 0 (a lógica é que pedra ganha de tesoura, que vence o papel, que se sobrepõe à pedra; se o objeto for o mesmo, ninguém ganha).

Jogador 1

pedra papel tesoura

pedra 0; 0 1; 1 1; 1

Jogador 2 papel 1; 1 0; 0 1; 1

tesoura 1; 1 1; 1 0; 0

Temos portanto na forma normal (ou estratégica): 1. os jogadores: 1 e 2. 2. os espaços de estratégias. Ou seja, o que cada jogador pode vir a jogar, S1 = S2 = fpedra, papel, tesourag 3. a função de ganho (payo¤) de cada jogador: qual o ganho que jogador terá para cada combinação possível de estratégias. Há inúmeros exemplos de jogos estáticos de informação completa. Alguns deles nós veremos nesse texto ao discutir uma série de questões associdas às soluções de jogos estáticos de informação completa. Outros não serão tratados aqui, mas o conteúdo desse texto é mais do que su…ciente para que você entenda eventuais casos não tratados aqui.

2.2

Resolução de Jogos Estáticos de Informação Completa

Vamos a partir de agora analisar a solução de jogos estáticos de informação completa. Devemos ter em mente que solucionar um jogo signi…ca buscar determinar quais estratégias jogadores racionais adotariam em ambientes nos quais a racionalidade dos jogadores é de conhecimento comum10 . Ou seja, discutir a solução de um jogo signi…ca analisar métodos de previsão dos seus resultados. Aqui, duas são as características principais. A primeira é a precisão, que se refere ao fato de que, uma vez que sugerimos (previmos) um resultado, a probabilidade de que ele realmente venha a ocorrer em uma manifestação real do jogo será tanto maior quanto mais preciso tiver sido o método 10

Nesse ponto já deve estar claro o que signi…ca um evento qualquer ser de conhecimento comum. Nesse sentido, lembre-se que dizer que a racionalidade dos jogadores é de conhecimento comum em um jogo com dois jogadores, 1 e 2, signi…ca dizer que 1(2) sabe que 2(1) é racional, que 1(2) sabe que 2(1) sabe que 1(2) é racional e assim sucessivamente.

17


de previsão utilizado. A outra refere-se à abrangência do método, que diz respeito ao número de situações onde exista interdependência estratégica entre os envolvidos que ele consegue oferecer um resultado provável para ele. Infelizmente, em geral os métodos mais precisos são os menos abrangentes, e vice-versa. Procuraremos apresentá-los em ordem decrescente de precisão (consequentemente, em ordem crescente de abrangência). Portanto, o primeiro gerará respostas a muito poucos jogos, com a vantagem de que, quando a apresentar, essa será altamente con…ável. Por outro lado, o último propiciará respostas a um número muito superior de situações, embora seus resultados devam ser compreendidos com algumas ressalvas que nós iremos discutir. 2.2.1

Estratégias Estritamente Dominantes

Considere o Dilema dos Prisioneiros,

Jogador 1

NC C

Jogador 2 NC C 5; 5 1; 7 7; 1 4; 4

Em um jogo como este (e em todo jogo estático de informação completa), dizemos que uma estratégia de um jogador qualquer (do jogador 1, por exemplo) é uma estratégia estritamente dominante se, independente da escolha do outro jogador, o ganho que ele tem jogando esta estratégia é estritamente maior do que o ganho que ele teria jogando a outra estratégia. Como há duas estratégias, "Não Confessar"e "Confessar", temos que analisar essas duas possibilidades. Para veri…car se há a existência de estratégias estritamente dominantes, basta olhar, para cada jogador, se existe uma escolha que gere sempre o maior payo¤ para ele. Em um jogo representado na forma normal, na forma de matriz, deve-se então supor que o outro jogador escolha cada uma das suas estratégias possíveis. Se a melhor alternativa for sempre a mesma, então essa se constitui em uma estratégia estritamente dominante. Indo direto ao ponto, considere a estratégia "Confessar"do jogador 1. Se o outro jogador, 2, joga "Não Confessar", o ganho de 1 jogando "Confessar"é maior do que jogando "Não Confessar", 7 > 5. E se 2 joga "Confessar", o ganho de 1 jogando "Confessar"também é maior do que jogando "Não Confessar", 4 > 1. Logo dizemos que para o jogador 1 a estratégia "Confessar"é uma estratégia estritamente dominante: independente das escolhas alheias (do jogador 2, no caso), o ganho de 1jogando "Confessar"é estritamente maior do que jogando "Não Confessar". Dito ainda de outra maneira, a estratégia "Confessar"é uma estratégia estritamente dominante para o jogador 1 porque ela gera o maior payo¤ para este jogador toda vez que ele a jogar, independente das estratégias dos outros jogadores. Faça raciocínio análogo para o jogador 2 e veri…que que também para este jogador a estratégia "Confessar"é uma estratégia estritamente dominante. Dizemos então que no Dilema 18


dos Prisioneiros o per…l de estratégias ("Confessar", "Confessar") é um equilíbrio com estratégias estritamente dominantes. Ou seja, em um jogo estático de informação completa J com n jogadores, considere o espaço de estratégias de um jogador i qualquer, dado por Si . E suponha que a estratégia que esse jogador jogou tenha sido si 2 Si . Nós dizemos que si 2 Si é uma estratégia estritamente dominante para o jogador i quando, independente das escolhas alheias, o ganho que o jogador i tem jogando si 2 Si é estritamente maior do que o ganho que ele teria jogando qualquer outra estratégia disponível no seu espaço de estratégias, s0i 2 Si . Se para cada jogador i = 1; 2; :::; n há uma estratégia estritamente dominante s1 2 S1 ; s2 2 S2 ; :::; sn 2 Sn , então (s1 ; s2 ; :::; sn ) é dito um equilíbrio com estratégias estritamente dominantes. Formalmente, De…nição: No jogo J = fSi ; ui (si ; s i )gni=i a estratégia si 2 Si é uma estratégia estritamente dominante para o jogador i se ui (si ; s i ) > ui (s0i ; s i ), 8s0i 2 Si , s0i 6= si e 8s i 2 S i . Dito ainda de outra maneira, a estratégia si é uma estratégia estritamente dominante o jogador i se ela gera o maior payo¤ para ele toda vez que ele a jogar, independente das estratégias dos outros jogadores. De…nição: Primeiro princípio da racionalidade: considere um jogador i qualquer. Se existe si 2 Si tal que si é uma estratégia estriamente dominante, então i a jogará. – Observação: (si ; s i ) é um equilíbrio com estratégia estritamente dominante no jogo J se si é uma estratégia estritamente dominante para todo jogador i = 1; 2; :::; n. Na verdade, como veremos abaixo, (si ; s i ) será um equilíbrio com estratégia estritamente dominante no jogo J se si for uma estratégia estritamente dominante para pelo menos (n 1) jogadores. Logo, se um jogador tem uma estratégia que é estritamente dominante, ele, sendo racional, deve sempre jogá-la, pois, por de…nição, não haverá nada melhor a se fazer. Se todos os envolvidos em um determinado jogo possuem estratégias estritamente dominantes, seu resultado torna-se portanto facilmente conhecido, dada a racionalidade dos jogadores. O grau de acuidade dessa previsão é, de fato, extremamente potente. A…nal, é pouco provável que alguém não escolha fazer algo que seja reconhecidamente preferível a ele(a) sempre. Observe também a curiosidade da seguinte nuance no Dilema dos Prisioneiros. Considere que a polícia permita que os prisioneiros possam se comunicar entre si e, eventualmente, estabelecer algum acordo no sentido de nenhum deles confessar, para …carem detidos por menos tempo. Nesse caso, qualquer acordo que emergisse do contato entre 19


eles não teria credibilidade no sentido de que ambos os jogadores teriam incentivos a não cumprir o acordo, independentemente do fato de um jogador acreditar ou não que o outro irá cumprí-lo ou não. Como resultado, ambos acabam obtendo um resultado que é pior para todos, …cando ambos com um payo¤ de 4. É curioso perceber também que esse é o resultado que deverá prevalecer mesmo que ambos fossem inocentes, como seriam no exemplo dado o Maestro e o que teve a má sorte de possuir pais que apreciassem o nome Tchaikóvski. Caso tenhamos uma situação onde todos os jogadores, menos um, tenham estratégias estritamente dominantes, o resultado da interação também pode ser facilmente previsto. O que ocorrerá é que o jogador que não possui uma estratégia que seja estritamente dominante escolherá a alternativa que lhe dará maior utilidade, tomando como dado11 que os outros jogadores irão jogar aquelas estratégias que forem dominantes para eles.

jogador 1

A M B

E 0; 1 4; 0 3; 2

jogador 2 C 4; 0 2; 0 3; 5

D 5; 3 5; 3 6; 6

No jogo acima na forma normal (ou estratégica) temos 1. os jogadores: 1 e 2 2. os espaços de estratégias, S1 = fA; M; Bg e S2 = fE; C; Dg 3. os payo¤s, dados na matriz acima. Nesse jogo, observe que a estratégia D é estritamente dominante para o jogador.2: para qualquer escolha que o jogador.1 faça, a sua melhor resposta é jogar D (pois 3 é maior do que 1 e 0,.3 é maior do que 0 e 0 e 6 é maior do que 5 e 2). Sabendo disso (pois 1 sabe que 2 é racional), o jogador.1 escolherá a alternativa que mais lhe convém, dado que o jogador.2 sempre escolherá D. O melhor para ele é portanto jogar B (pois 6 é maior do que 3), o que leva ao resultado (B; D) do jogo como um equilíbrio com estratégias estritamente dominantes. Desta análise, concluímos que quando todos (ou pelo menos todos menos um) jogadores possuem estratégias estritamente dominantes, a previsão é, como referido, extremamente acurada. O problema é que na grande maioria dos jogos não existe essa facilidade analítica, e então outras formas de se prever os resultados têm de ser utilizadas. Há um outro conceito, parecido com o oposto do visto acima, que, embora não de…na o que deverá ocorrer, determina com muita segurança o que não deverá acontecer. 11

Lembre-se que assumimos que a racionalidade dos jogadores é de conhecimento comum.

20


2.2.2

Estratégias Estritamente Dominadas

Considere novamente o Dilema dos Prisioneiros,

Jogador 1

NC C

Jogador 2 NC C 5; 5 1; 7 7; 1 4; 4

Em um jogo como este (e em todo jogo estático de informação completa), dizemos que uma estratégia de um jogador qualquer (do jogador 1, por exemplo) é uma estratégia estritamente dominada por alguma outra estratégia desse jogador se, independente da escolha do outro jogador, o ganho que ele tem jogando esta estratégia é estritamente menor do que o ganho que ele teria jogando a outra estratégia. Novamente, como há duas estratégias, "Não Confessar"e "Confessar", devemos analisar as duas possibilidades. Para veri…car se há a existência de estratégias estritamente dominadas, olhamos, para cada jogador, os payo¤s associados às estratégias comparadas duas a duas. Em um jogo representado na forma normal, na forma de matriz, deve-se então supor que o outro jogador escolha cada uma das suas estratégias possíveis. Comparamos então as duas estratégias (se houvessem mais as compararíamos também), e se o ganho for sempre estritamente menor, então essa se constitui em uma estratégia estritamente dominada pela outra. Considere as estratégias do jogador 1, "Não Confessar"e "Confessar". Se o outro jogador, 2, joga "Não Confessar", o ganho de 1 jogando "Não Confessar"é menor do que jogando "Confessar", 5 < 7. E se 2 joga "Confessar", o ganho de 1 jogando "Nào Confessar"também é menor do que jogando "Confessar", 1 < 4. Logo dizemos que para o jogador 1 a estratégia "Não Confessar"é uma estratégia estritamente dominada: independente das escolhas alheias, o ganho de 1jogando "Nào Confessar"é estritamente menor do que jogando "Confessar". Dito ainda de outra maneira, a estratégia "Não Confessar"é uma estratégia estritamente dominada para o jogador 1 porque ela gera um payo¤ menor para este jogador relativamente à outra alternativa, "Confessar", toda vez que ele a jogar, independente das estratégias do outro jogador. Faça raciocínio análogo para o jogador 2 e veri…que que também para este jogador a estratégia "Não Confessar"é uma estratégia estritamente dominada. Dizemos então que no Dilema dos Prisioneiros o per…l de estratégias ("Não Confessar", "Não Confessar") é um equilíbrio com estratégias estritamente dominadas: "Não con fessar"é uma estratégia estritamente dominada por "Confessar"se ela conferir ao jogador 2 um payo¤ sempre inferior ao propiciado pela segunda, independente do que o outro jogadore possa fazer. Ou seja, em um jogo estático de informação completa J com n jogadores, considere o espaço de estratégias de um jogador i qualquer, dado por Si . E suponha que a estratégia que esse jogador jogou tenha sido si 2 Si . Nós dizemos que si 2 Si é uma 21


estratégia estritamente dominada por outra estratégia s0i 2 Si qualquer no seu espaço de estratégias para o jogador i quando, independente das escolhas alheias, o ganho que o jogador i tem jogado si 2 Si é estritamente menor do que o ganho que ele teria jogando s0i 2 Si . Formalmente, De…nição: No jogo J = fSi ; ui (si ; s i )gni=i a estratégia si 2 Si é uma estratégia estritamente dominada pela estratégia s0i 2 Si , s0i 6= si , para o jogador i, se ui (si ; s i ) < ui (s0i ; s i ), 8s i 2 S i . Ou seja, si é estratégia estritamente dominada s0i se ela conferir ao seu jogador um payo¤ sempre inferior ao propiciado pela segunda, independente do que os outros jogadores possam fazer. De…nição - Segundo princípio da racionalidade: considere um jogador i qualquer. Se existe si ; s0i 2 Si tal que si é uma estratégia estriamente dominada por s0i , então i nunca jogará si . Uma regra básica de teoria dos jogos é que indivíduos racionais não jogam estratégias estritamente dominadas, pois fazendo isso eles não estão agindo da melhor forma possível para eles mesmos. Vejamos agora as implicações deste princípio, em particular …cará claro aqui a relevância da noção de conhecimento comum, tanto dos payo¤s dos jogadores envolvidos como também da racionalidade destes12 . Para isso, considere o jogo abaixo:

jogador 1

A B

C 2; 2 1; 3

jogador 2 D E 1; 5 1; 3 0; 1 1; 2

tal que na forma normal ou estratégica temos 1. os jogadores: 1 e 2 2. os espaços de estratégias, S1 = fA; Bg e S2 = fC; D; Eg 3. os payo¤s, dados na matriz acima. Verique inicialmente que nesse jogo não há estratégia estritamente dominante para nenhum jogador, de forma que se buscássemos fazer uma previsão do resultado do jogo tendo em mente essa noção, nada poderíamos dizer. Note também que no jogo acima, para o jogador 2, a estratégia E é estritamente dominada pela estratégia D: 12

Obviamente, aqui, um jogador é racional se ele não joga estratégias estritamente dominadas por alguma outra.

22


comparando-se as duas temos que se o jogador.1 escolhe A, o jogador 2 estará pior jogando E do que jogando D, pois 3 < 5. Se, por outro lado, o jogador.1 escolhe a alternativa B, para o jogador.2 a estratégia E continua sendo uma estratégia pior do que D, na medida em que 2 < 1. Consequentemente, sendo o jogador 2 racional, ele nunca terá incentivos a jogar E, pois ela sempre gerará payo¤s inferiores à D. Perceba também que, apesar da dominância de D sobre E, D não é uma estratégia estritamente dominante, pois para 2 a estratégia C não é estritamente dominada nem por D nem por E. Como assumimos, 2 é racional, de modo que não devemos esperar que ele nunca escolha E Mas mais ainda, essa racionalidade é de conhecimento comum, assim como a racionalidade de 1. E como se trata de um jogo de informação completa, não apenas 2 não joga E como também 1 também sabe. E 2 sabe que 1 sabe que ele nunca a jogará e 1 sabe que 2 sabe... e assim sucessivamente. Isso implica que podemos eliminar os resultados do jogo que consideram essa estratégia. Procedendo assim e eliminando a coluna E do jogo, o jogo assume a seguinte forma reduzida,

jogador 1

A B

jogador 2 C D 2; 2 1; 5 1; 3 0; 1

Note atentamente: repetindo o raciocínio acima, nós podemos proceder dessa forma porque não apenas trata-se de um jogo estático de informação completa mas também a racionalidade dos jogadores é também de conhecimento comum. Nesse sentido, sendo 2 racional (de acordo com o segundo princípio de racionalidade), ele não jogará E. Mas (muito!!!) mais do que isso: como 1 sabe que 2 é racional (de acordo com o mesmo princípio), ele conjectura que 2 nunca a jogará. E como 2 sabe que 1 sabe que ele, 2, é racional, então 2 sabe que 1 sabe que ele nunca jogará E e assim inde…nidamente, de modo que a estratégia E torna-se irrelevante para o jogo, pois nenhum jogador levará em consideração a possibilidade de 2 jogá-la. Por outro lado, tendo em mente o jogo reduzido apresentado acima, observe que para o jogador 1 a estratégia B torna-se estritamente dominada13 pela estratégia A, uma vez essa gera payo¤ de uma unidade a mais para o jogador 1, comparando-se com o que a B proveria, independente do que o jogador 2 …zer. O jogador 1, portanto, não deverá jogar B (e 2 sabe disso, e 1 sabe que 2 sabe e...) e podemos da mesma forma 13

Aqui temos um resultado básico interessante que o aluno um pouco mais atento já deve ter percebido: em um jogo 2 2 (dois jogadores, cada uma com duas estratégias em seus espaços de estratégias), o fato de um jogador qualquer ter uma estratégia estritamente dominada implica que a outra estratégia é estritamente dominante. No jogo em questão, nesse segundo estágio, A torna-se dominante. Mas apenas no jogo reduzido!

23


eliminar essa linha, reduzindo ainda mais o jogo,

jogador 1

A

jogador 2 C D 2; 2 1; 5

Com o jogo dessa forma, sabemos que o jogador 1 jogará A. Consciente de tal fato, o jogador 2 fará o que mais lhe dará utilidade: jogar D (pois 5 > 2). O resultado previsto para o jogo é, portanto, (A; D). O processo mostrado no exemplo acima é denominado eliminação iterada de estratégias estritamente dominadas (EIEED) e o conjunto de estratégias (A; D) é dito ser um equilíbrio por EIEED. Esse processo de eliminação, como vimos, depende que os agentes sejam racionais, mas também que cada um deles saiba que os outros também são racionais, e que saibam que todos sabem que todos eles são racionais etc. Assumir tais hipóteses é o mesmo que assumir que existe “common knowledge” (conhecimento comum) de que os jogadores são racionais. No caso acima, dado que trata-se de um jogo de informação completa, foi necessário que: o jogador.2 fosse racional e, assim, não jogasse E; o jogador 1 fosse racional e soubesse que o jogador 2 também era racional, não jogando, por isso, B; o jogador 2 soubesse que o jogador 1 era racional e também que o jogador.1 soubesse que ele era racional, e então escolhesse D. Isto posto, veri…que que no Dilema dos Prisioneiros o per…l de estratégias ("Não Confessar", "Não Confessar") é um equilíbrio por EIEED. Observe agora a relação entre estratégias estritamente dominantes e estratégias estritamente dominadas. Se uma estratégia é uma estratégia estritamente dominante para um jogador qualquer, então ela “sobrevive” ao processo de EIEED. Por outra lado, se uma estratégia sobrevive ao processo de EIEED, não necessariamente será uma estratégia estritamente dominate para aquele jogador. Isso será verdade em jogos 2 x 2, onde cada jogador tem apenas duas possibilidades de escolha (como, por exemplo, o Dilema dos Prisioneiros), mas saindo dessa classe restrita de jogos, nada nos garante que tal relação se preserva. Podemos então generalizar e propor a seguinte relação entre as duas maneiras vistas até aqui de solucionar jogos estáticos de informação completa: Proposição 9 Se uma estratégia de um jogador qualquer é uma estratégia estritamente dominante, então ele sobrevive (não é eliminada) ao processo de EIEED. Mas se uma estratégia de um jogador qualquer sobrevive ao processo de EIEED, não necessariamente ela é uma estratégia estritamente dominante. 24


Observação 10 Dito de outra maneira, dizemos aqui que o primeiro princípio de racionalidade implica no segundo mas o segundo princípio não necessariamente implica no primeiro. Uma observação importante aqui é que a maior parte dos jogos não são resolvidos via EIEED. Eventualmente isso ocorre, mas em geral apenas reduz as possibilidades do jogo. Considere o exemplo abaixo. Exemplo 11

jogador1

D 2; 3 4; 1 1; 1

A B C

jogador 2 E 3; 1 5; 4 3; 5

F 3; 2 0; 3 6; 3

Depois de descrever as informações desse jogo na forma estratégica, observe que nesse exemplo não há nenhuma estratégia estritamente dominante e nem estratégia estritamente dominada para ambos os jogadores. Segue o processo de EIEED nem mesmo reduz a complexidade do jogo: o equilíbrio do jogo por EIEED é o próprio jogo, uma informação que não nos ajuda em nada na previsão do resultado do jogo. Veja também o jogo de Par ou Ímpar. Neste jogo, o jogador chamado Par é o que pediu par (P), enquanto o de nome Ímpar é, analogamente, o que ganha se o resultado for ímpar (I). Apenas para simpli…car, suponha que o vencedor tem payo¤ de 1, enquanto o perdedor obtém -1.

Par

P I

Ímpar P I 1; 1 1; 1 1; 1 1; 1

Nota-se que, também no Par ou Ímpar, EIEED não colabora em nada com a resolução do jogo. Podemos relaxar um pouco a noção de estratégia estritamente dominada e trocar a desigualdade estrita dessa de…nição por uma relação apenas desiguladade (não estrita). Emerge portanto a idéia de estratégia fracamente dominada. Genericamente, em um jogo estático de informação completa qualquer, dizemos que (para um jogador qualquer) uma determinada estratégia é uma estratégia fracamente dominada por outra estratégia qualquer no seu espaço de estratégias para este jogador quando, independente das escolhas alheias, o ganho que o jogador tem jogado tal estratégia é menor (mas não necessariamente estritamente menor) do que o ganho que ele teria jogando a outra estratégia. 25


Considere então um jogo estático de informação completa J com n jogadores e tome o espaço de estratégias de um jogador i qualquer, dado por Si . E suponha que a estratégia que esse jogador jogou tenha sido si 2 Si . Nós dizemos que si 2 Si é uma estratégia fracamente dominada por outra estratégia s0i 2 Si qualquer no seu espaço de estratégias para o jogador i quando, independente das escolhas alheias, o ganho que o jogador i tem jogado si 2 Si é menor (não necessariamente estritamente menor) do que o ganho que ele teria jogando s0i 2 Si :Formalmente, De…nição: No jogo J = fSi ; ui (si ; s i )gIi=i a estratégia si 2 Si é uma estratégia fracamente dominada pela estratégia s0i 2 Si para o jogador i se ui (si ; s i ) ui (s0i ; s i ), 8s i 2 S i . Uma estratégia fracamente dominada por outra é portanto um conceito próximo, mas distinto, do conceito de estratégias estritamente dominadas. A diferença é que o primeiro requer que a estratégia dominada nunca seja melhor que a estratégia que a domina, enquanto o último exige que a dominada seja, sempre, estritamente pior que a que a domina. Esse conceito de estratégias fracamente dominadas possibilitaria, em princípio, que conseguissémos que se reduzisse mais (ou pelo menos da mesma forma) a complexidade dos jogos. Entretanto, a eliminação iterada deve ser feita apenas com estratégias estritamente dominadas: eliminar iteradamente estratégias que sejam apenas fracamente dominadas pode levar a resultados distintos do jogo. Não é, portanto, consequência da racionalidade dos jogadores. Na eliminação iterada de estratégias estritamente dominadas, a ordem de eliminação não afeta o resultado …nal, o que pode não ocorrer quando utiliza-se esse processo para estratégias fracamente dominadas. O exemplo abaixo demonstra essa possibilidade. Exemplo 12

jogador 1

A B C

jogador 2 a b 3; 4 4; 3 5; 3 3; 5 5; 3 4; 3

Pode-se perceber no jogo acima que algumas estratégias podem eliminadas ao se considerar o conceito de dominância fraca: 1. B é fracamente dominada por C (pois nunca gera payo¤s superiores a C): eliminase B; 2. no jogo reduzido, b é fracamente dominada por a (pelo mesmo raciocício): eliminase b; 26


3. no jogo ainda mais reduzido, o jogador 1 escolhe C e o resultado do jogo é (C; a). Podemos, todavia, começar de outra forma: 1. A é fracamente dominada por C: elimina-se A; 2. no jogo reduzido, a é fracamente dominada por b: elimina-se a; 3. no jogo ainda mais reduzido, jogador 1 escolhe C e o resultado do jogo é (C; b). Conclui-se assim o enunciado acima: eliminação iterada de estratégias fracamente dominadas pode levar a resultados distintos dependendo de onde se começa o processo, e portanto não é consequência da racionalidade dos jogadores. Deve estar claro portanto a fraqueza do método, na medida em que ainda que em algumas situações a eliminação de estratégias fracamente dominadas possa nos ajudar a solucionar ou mesmo reduzir a complexidade de um jogo qualquer, o fato do processo de interação não ser determinado pela racionalidade dos jogadores pode implicar em previsões sobre o resultado do jogo que não sejam boas o su…cente, que não sejam as melhores que o analista possa vir a fazer. 2.2.3

Estratégias racionalizáveis (análise de "melhores respostas")

Um outro método que pode ser utilizado para se prever resultados de jogos simultâneos é o de eliminação de estratégias não racionalizáveis. Em geral, o “common knowledge”da racionalidade dos jogadores permite eliminar outras estratégias que não aquelas eliminadas via EIEED (ou pelo menos essas). Para de…nir melhor tal possibilidade, é necessário termos em mente alguns outros conceitos, abaixo apresentados. Em um jogo estático de informação completa, considere o espaço de estratégias de um jogador qualquer. Uma estratégia especí…ca nesse conjunto é dita a melhor resposta que ele pode dar às escolha alheias se, dadas as escolhas alheias, o ganho que ele tem jogando tal estratégia é maior (não necessariamente estritamente maior) do que jogando alguma outra estratégia qualquer. Nesse caso dizemos que esta estratégia é uma estratégia racionalizável. Mas se não existe uma combinação de escolhas dos demais jogadores tal que o ganho desse jogador em escolher tal estratégia seja maior do que as demais estratégias, dizemos que ela é não-racionalizável. Dizemos portanto que tal estratégia não é nunca a melhor resposta que este jogador pode dar às escolhas alheias. Seguem abaixo as de…nições de uma forma mais rigorosa. Como foi dito, um outro método que pode ser utilizado para se prever resultados de jogos simultâneos é o de eliminação de estratégias não racionalizáveis. Em geral, o “common knowledge” da racionalidade dos jogadores permite eliminar outras estratégias que não aquelas eliminadas via EIEED (ou pelo menos essas). Para de…nir melhor tal possibilidade, é necessário termos em mente alguns outros conceitos. 27


De…nição: Em J = (Si ; ui (si ; s i )) um jogo estático de informação completa. Uma estratégia si 2 Si , i 2 n, é a melhor resposta que i pode dar às escolhas dos demais jogadores se existe s i 2 S i tal que ui (si ; s i )

ui s0i ; s

i

8s0i 2 Si

Nesse caso dizemos que si é uma estratégia racionalizável. Se não existe s i 2 S i tal que ui (si ; s i ) ui (s0i ; s i ) 8s0i 2 Si , dizemos que si é uma estratégia não-racionalizável, o que signi…ca que si não é nunca a melhor resposta que i pode dar às escolhas alheias.

Note que, em geral, existem várias melhores respostas para cada jogador envolvido, dependendo do que os outros possam fazer (no caso especí…co onde existe apenas uma melhor resposta para um determinado jogador, essa seria então uma estratégia estritamente dominante). Se uma determinada estratégia não for nunca a melhor resposta para um jogador, em que circunstâncias deverá ele jogá-la? Sendo racional, isso nunca deverá acontecer, uma vez que, sempre que ele imaginar a possibilidade de escolhe-la, haverá uma alternativa que gera um payo¤ superior, por de…nição. Segue desse raciocínio que estratégia racionalizáveis são estratégias que sobrevivem à eliminação iterada de estratégias que nunca são a melhor resposta que um jogador pode dar às escolhas alheias. Como no caso de estratégias estritamente dominadas, também pode-se fazer eliminação iterada de estratégias não racionalizáveis (EIENR)14 . Novamente, a ordem de eliminação não afeta o resultado …nal. As estratégias que sobrevivem à EIENR são aquelas que um jogador racional pode justi…car, ou racionalizar, dada alguma conjectura razoável a respeito da escolha dos outros jogadores, onde razoável signi…ca uma escolha que não contenha estratégias não racionalizáveis. Comparando com estratégias estritamente dominadas, observamos que uma estratégia que é estritamente dominada nunca é melhor resposta, mas o inverso nem sempre é correto. Portanto, eliminar iteradamente estratégias que nunca são a melhor resposta elimina pelo menos tantas estratégias quanto se retiraria ao fazer EIEED, e em geral elimina-se mais. Em suma, tem-se que (

Conjunto de estratégias estratégias que sobrevivem à EIEED estratégias que sobrevivem à EIENR

14

Isso é verdade enquanto não tratamos ainda de estratégias mistas, o que veremos logo a seguir. Quando isso ocorrer, esse resultado se altera radicalmente. A intenção aqui é tão somente inserir a noção de estratégias (não) racionalizáveis e "preparar terreno"para inserirmos a noção de equilíbrio de Nash.

28


Exemplo 13 Considere o jogo abaixo, um jogo estático de informação completa. Na forma normal (ou estratégica) 1. os jogadores: 1 e 2 2. os espaços de estratégias: S1 = fa; b; c; dg e S2 = fe; f; g; hg 3. os payo¤s, que são os ganhos expostos na bimatriz abaixo.

jogador 1

a b c d

e 2; 6 3; 1 8; 1 4; 1

jogador 2 f g h 3; 3 5; 1 0; 0 6; 4 0; 2 0; 1 2; 2 0; 5 0; 4 1; 0 0; 1 5; 1

Nesse jogo, qual é o conjunto de estratégias racionalizáveis? Uma forma que facilita sensivelmente a visualização das estratégias racionalizáveis (ou não) é marcar as melhores respostas para cada jogador em todas as circunstâncias possíveis, sendo essas dadas pelas alternativas que o outro jogador possui. Por exemplo, quando o jogador 1 escolhe a, o melhor para o jogador 2 será escolher e, pois lhe dará um payo¤ de 6, e não 3, 1 ou 0, que obteria se …zesse outras escolhas. O mesmo deve ser feito supondo escolhas de b; c e d pelo jogador 1. Por sua vez, se o jogador 2 utilizar a estratégia e, o melhor para o jogador 1 será lançar mão da estratégia c (payo¤ de 8 contra outros de 2, 3 e 4). O mesmo também deve ser feito supondo as escolhas de f; g e h pelo jogador 2. Se uma determinada estratégia não corresponder a uma melhor resposta em nenhuma circunstância, então ela não será racionalizável, pois signi…cará que, independente do que o outro jogador …zer, ela nunca gerará o maior payo¤ e portanto não corresponderá ao melhor a se fazer. Uma vez que alguma estratégia for eliminada por esse critério, pode-se novamente analisar se, no jogo reduzido, há alguma outra que nunca será jogada, e assim sucessivamente, até reduzir-se o jogo ao máximo. No caso acima, temos que: h pode ser eliminado, pois nunca é melhor resposta para jogador 2; eliminado h, d também pode ser eliminado, pois não será mais melhor resposta para o jogador 1 em nenhuma possibilidade do jogo reduzido. A partir desse ponto, nenhuma outra eliminação poderá ser feita, sendo que todas as estratégias sobreviventes são racionalizáveis: podem ser justi…cadas por alguma hipótese a respeito do que o outro jogador poderá fazer. Portanto, nesse jogo não é

29


possível prever um resultado …nal pelo método de EIENR, obtendo apenas a redução da sua complexidade:

jogador 1

a b c

e 3; 1 8; 1 4; 1

jogador 2 f 6; 4 2; 2 1; 0

g 0; 2 0; 5 0; 1

Em geral, portanto, EIENR (assim como, e ainda mais, EIEED) não gera previsões bem de…nidas para grande parte dos jogos. O mais comum é que apenas de…na alguns resultados que não serão jogados, caso de fato exista pleno conhecimento de racionalidade dos jogadores por todos eles. Contudo, isso não signi…ca que seja sempre assim. Vejamos o exemplo 8 dado na seção anterior, onde, via EIEED nada podia ser feito.

jogador 1

A B C

D 2; 3 4; 1 1; 1

jogador 2 E 3; 1 5; 4 3; 5

F 3; 2 0; 3 6; 3

Percebe-se que, mesmo sem possuir estratégias estitamente dominadas, no jogo acima existem algumas estratégias que nunca são melhores respostas, e portanto não são racionalizáveis. Esse é o caso da estratégia F para o jogador 2 e da A para o jogador 1. Eliminando-as, o jogo se reduz a

jogador 1

B C

jogador 2 D E 4; 1 5; 4 1; 1 3; 5

Nesse jogo reduzido, porém, outras estratégias passam a não constituirem-se de melhores respostas: a estratégia D, para o jogador.2, e a estratégia C, para o jogador 1. Eliminando-as, temos então (B; E) como resultado previsto para o jogo, que será jogado caso exista conhecimento comum de racionalidade entre os jogadores. Por …m, uma palavra de precaução é necessária aqui. Ainda que tenhamos proposto e feito nesses exemplos um processo de eliminação de estratégias segundo a noção de racionalidade de jogadores associada à estratégias racionalizáveis, não é verdade que esse processo é sempre válido quando permitimos que os jogadores aleatorizem suas escolhas. Nesse caso podemos ter estratégias não racionalizáveis que serão jogadas com probabilidades positivas, possibilidade que decorre em função da presença do elemento de interação estratégica. Por exemplo, no caso acima, pode ser que os jogadores 1 e 2 30


joguem A e F com probabilidade não nula, respectivamente. Nós veremos essa situação abaixo, quando estudarmos estratégias mistas. Segue portanto que a análise acima tem perda signi…cativa de generalidade quando incorporamos estratégias mistas na análise.

2.3

Equilíbrio de Nash

Como visto acima, mesmo EIENR não é em geral capaz de nos dar o resultado de muitos jogos, embora costume simpli…cá-los. Um método de solução mais abrangente que EIEED e EIENR é o de equilíbrio de Nash: se um conjunto de estratégias é um equilíbrio de Nash, ele sobrevive às “eliminações ...”, embora o contrário não seja, em geral, verdade. Nesse contexto um equilíbrio de Nash será determinado por uma interseção de melhores respostas, uma interserção de estratégias racionalizáveis. Isso signi…ca que um per…l de estratégias (associando uma estratégia para cada jogador) será um equilíbrio de Nash se, para cada jogador, a estratégia que ele adotou for a melhor resposta que ele pode dar às escolhas alheias. Podemos ainda dizer que em um jogo estático de informação completa, um conjunto de estratégias (uma para cada jogador) constitui um equilíbrio de Nash se, caso os todos os jogadores, menos um, joguem as estratégias de…nidas para eles no equilíbrio de Nash, para aquele outro não exista nada melhor a se fazer a não ser também escolher a estratégia para ele de…nida no equilíbrio de Nash. E isso deve valer para todos os jogadores tomados individualmente. De…nição: No jogo J = fSi ; ui (si ; s i )gni=i o per…l de estratégias si ; s i constitui um equilíbrio de Nash se para todo jogador i = 1; 2; :::; n a estratégia si 2 Si for a melhor resposta que i pode dar às escolhas alheias. Isto é, dado s i 2 S i , ui si ; s i ui s0i ; s i 8s0i 2 Si , s0i 6= si . De outra forma, podemos de…nir as estratégias (s1 ; :::; sn ) como um equilíbrio de Nash caso, para todo jogador i, a estratégia si resolva o problema de max ui si ; s

si 2Si

i

Como usual, tome como exemplo o Dilema dos Prisioneiros,

Jogador 1

NC C

Jogador 2 NC C 5; 5 1; 7 7; 1 4; 4

e analisemos inicialmente o caso do jogador 1. Se o jogador 2 jogou N C, a melhor resposta que 1 pode dar é jogar C, pois 7 > 5. E se 2 jogar C, a melhor resposta que o jogador 1 pode dar é jogar a estratégia C, pois 4 > 1. Analogamente para o jogador 2: se 1 joga N C, a melhor resposta que ele pode dar é jogar C (7 > 5) e se 1 joga 31


C a melhor resposta também é jogar C. Logo (C; C) é uma interseção de melhores respostas e como tal caracteriza o equilíbrio de Nash no Dilema dos Prisioneiros. Identi…cado o equilíbrio de Nash, veja que nenhum dos jogadores tem qualquer incentivo a se desviar. Se algum dos jogadores propõe ao outro que ambos joguem "Não Confessar", de forma que cada um ganhe 5 (e portanto ambos estejam melhor do que no equilíbrio de Nash), o melhor que cada um pode fazer é não cumprir o acordo, pois na conjectura de o oponente cumprí-lo, a melhor resposta é sempre não cumprir e jogar "Confessar", pois 7 > 5. Portanto, para encontrar um equilíbrio de Nash, basta ver a(s) melhor(es) resposta(s) de um jogador para cada estratégia do(s) outro(s) jogador(es), procedendo assim para todos eles. Quando houver coincidência entre as melhores respostas para todos os envolvidos, esse conjunto de estratégias será um equilíbrio de Nash. Exemplo 14

jogador 1

A B C

D 2; 3 4; 2 1; 1

jogador 2 E 5; 1 1; 4 0; 5

F 3; 2 0; 3 6; 8

No caso acima, não há estratégia dominante para nenhum dos jogadores nem nenhuma estratégia pode ser eliminada via EIEED ou EIENR. Mas o conceito de equilíbrio de Nash nos diz que o resultado do jogo será (C; F ), o único onde há coincidência de melhores respostas: se o jogador 2 joga F , o melhor para o jogador 1 é escolher C, e vice-versa. Consequentemente, nenhum dos dois terá incentivos a desviar desse resultado, caso acreditem que ele deva se veri…car. 2.3.1

Estabilidade, existência e unicidade do equilíbrio de Nash

Estabilidade Caso se tenha um determinado conjunto de estratégias, conhecido por todos e previsto como a solução de um jogo estático, ele deverá constituir-se em um equilíbrio de Nash. Se isso não ocorrer, então, por de…nição, existirá algum jogador que poderá obter um payo¤ maior jogando outra estratégia: ele não teria, portanto, incentivos em jogar a estratégia proposta inicialmente, sendo racional. Assim, se um determinado conjunto de estratégias é previsto como a solução de um jogo estático de informação completa, ele deverá ser um equilíbrio de Nash. Nesse sentido dizemos que o equilíbrio de Nash é um resultado estrategicamente estável (ou "self-enforcing"). Formalmente, suponha que um conjunto de estratégias (s01 ; :::; s0n ) seja a solução proposta para um determinado jogo estático de informação completa com n jogadores, mas não seja um equilíbrio de Nash. Então, para ao menos um jogador i, ter-se-ia uma

32


estratégia alternativa (s00i 6= s0i ) tal que o ganho desse jogador seria maior jogando-a, ui s0i ; s0

i

< ui s00i ; s0

i

e o jogador i preferirá jogar s00i , de onde temos que (s01 ; :::; s0n ) não pode ser uma solução, ao menos um jogador se desviaria. Existência Com relação à existência do equilíbrio de Nash, sabemos através de um teorema provado pelo próprio Nash, em 1951, que sempre existirá pelo menos um, desde que o jogo em análise seja …nito15 . Teorema 15 Nash (1951). Em todo jogo …nito (com o número de jogadores n, …nito e espaço de estratégias Si , para todo i, também …nito) existe pelo menos um equilíbrio de Nash (ainda que envolva apenas estratégias mistas, conceito a ser visto à frente). Exemplo 16 Par ou ímpar.

jogador 1

P I

jogador 2 P I 1; 1 1; 1 1; 1 1; 1

O jogo par ou ímpar é um jogo …nito, uma vez que há apenas dois jogadores com duas estratégias para cada um deles. Pelo Teorema enunciado acima, ele deveria possuir algum equilíbrio de Nash, o que não se percebe na matriz acima. Obviamente não estamos mostrando uma contradição ao Teorema de Nash nem sugerindo que o Par ou Ímpar não tenha solução teórica. Entretanto, ali está sendo mostrado apenas as possíveis estratégias puras. O par ou ímpar, de fato, possui um equilíbrio de Nash (a…nal, não consta que o Teorema tenha sido provado de maneira errada), mas em estratégias mistas, onde cada jogador joga 50% das vezes par e 50% ímpar. Esse processo será explicado mais adiante. Exemplo 17 Comsidere um jogo que tenha a seguinte regra: há dois (ou mesmo um número maior qualquer) jogadores que têm de escrever simultaneamente em um pedaço de papel um número qualquer. Após terem escrito, ambos revelam seus números. O que tiver escrito o maior número recebe R$100, enquanto o(s) outro(s) não ganha(m) nada. Sendo igual, também não ganham nada. Qual é o equilíbrio de Nash? Pensando um pouco, você notará que não existe nenhum equilíbrio de Nash nesse jogo. Para concluir isso, veja que o perdedor sempre poderá melhorar sua situação, 15

Para nós aqui nesse curso, um jogo é dito …nito se o número de jogadores for …nito e se o espaço de estratégias de cada jogador também for …nito.

33


dizendo um número maior que o vencedor; sempre havendo perdedor (ou empate), sempre alguém poderá melhorar e, assim, nunca se alcançará um resultado que constitua um equilíbrio de Nash. Esse jogo é uma prova contrária ao teorema de Nash? Certamente não, pois o referido teorema foi provado e não há o que discutí-lo. A questão é que neste jogo não são satisfeitas todas as hipóteses necessárias à validade do teorema, uma vez que ele não é …nito: note que o conjunto de estratégias possíveis a cada jogador possui in…nitos elementos, e é isso que possibilita a não existência do equilíbrio neste jogo. Unicidade Com relação à unicidade, nada nos garante em um jogo estático de informação completa o equilíbrio de Nash seja único. Pode existir e é bastante comum encontrar jogos com mais de um equilíbrioa de Nash. Exemplo 18 Guerra dos sexos.

Homem

Mulher Futebol Teatro 2; 1 0; 0 0; 0 1; 2

Futebol Teatro

No jogo acima, percebe-se a existência de dois equilíbrios de Nash: ambos irem ao futebol e ambos irem ao teatro. O conceito de equilíbrio de Nash, portanto, não determina nesse caso qual será o resultado do jogo; apenas restringe as possibilidades elimando algumas combinações de estratégias. Exemplo 19 Coordenação. Esse é um jogo muito comum em que dois jogadores,1 e 2, combinam um jantar de negócios mas deixam o local em aberto. Posteriormente ocorre um problema de comunicação e eles perdem contato. Há duas possibilidades, eles podem ir a um restaurante caro e so…sticado ou a um "pé-sujo". Caso se encontrem - não importa em qual local - realizam um negócio e têm payo¤ positivo. Caso não se encontrem, voltam ambos frustrados para casa e não se o negócio entre eles.

jogador 1

Antiquarius O Cantão

jogador 2 Antiquarius O Cantão 1; 1 0; 0 0; 0 1; 1

Novamente temos dois equilíbrios de Nash, e também não podemos determinar qual deles será jogado. Nesses jogos, ainda que haja mais de um equilíbrio de Nash, nós podemos de alguma forma reduzir as possibilidades dos resultados. Mas em alguns jogos essa redução pode ser irrelevante e frustante. Considere por exemplo o jogo entre dois jogadores, 1 e 2. 34


Ambos devem escrever em um pedaço de papel um número inteiro entre 0 e 100. Se a soma de ambos os números (a escolha do jogador 1 mais a escolha do jogador 2) for menor do que 100, cada um leva o número que escreveu no papel. Se a soma der mais de 100, cada um perde uma quantia, R$1,00 por exemplo. Inicialmente alguém poderia dizer que nesse jogo há um único equilíbrio de Nash de jogo, cada um jogar 50. No entanto esse é apenas um dos equilíbrios de Nash desse jogo, provavelmente decorrente de algum critério subjetivo de justiça na cabeça do aluno. Mas não é isso que buscamos e sim caracterizar todos os equilíbrios do jogo - e nesse jogo há 101 equilíbrios de Nash. s1 0 1 2 ::: 50 ::: 99 100

s2 100 99 98 ::: 50 ::: 1 0

Embora nos exemplos acima não tenhamos especi…cado, a princípio, como apontar um ou outro equilíbrios de Nash como o mais provável a ser jogado, em alguns casos, nesses jogos com múltiplos equilíbrios de Nash, existem formas de identi…car qual deles deverá ser jogado (ao menos com uma “certa” probabilidade). 2.3.2

Equilíbrio de Nash e Eliminação de Estratégias

Para relacionarmos a noção de equilíbrio de Nash com eliminação iterada de estratégias, vamos analisar duas proposições. Como é de se esperar, dada a direção que estamos tomando, ainda que estejamos perdendo em potência com relação à capacidade preditiva, lançar mão do conceito de equilíbrio de Nash nos permite atingir um grau de abrangência signi…cativo que nos permitirá ter alguma informação sobre a resolução de um determinado jogo de informação estática em quase todas as situações. As relações que estabeleceremos abaixo dizem respeito à EIEED, mas poderia ser abordada através de estratégias não-racionalizáveis. Os enunciados e as provas das proposições são os que se seguem. Proposição: Se o conjunto de estratégias si ; s i constitui um equilíbrio de Nash no jogo J = fSi ; ui (si ; s i )gni=i na forma normal, então si ; s i sobrevive ao processo de EIEED. – Prova: Por contradição, suponha que não. Isto é, que si ; s i seja um equilíbrio de Nash de J mas foi eliminada no processo de EIEED em algum 35


estágio do procedimento. Segue que para ao menos um jogador i qualquer, dadas as escolhas s i 2 S i dos demais jogadores, existiria uma estratégia si 2 Si , si 6= si , tal que ui si ; s i < ui s0i ; s i . Decorre que si ; s i não seria um equilíbrio de Nash em J, caracterizando a contradição. Proposição: No jogo J = fSi ; ui (si ; s i )gni=i na forma normal, …nito, seja si ; s i o único per…l de estratégias que sobrevive à EIEED. Então si ; s i é o único equilíbrio de Nash em J. – Prova: (i) Pelo teorema de Nash, em J existe ao menos um equilíbrio de Nash. (ii) Pela proposição anterior, se um per…l de estratégias é um equilíbrio de Nash, então sobrevive ao processo de EIEED. Segue que se si ; s i é um per…l de estratégias que sobrevive à EIEED, único, em J, então si ; s i é um equilíbrio de Nash em J. Podemos informalmente descrever e provar as proposições acima: Proposição: Em um jogo estático de informação completa, …nito, se um conjunto de estratégias constitui um equilíbrio de Nash no jogo na forma normal, então esse conjunto de estratégias sobrevive ao processo de EIEED. – Prova: Por contradição, suponha que não. Isto é, que esse conjunto seja um equilíbrio de Nash do jogo mas foi eliminada no processo de EIEED em algum estágio do procedimento. Segue que para ao menos um jogador qualquer, dadas as escolhas dos demais jogadores (que estão jogando o equilíbrio de Nash), existiria uma outra estratégia tal que o seu ganho jogando o equilíbrio de Nash seria menor do jogando esta estratégia alternativa. Decorre portanto que o conjunto inicial não seria um equilíbrio de Nash nesse jogo, caracterizando a contradição. Proposição: Em um jogo estático de informação completa, …nito, seja um per…l de estratégias qualquer (uma estratégia para cada jogador) o único per…l que sobrevive à EIEED. Então esse per…l de estratégias é o único equilíbrio de Nash do jogo. – Prova: (i) Pelo teorema de Nash, nesse jogo existe ao menos um equilíbrio de Nash. (ii) Pela proposição anterior, se um per…l de estratégias é um equilíbrio de Nash, então sobrevive ao processo de EIEED. Segue que se um conjunto de estratégias é um per…l que sobrevive à EIEED, único, no jogo, então tal conjunto é o (único) equilíbrio de Nash no jogo.

36


O que as proposições acima mostram é que todo Nash sobrevive à EIEED mas que nem toda estratégia que sobrevive à EIEED constitui um Nash em um jogo …nito na forma estratégica. Seguindo na direção que tomamos - e como já foi dito acima - isso nos sugere que a noção de equilíbrio de Nash é mais tênue do que a idéia de equilíbrio por EIEED mas no entanto é extremamente mais ampla. Analisando com relação à estratégias não-racionalizáveis, note que isso ocorre porque uma estratégia que está em algum equilíbrio de Nash nunca será uma estratégia não racionalizável, pelo menos pelas estratégias desse equilíbrio de Nash dos outros jogadores - pela própria de…nição de equilíbrio de Nash. Por outro lado, suponha um resultado (a; b) qualquer, sendo a uma estratégia racionalizável do jogador.1 e b uma outra, racionalizável para o jogador 2. Nada garante que a justi…cativa para que o jogador 1 escolha a seja a possibilidade de ocorrência de b, assim como também nada garante que a justi…cativa para que o jogador 2 escolha b seja a possibilidade de ocorrência de a. Portanto, não necessariamente o resultado (a; b) constituirá um equilíbrio de Nash. Sendo assim, podemos dizer que toda estratégia que compõe um equilíbrio de Nash é racionalizável porque pode ser justi…cada pelas estratégias de equilíbrio de Nash dos demais jogadores, enquanto o inverso em geral não será verdade. Por isso, tem-se que a capacidade de predição de um jogo é muito superior quando se utiliza o conceito de equilíbrio de Nash, comparando-se com EIEED e EIENR. Em suma, pode-se dizer que: (

Conjunto de estratégias estratégias que sobrevivem à EIEED estratégias que sobrevivem à EIENR estratégias que são equilíbrio de Nash

Entretanto, o grau de precisão de uma previsão utilizando apenas o conceito de equilíbrio de Nash não é tão apurado quanto o dos métodos apresentados anteriormente, como …ca claro no exemplo acima em que os jogadores devem escrever um número inteiro de 0 a 100 em um pedaço de papel. Não há nenhuma dúvida da alta probabilidade de que um jogador sempre escolha uma estratégia estritamente dominante, caso a tenha. No entanto, um estratégia que constitua um equilíbrio de Nash será jogada com alta probabilidade apenas se cada jogador realmente acreditar que o(s) outro(s) também escolherá(ão) as estratégias de…nidas naquele equilíbrio de Nash. Exemplo 20 Considere o exemplo (16) acima após a EIENR:

jogador 1

a b c

e 2; 6 3; 1 8; 1 37

jogador 1 f 3; 3 6; 4 2; 2

g 5; 1 0; 2 0; 5


O equilíbrio de Nash no jogo acima é (b; f ), onde existe coincidência de melhores respostas e portanto nenhum jogador tem incentivos a desviar. Embora nas de…nições tenhamos sempre utilizado a hipótese de existência de n jogadores, até agora todos os exemplos dados contavam com apenas dois jogadores envolvidos. Isso foi feito por também dois motivos. O primeiro é que, de fato, grande parte das situações reais de interdependência ocorre realmente com apenas dois jogadores. O outro é que a análise de jogos com apenas dois envolvidos é tecnicamente muito mais simples, embora a lógica da análise permaneça exatamente a mesma. Buscando mostrar os passos para se encontrar equilíbrios de Nash em jogos com mais de dois jogadores, apresentaremos abaixo um exemplo com três deles. 2.3.3

Equilíbrio de Nash com três jogadores

A representação do jogo na forma normal, via matrizes de payo¤s, não será mais tão simples como antes. Como seria extremamente complicado desenhar uma “matriz” tridimensional, deve-se construir tantas matrizes (bidimensionais) quantas forem as estratégias do jogador 3 (por exemplo). No caso abaixo são três: S3 = fnúmeroI, númeroII, númeroIIIg. Por sua vez, são claros o conjunto de possibilidades dos outros jogadores: o jogador 1 escolhe entre “alto” e “baixo” enquanto o jogador 2 entre “esquerda” e “direita” Em relação aos payo¤s, os apresentaremos em cada célula na seguinte ordem: o mais à esquerda refere-se ao do jogador 1, o central ao do jogador 2, e o à direita ao payo¤ do jogador 3. Para encontrar-se as melhores respostas de cada jogador, procede-se como antes, veri…cando a estratégia que gera o maior payo¤ para cada possibilidade existente. A diferença é que, agora, essas possibilidades são combinações de escolhas dos outros dois jogadores. Para deixar claro, daremos alguns exemplos do procedimento, deixando os restantes para o leitor concluir por si mesmo, segundo as marcações de melhores respostas nas matrizes: se o jogador 3 escolhe número I e o jogador 2 escolhe direita, então o jogador 1, entre alto e baixo, escolhe a segunda alternativa, que lhe dará payo¤ superior (1 > 0); se o jogador.3 escolhe número III e o jogador 1 escolhe alto, então o jogador 2, entre esquerda e direita, escolhe a primeira alternativa, que lhe dará payo¤ superior (6 > 1); se o jogador 1 escolhe baixo e o jogador 2 escolhe direita, então o jogador 3, entre número I, número II e número III, escolhe a segunda alternativa, que lhe dará payo¤ superior (5 > 1) - neste caso, perceba que você deve comparar payo¤s entre as células posicionadas à direita e na segunda linha de cada uma das três matrizes. 38


Se jogador 3 escolhe número I:

jogador 1

alto baixo

jogador 2 esquerda direita 0; 0; 0 2; 3; 4 1; 3; 2 7; 3; 1

alto baixo

jogador 2 esquerda direita 2; 8; 6 0; 7; 1 2; 1; 1 3; 2; 5

alto baixo

jogador 2 esquerda direita 3; 2; 6 1; 3; 1 2; 4; 0 5; 3; 1

Se jogador 3 escolhe número II:

jogador 1 Se jogador 3 escolhe número III:

jogador 1

Pode-se notar que existem três equilíbrios de Nash neste jogo: (baixo, esquerda, número I), (alto, esquerda, número II) e (baixo, direita, número II). Em nenhuma dessas situações existe algum jogador que queira mudar sua escolha, dada as escolhas dos outros, uma consequência da própria de…nição de equilíbrio de Nash. 2.3.4

Discussão do conceito de equilíbrio de Nash

É razoável esperarmos que um equilíbrio de Nash será efetivamente jogado? O equilíbrio de Nash é uma boa técnica em termos de previsibilidade de um jogo? Abaixo discutimos alguns argumentos a respeito da e…cácia do equilíbrio de Nash, seguindo a abordagem de Mas-Collel et. al. (1995) e a de Kreps (1990). 1. Equilíbrio de Nash como consequência de inferência racional: às vezes se diz que, como cada jogador pode pensar através das considerações estratégicas dos outros jogadores, a simples racionalidade implicaria a correta previsão do que os outros irão fazer. Entretanto, como visto, a consequência desse “common knowledge”das racionalidades dos jogadores é apenas que os jogadores devem jogar estratégias que sejam racionalizáveis, mas nada além disto. 2. Equilíbrio de Nash como condição necessária se existe um único resultado previsto para o jogo: 39


a idéia é que, se há um único resultado previsto para o jogo, então os jogadores devem entendê-lo. E para que eles não tenham estímulos a desviar, tal resultado deve ser um Nash. De outra forma: se os jogadores acham que há um caminho óbvio de se jogar o jogo, então esse caminho deve ser um equilíbrio de Nash. Este argumento é particularmente relevante quando há apenas um equilíbrio de Nash no jogo: se supusermos que o equilíbrio de Nash é esse caminho óbvio, então poderemos trabalhar com a hipótese de que ele se constituirá realmente no seu resultado. Entretanto, apenas “common knowledge das racionalidades”dos jogadores não é su…ciente para isso, como visto. Além disso, o simples fato de que existe um equilíbrio de Nash não faz com que ele se constitua necessariamente em uma justi…cativa para que seja jogado, mesmo sendo único. Sendo assim, temos que encontrar motivos que justi…quem a obviedade de se jogar um conjunto especí…co de estratégias, especialmente se existem mais de um equilíbrio de Nash no jogo em questão. Os outros ítens seguintes discutem esse ponto. 3. Pontos focais: resultados focais podem ser culturalmente determinados, ou determinados pelos costumes da comunidade/grupo dos agentes em questão. Por exemplo, suponha o jogo de coordenação acima onde os dois jogadores são dois empresários de empresas de grande porte sempre realizam jantar de negócios em restaurantes so…sticados. Caso eles queiram se encontrar urgentemente para fechar algum negócio e não possam se comunicar, elas provavelmente irão para o restaurante mais so…sticado, pois a…nal cada um deles sabe que é o que o outro usualmente faz quando da necessidade de jantar de negócio. Esse resultado, portanto, torna-se focal. Uma observação importante é que todo ponto focal necessariamente é um equilíbrio de Nash, ou então não poderia se constituir em um ponto focal (pois alguém iria querer desviar). Obviamente nem todo equilíbrio de Nash é focal. 4. Negociação prévia: supondo que os jogadores podem ter comunicação prévia, caso eles façam algum acordo, esse resultado torna-se um caminho óbvio a se jogar. Como os jogadores não têm obrigação de cumprir seus acordos (no caso de esses serem apenas informais), para que eles sejam estáveis, as estratégias que os compõe têm de constituir um equilíbrio de Nash. 5. Equilíbrio de Nash como uma convenção social estável:

40


se uma forma particular de jogar um jogo é jogada muitas vezes, pode emergir um resultado que é uma convenção social estável. Ocorrendo isso, essa convenção torna-se focal. Um exemplo típico é o lado a se andar de carro. Em geral, se dirige à direita, e todos fazem isto. Na Inglaterra, por sua vez, sempre se andou à esquerda, e isto permanece até hoje. Note que aqui também temos que uma convenção social é estável se é equilíbrio de Nash. Caso contrário, as pessoas teriam estímulos a desviar. Exemplo 21

jogador 1

alto baixo

jogador 2 esquerda direita 0; 0 2; 2 8; 9 2; 1

Nesse caso acima, temos dois equilíbrios de Nash, mas seria razoável imaginar que o resultado do jogo será (baixo, esquerda), onde ambos os jogadores têm payo¤s superiores aos que obteriam no outro equilíbrio de Nash16 . Isso é particularmente verdade se os jogadores podem se comunicar antes de jogar, pois então seria bastante provável que eles …rmassem um acordo (que seria self-enforcing) que gerassem o resultado (baixo, esquerda). Exemplo 22

jogador 1

alto baixo

jogador 2 esquerda direita 0; 1 3; 2 2; 4 1; 0

Nesse jogo, assim como antes, temos dois equilíbrios de Nash. Mas agora não podemos dizer que há um “caminho óbvio” a se jogar. Isto porque um equilíbrio de Nash não é preferível ao outro pelos dois jogadores, como tínhamos antes. A previsão do jogo, principalmente se não há comunicação antes de iniciá-lo, torna-se portanto tarefa mais difícil. Coordenação implícita Há outros casos onde pode ocorrer algum tipo de “coordenação implícita” nas próprias regras do jogo. Vejamos o exemplo seguinte. Exemplo 23 O jogo das listas. Há dois jogadores e nove …guras geométricas. É dado o nome de uma delas a um jogador e o de uma outra …gura ao outro jogador, com 16

Em uma análise de equilíbrio (parcial), dizemos que o equilíbrio (baixo, esquerda) é Pareto-superior ao equilíbrio (alto, direita) na medida em que no primeiro equilíbrio todos os jogadores estão pelo menos tão bem quanto no segundo caso e ao menos um jogador está estritamente melhor - no caso, ambos estão com maiores payo¤s.

41


o conhecimento de ambos. A proposta é que, sem comunicação, cada um faça em um pedaço de papel uma lista com o nome de quaisquer das outras sete …guras. Entretanto, ambos ganham um prêmio qualquer apenas se, unidas as duas listas, todas as …guras estiverem incluídas, mas sem duplicação. Caso contrário, não ganham nada. Vejamos uma possibilidade, caso numerarmos as …guras de 1 a 9, dando a de número 1 para o jogador 1 e a de número 9 para o jogador 2. Se a lista do jogador 1 contiver as …guras 1, 2, 3, 4 e 5, enquanto a do jogador 2 se compuser de 9, 8, 7, 6 e 5, ambos perdem: embora todas as …guras tenham sido incluídas, a 5 foi duplicada. O número de possibilidades, como se percebe, é muito grande. Como os jogadores não podem se comunicar, a probabilidade de a exigência das listas ser cumprida é muito próxima de zero, caso elas sejam feitas aleatoriamente. Entretanto, vejamos o que poderia ocorrer se as nove …guras fossem (quadrado, triângulo, cubo, esfera, retângulo, pirâmide, cone, círculo e paralelepípedo) e a um jogador fosse dado o quadrado e ao outro a esfera. Se foi você a receber o quadrado, o que você faria, tendo alguns minutos para pensar? Uma possibilidade bastante provável seria compor a sua lista com, além do quadrado, triângulo, retângulo e círculo, na expectativa de que o outro jogador colocasse em sua lista todas as outras …guras, e apenas elas. Por que isso poderia ser uma atitude razoável? Note que a você foi dada uma …gura bidimensional, enquanto ao outro jogador foi concedida uma tridimensional. Incluir na sua lista todas as outras …guras com duas dimensões, esperando que o outro jogador tenha a mesma idéia e escolha apenas as com três dimensões pode ser uma atitude racional, desde que se acredite que o outro jogador também possa ter a mesma idéia. É claro que outras possibilidades de tentativas de coordenação implícita poderiam ocorrer. Você poderia, com o quadrado, escolher as …guras que possuem arestas, supondo que as outras (esfera e círculo) fossem escolhidas pelo outro jogador. Na verdade, todas as possibilidades que façam com que as listas se completem perfeitamente e sem sobreposição constituem equilíbrios de Nash. Portanto, existe um número muito grande deles, embora o número de resultados possíveis seja muito superior. Assim, para se tentar alcançar um dos equilíbrios com uma probabilidade não tão próxima de zero, isso seria possível apenas caso se encontrasse caminhos com alguma “lógica”, como a comentado acima17 . Exemplo 24 Em um exemplo muito parecido com um caso analisado acima, dois jogadores escrevem, simultaneamente, um número natural entre zero e mil. Caso a soma dos dois números não ultrapasse mil, cada um recebe, em unidades monetárias, um valor 17

Como seria o caso se, ao invés das …guras, tivéssemos uma lista de países? A lista é: Inglaterra, Argentina, Uruguai, Itália, Brasil, França, Alemanha, Paraguai, Portugal. Você recebe Brasil e o oponente Portugal. Qual(is) seria(m) o(s) equilíbrio(s) de Nash do jogo?

42


correspondente ao número que escreveu. Caso a soma seja maior que mil, ninguém recebe nada. Qual(is) é(são) o(s) equilíbrio(s) de Nash deste jogo? Algum deles pode ser considerado focal? Quanto aos equilíbrios de Nash, neste caso existem simplesmente mil e um deles, correspondentes a todos as estratégias dos jogadores que, conjuntamente, somem exatamente mil: em todos esses casos, nenhum dos jogadores poderá aumentar o seu payo¤. O conceito de equilíbrio de Nash, portanto, diz muito pouco a respeito do provável resultado da interação. Todavia, parece razoável imaginar um ponto focal onde cada um escreva 500 em seus papéis, baseando-se em alguma vaga noção de justiça inerente a maioria das pessoas. Esse foi, de longe, o resultado mais encontrado quando …zemos experiências em sala com alunos da PUC-Minas. E isso ocorreu tanto quando foi permitido uma coordenação prévia entre os jogadores, mas também quando isso não foi permitido. Em geral, se os jogadores já se interrelacionam há algum tempo, pode-se criar um modo usual de se jogar. Em situações econômicas, muitas vezes isso ocorre, o que facilita a análise do jogo, ainda que ele tenha mais de um equilíbrio de Nash. Ponto focal Como discutimos acima, um “problema”recorrente em teoria dos jogos diz respeito ao fato de que o equilíbiro de Nash não é único. A questão que emerge desse fato é com relação à previsão do resultado do jogo: uma vez que há mais de um Nash em um jogo, será que a probabilidade de se jogar um deles é maior do que os demais? É a mesma? Uma forma de abordar essa questão é analisar se há algum ponto focal em um jogo. Basicamente o que fazemos é re…nar a noção de equilíbrio de Nash, no sentido de buscar algum tipo de informação exógena ao jogo que nos permita fazer alguma inferência não sobre os equilíbrios de Nash do mesmo, mas sobre a verossimilhança de se jogar ou eliminar alguns desses equilíbrios. Um ponto focal portanto é um equilíbrio de Nash de um jogo que exibe algum tipo de dominância sobre os demais. E essa dominância decorre de alguma informação exógena ao jogo, informação essa que diz respeito à hábitos, costumes, tradições, normas (social ou legal) etc e é de conhecimento comum. Exemplo 25 No jogo de coordenação - já discutido acima - dois empresários marcaram um jantar de negócios mas deixaram o lugar desse jantar em aberto e perderam a comunicação. Vimos que no jogo há dois equilíbrios de Nash e não sabemos qual será jogado. Mas se temos a seguinte informação, de conhecimento comum aos jogadores, "os jogadores têm o hábito de frequentar restaurantes so…sticados", então podemos dizer que o equilíbrio (Antiquarius, Antiquarius) é um ponto focal. Exemplo 26 No Guerra dos Sexos. O que você diria se nesse jogo houvesse a seguinte informação: "o jogo será jogado no Irã"? 43


Exemplo 27 Dirigir no Brasil ou em algum país da Comunidade Britânica.

jogador 1

esquerda direita

jogador 2 esquerda direita 100; 100 0; 0 100; 100 0; 0

Suponha que dois jogadores trafegam em uma estrada em direções opostas. Ao se encontrarem, devem decidir em que lado da estrada tomar, esquerda ou direita. Há dois equilíbrios de Nash nesse jogo, ambos jogarem "direita"ou ambos jogarem "esquerda", caso contrário haveria alguma colisão e os jogadores incorreriam em perdas. Mas se o jogo fosse jogado no Brasil, podemos dizer que (direita, direita) é um ponto focal. Mas se houvesse a informação de que o jogo "é jogado na Inglaterra", então (esquerda, esquerda) seria um ponto focal.

2.4

Estratégias Mistas

Até aqui, estamos supondo que cada jogador escolhe determinada estratégia de modo determinista, i.e., ele a escolhe ou não para jogar. Nenhuma possibilidade de randomização (aleatorização) entre suas estratégias possíveis foi aberta. Portanto, em jogos como o Par ou Ímpar, por exemplo, não encontramos nenhum conjunto de estratégias que constitua um equilíbrio de Nash. Outro exemplo é o pôquer: se um jogador nunca blefa, os outros sempre se dirigirão a ele de modo impetuoso e não aceitarão qualquer aposta caso ele queira apostar. Iisso faz com que blefar passe a ser uma boa resposta para tal jogador. Entretanto, se ele blefar sempre, os outros passarão a sempre aceitar suas apostas e blefar não será mais uma resposta ótima. De fato, em todo jogo onde cada jogador quer “enganar”o(s) outro(s), não existe equilíbrio de Nash como de…nido antes, considerando apenas estratégias puras, porque a solução do jogo envolve incerteza a respeito do que o outro irá fazer. Para superar problemas como esse, insere-se a noção de estratégias mistas18 . De…nição 28 Iremos referir aos elementos do espaço de estratégias de cada jogador como as estratégias puras do jogador. Logo, as estratégias puras de um jogador são as diferentes ações que ele pode tomar. De…nição 29 Uma estratégia mista para um jogador é uma distribuição de probabilidade sobre (algumas ou todas) as estratégias pertencentes ao seu espaço de estratégias. Ou seja, uma estratégia mista especi…ca probabilidades para estratégias puras, denotando que essas serão escolhidas não de modo determinista, mas probabilístico. Obviamente, o somatório das probabilidades é igual a um. Note também que que uma 18

Para uma formalização mais rigorosa dos conceitos associados à estratégias mistas, ver o apêndice.

44


estratégia pura nada mais é que uma estratégia mista degenerada, no sentido de que ela especi…ca probabilidade um para um elemento do conjunto de estratégias e zero para todos os outros. Exemplo 30 (Par ou ímpar): as estratégias puras de cada jogador são jogar par ou ímpar. Uma estratégia mista é a distribuição de probabilidade (p; 1 p), onde p 2 [0; 1] é a probabilidade de se jogar par e (1 p) é a probabilidade de se jogar ímpar. A estratégia mista (0, 1), por exemplo, é simplesmente a estratégia pura de se jogar ímpar. Exemplo 31 Em um jogo onde um jogador tenha três estratégias puras possíveis (A; B; C), uma estratégia mista é a distribuição de probabilidade (p; q; 1 p q), onde p 2 [0; 1], q 2 [0; 1] e (p + q) 2 [0; 1]. A estratégia pura B, por exemplo, seria representada por (0; 1; 0). Por sua vez, se esse jogador jogasse cada uma delas com a mesma chance, teríamos a estratégia mista (1=3; 1=3; 1=3). De…nição 32 Um jogo pode ser representado na sua forma normal ou estratégica, com a possibilidade de se adotar estratégias mistas. A diferença agora é que incorporamos a possibilidade de que o jogador aleatorize ao fazer as suas escolhas. A possibilidade de se utilizar estratégias mistas não foi, obviamente, apresentada apenas para so…sticar o texto. Como seria de se esperar, ela nos permite avançar em nosso objetivo de determinar qual será o resultado de um jogo. Exemplo 33 Seja o seguinte jogo (onde representamos, para simpli…car, apenas os payo¤ s do jogador 1): jogador 2 D E A 5; 0; jogador 1 B 0; 5; C 2; 2; Aqui, independentemente da estratégia ( D ; E ) = (1 E ; E ), E 2 [0; 1], adotada pelo jogador 2, o jogador 1 não escolhe C. Com a possibilidade de estratégias mistas, isto signi…ca que a estratégia C é estritamente dominada. Entretanto, note que ela não é estritamente dominada nem por A e nem por B isoladamente. Mas é, por exemplo, pela estratégia mista que coloca A com 50% e B com 50% (que implica um payo¤ de 2,5 em qualquer hipótese): seja a estratégia mista = ( A ; B ; C ) = (0:5; 0:5; 0). O payo¤ (esperado) do jogador 1 jogando tal estratégia será u1 ( ) = (

0:5) 5 + ((1

E

= 2:5

E

+ 2:5 45

2:5

E) E

= 2:5

0:5) 5 =


Independentemente portanto do valor de E (a probabilidade do jogador 2 escolher E). Tal estratégia é, portanto, preferível em relação à estratégia pura C. Antes tínhamos que, se uma estratégia fosse dominada, ela nunca seria jogada e portanto não seria racionalizável. Agora temos também o reverso dessa proposição: se ela nunca será jogada, então ela é dominada, ainda que seja por uma estratégia mista, como visto no exemplo acima19 . Outra característica a se destacar é que uma estratégia pura pode ser a melhor resposta a uma estratégia mista, ainda que não seja a melhor resposta a nenhuma estratégia pura. A veri…cação de estratégias que nunca serão melhores respostas …ca, portanto, mais sutil, pois torna-se necessário veri…car também as possibilidades de respostas à estratégias mistas do(s) outro(s) jogador(es). Exemplo 34

jogador 1

A B C

jogador 2 D E 5; 0; 0; 5; 4; 4;

Nesse jogo, para o jogador 1, C não é a melhor resposta para E e nem para D. Todavia, é a melhor resposta, por exemplo, para a estratégia mista ( D ; 1 D ), D 2 1 4 20 . 5; 5 A caracterização anterior de equilíbrio de Nash considerava apenas estratégias puras como possibilidades. Contudo, podemos também incorporar o conceito de estratégias mistas para determinar o equilíbrio de Nash. Nesse sentido, um conjunto de estratégias mistas = ( 1 ; :::; n ) constitui um equilíbrio de Nash (em estratégias mistas) em um jogo estático de informação completa se, para cada jogador, a estratégia mista que ele adotou for a melhor respostas às estratégias mistas jogadas pelos demais jogadores. Portanto segue que que o conceito de equilíbrio de Nash é exatamente o mesmo de antes. A diferença é que agora permite-se também a utilização de estratégias mistas. Observação 35 Um resultado fundamental de equilíbrio de Nash com estratégias mistas é o que diz que um jogador que utiliza uma estratégia mista que compõe um equilíbrio de Nash pode obter o mesmo payo¤ que obteria jogando-a se utilizar apenas uma (qualquer uma delas) das estratégias puras que compõem a estratégia mista (dado que os 19

Entretanto, esse resultado vale apenas para o caso de dois jogadores, que é aquele com que trabalharemos na maior parte dos casos. 20 Compare os payo¤s de se jogar isoladamente A, B ou C, supondo que o jogador 2 possa estar jogando uma estratégia mista. Conclua então que, se tal estratégia mista respeitar o princípio aqui referido, de não colocar probabilidade maior que 4=5 em nenhuma de suas possíveis ações (faça as contas!), então de fato B torna-se a melhor resposta a essa estratégia mista.

46


outros jogadores permanecem jogando suas estratégias de equilíbrio). Além disso, todas elas provêem o mesmo payo¤ , que é maior ou igual ao payo¤ obtido caso se utilizasse outra estratégia pura que não compõe a estratégia mista do equilíbrio de Nash (também supondo que os outros jogadores permaneçam jogando suas estratégias de equilíbrio). O que essa observação nos sugere é uma maneira mais fácil de computar o equilíbrio de Nash em estratégias mistas. Se o ganho esperado de um jogador quando é jogado o equilíbrio em estratégias mistas é igual ao seu ganho esperado se ele adotar uma estratégia pura e os demais jogadores jogarem o equilíbrio em estratégias mistas, então basta nos ater ao segundo caso para gerarmos o resultado. Com relação ao segundo ponto, o argumento é trivial. Vamos organizar essas assertativas em forma de proposições que serão importantes pelos motivos acima sugeridos. Proposição 36 Sem perda de generalidade21 , considere um jogo 2 2 na forma normal. Nesse jogo, seja Si = (si1 ; si2 ) o espaço de estratégias do jogador i = 1; 2, = ( 1 ; 2 ) um equilíbrio de Nash com estratégias mistas do jogo e i = ( i1 ; i2 ) a escolha de i = 1; 2. O ganho esperado de um jogador i qualquer - por exemplo o jogador 1 - quando todos jogam o equilíbrio de Nash, será u1 (

)=

11 21 u1 (s11 ; s21 )+ 11 22 u1 (s11 ; s22 )+ 12 21 u1 (s12 ; s21 )+ 12 22 u1 (s12 ; s22 )

é igual ao seu ganho esperado se ele jogasse alguma estratégia pura dado que o oponente jogou alguma estratégia de equilíbrio, u1 (s11 ;

2)

=

21 u1 (s11 ; s21 )

+

22 u2 (s11 ; s22 ) :

Analogamente isso é verdade relativamente a qualquer estratégia que compõem o equilíbrio com estratégias mistas. Nesse caso 2 2, u1 (s12 ;

2)

=

21 u1 (s12 ; s21 )

+

22 u2 (s12 ; s22 )

tal que u1 (s11 ;

2)

= u1 (s12 ;

2)

= u1 (

).

1 ; s22 )

= u2 (

).

O mesmo é verdade para o jogador 2: u2 (

1 ; s21 )

= u2 (

Prova. (Demonstração informal) Suponha que jogar duas das estratégias puras que compõem a mista que é equilíbrio de Nash dê payo¤s diferentes. Então o jogador preferirá jogar apenas a que lhe confere maior utilidade e consequentemente a estratégia mista não pode ser equilíbrio de Nash, o que contradiz a hipótese original e portanto não 21

A Proposição vale para todo jogo …nito. Esse formato é apenas para facilitar a compreensão.

47


pode ser verdadeiro. Temos então que o payo¤ obtenível utilizando a mista ou qualquer das puras que ela contém confere o mesmo payo¤ para o jogador, uma vez que os outros mantêm suas estratégias de equilíbrio de Nash. Isso …cará claro no exemplo abaixo, quando mostramos que isso é verdade em um jogo de coordenação. Proposição 37 O payo¤ que se obtém jogando qualquer estratégia (pura ou mista) que compõe o(s) equilíbrio(s) de Nash de um jogo estático de informação completa é maior ou igual ao payo¤ que se obteria adotando qualquer estratégia pura que não pertence ao equilíbrio de Nash, supondo que os demais jogadores jogam suas estratégias de equilíbrio. Prova. (Demonstração informal) Suponha que a utilidade de se usar uma estratégia que não compõe a estratégia mista de equilíbrio de Nash seja maior que o payo¤ de se utilizar apenas uma das estratégias que compõem a estratégia mista de equilíbrio de Nash. Então não vale a pena jogar a estratégia mista que contém uma estratégia pior do que a estratégia pura que não a integra, o que implica que a estratégia mista não constitui um equilíbrio de Nash, contradizendo a hipótese inicial e não podendo, assim, ser verdadeiro. Portanto temos que se um conjunto de estratégias mistas é equilíbrio de Nash do jogo, para cada jogador, dada as estratégias dos oponentes, é indiferente jogar as estratégias puras que constituem a estratégia mista ou ela mesma, e é pelo menos tão bom jogar uma das puras que constituem a mista a jogar qualquer outra estratégia pura que não faz parte da mista. Uma consequência importante das proposições acima é que, para testar se um conjunto de estratégias constitui um equilíbrio de Nash, basta considerar os possíveis desvios em estratégias puras. Caso nenhum jogador possa aumentar seu payo¤ jogando alguma outra estratégia pura, então é um Nash, facilitando a computação do equilíbrio em estratégias mistas. Exemplo 38 Encontre o equilíbrio de Nash com possibilidade de estratégias mistas no jogo Par X Ímpar: jogador 2 P I jogador 1 P 1; 1 1; 1 I 1; 1 1; 1 Como já visto antes, no jogo acima não existe um conjunto de estratégias puras que formem um equilíbrio de Nash. Todavia, podemos encontrar algum equilíbrio de Nash se possibilitarmos que se joguem estratégias mistas. Para tanto, devemos proceder da forma apresentada abaixo.

48


Primeiro calcula-se o payo¤ de um dos jogadores quando ele escolhe apenas estratégias puras, mas possibilitando o outro de escolher mistas. No caso do Par X Ímpar, as estratégias puras possíveis são apenas duas, par (P ) ou ímpar (I). Começaremos observando a estratégia do jogador 1 supondo que ele jogou par e depois ímpar: u1 (P;

2)

= 1

u1 (I;

2)

=

Para que ele queira aleatorizar,

2P

1 2P

u1 (P;

2P

1

(1

+1

2P )

(1

2P )

deve ser tal que 2)

= u1 (I;

2)

onde 2 = ( 2P ; 2I ) é a distribuição de probabilidade que 1 associa ao comportamento de 2. Segue que 2P = 2I = 0:5. Portanto, para que o jogador 1 aleatorize, é necessário que o jogador 2 jogue par (e ímpar) com probabilidade 0:5. De fato, vemos que se isso ocorre, qualquer coisa que 1 faça lhe dará o mesmo payo¤ esperado, de zero. Por sua vez, a condição para que o jogador 2 aleatorize ("randomize") é que o outro jogador, 1, faça também 1P = 0:5, uma vez que o jogo é simétrico. O equilíbrio de Nash deste jogo é, pois, (

1;

2)

= ((0:5; 0:5) ; (0:5; 0:5))

onde ambos escolherem par ou ímpar com probabilidade de 50% cada. Exemplo 39 Considere mais uma variação do jogo “Encontro no Rio”. Agora, temos um jovem casal querendo se encontrar para uma “namoradinha”. Eles têm duas opções para o encontro: botecos do Centro da cidade ou um local do Leblon. Os dois não podem se comunicar, e como é um namoro recente, nenhum dos dois resultados pode ainda ser considerado um ponto focal, ou algo a…m (eles não sabem ainda o “estilo” do outro). A representação do jogo na forma normal é:

rapaz

Leblon Centro

garota Leblon Centro 10; 10 0; 0 0; 0 4; 4

Procuremos encontrar o conjunto do total de equilíbrio de Nash deste jogo, tanto em estratégias puras quanto mistas. Os dois de estratégias puras são visíveis, mas vejamos uma forma mais geral de visualização, grá…ca, que em geral facilita a resolução do problema (a ser feita). Nos eixos verticais do desenho acima está representado o payo¤ esperado da garota, para cada estratégia (pura) que ela porventura resolva utilizar. Os payo¤s obviamente 49


dependerão da estratégia (ou, da mesma forma, da probabilidade escolhida entre ir ao Centro ou ao Leblon) do outro jogador - o rapaz, representada no eixo horizontal. O que temos então no caso acima: se a probabilidade do rapaz ir ao Leblon for menor que r (L), o melhor para garota será ir para o Centro com certeza, o que pode ser visto pelas linha de payo¤s. Se ela faz isso, o melhor para o rapaz é fazer r (S) = 0, como se vê na matriz. Então um Nash é, de fato, (C; C), um Nash em estratégias puras. O mesmo raciocínio aplica-se ao equilíbrio de Nash (L; L). Mas há também um equilíbrio de Nash em estratégias mistas. Para encontrá-lo, primeiramente vamos calcular r (L). Ele deve ser tal que iguale o payo¤ da garota em jogar cada uma das estratégias, dado r (L): ug (C; 4

(1

r

r

(L)) = ug (L;

(L)) + 0 = 10 2 r (L) = 7

r r

(L))

(L) + 0

Como o jogo é simétrico, o raciocínio é o mesmo para ambos os jogadores, rapaz e garota. Portanto, um outro equilíbrio de Nash é cada um ir ao Leblon com probabilidade 2/7: ( r (L) = 2=7; g (L) = 2=7). Para aplicarmos a Proposição (???) acima, note que o ganho esperado de r (como o jogo é simétrico, o mesmo valerá para g) quando ambos jogam o equilíbrio em estratégias mistas é ur

r;

g

=

2 7

2 7

10 +

2 7

5 7

5 7

0+

2 7

5 7

0+

5 7

4=

20 7

Da mesma forma o seu ganho esperado quando joga cada uma das estratégias puras que compõe o equilíbrio com estratégias mistas é dado por ( ur r (L) ; g = 27 10 + 57 0 = 20 7 ur r (C) ; g = 72 0 + 57 4 = 20 7 onde, podemos ver, ur

r;

g

= ur

r

(L) ;

g

= ur (

r

(C) ;

r)

E analogamente para o outro jogador (veri…que), ug

r;

g

= ug (

r;

g

(L)) = ug (

r;

g

(C))

Exemplo 40 Vejamos agora um exemplo de um jogo não simétrico. Suponha a possibilidade de um pênalti e, para simpli…car, que os jogadores envolvidos (o cobrador e o goleiro) tenham apenas duas estratégias puras possíveis: escolher direita ou esquerda 50


(o primeiro para chutar a bola e o segundo para pular na hora da cobrança). Suponha que seja sabido que o goleiro seja mais ágil para saltar para a direita, enquanto para o cobrador o lado, em princípio, não faça diferença. A representação na forma normal é a seguinte: goleiro E D cobrador E 6; 6 3; 3 D 2; 2 9; 9 A idéia é que números maiores para cada um deles denota uma maior probabilidade de sucesso na cobrança. Assim, o cobrador chutar à direita e o goleiro pular para esse mesmo canto é o resultado que maximiza o payo¤ do goleiro e minimiza o do jogador, pois trata-se da situação onde há maiores probabilidades de o goleiro defender o pênalti. Por outro lado, a melhor situação para o jogador (e pior para o goleiro) seria um chute à esquerda, com o arqueiro indo para o outro lado. Na representação acima …ca claro que, em estratégias puras, não existe nenhum equilíbrio de Nash. Pelo teorema de Nash sabemos então que pelo menos um em estratégias mistas existirá. Para começar a análise, olhemos o diagrama para o goleiro (fazer!!!). Podemos concluir também pelo diagrama a ausência de equilíbrio de Nash com estratégias puras (embora ainda tenhamos que ver a representação para os payo¤s do cobrador também). Caso a probabilidade do jogador chutar à direita for menor que c (D), nota-se que o melhor para o goleiro será pular para a esquerda com 100% de chances. Entretanto, caso ele faça isso, para o jogador o melhor será chutar à direita com probabilidade 1 ( c (D) = 1), e portanto a hipótese original de c (D) menor que c (D) não se veri…ca. Raciocínio análogo pode ser feito para o caso onde c (D) > c (D). Mas procuremos um equilíbrio de Nash em estratégias mistas. Para que o goleiro …que indiferente entre suas opções possíveis de estratégias, é necessário que o cobrador chute à direita com a exata probabilidade de c (D). Como pode ser visto no diagrama acima, essa constitui a única possibilidade que faz com que o payo¤ do arqueiro seja o mesmo, independente do que ele faça. Então, para calcular o seu valor basta igualar esses payo¤s: faça e encontre c (D) = 0:4. Portanto, caso o cobrador cobre a penalidade máxima à direita com probabilidade de 40%, para o goleiro será indiferente entre pular para esquerda ou direita. Mas essa é apenas metade da estória. Falta veri…car o que faria com que o jogador utilizasse essa estratégia mista. Como já mostrado, para que ele utilize uma estratégia mista no equilíbrio, será necessário que ele seja indiferente entre utilizar a própria estratégia mista e as estratégias puras que ela contém. Então temos que saber o que o faria ser indiferente entre as duas estratégia puras possíveis. Para melhor visualização, apresentaremos o diagrama de payo¤s para o cobrador (fazer). Calculando g (D) = 0:3. 51


O equilíbrio em estratégias mistas será dado por c

= (0:6; 0:4) ;

g

= (0:7; 0:3)

Assim, caso o goleiro salte para a direita com probabilidade de 30%, o cobrador …cará indiferente entre qual lado escolher para chutar a bola. Portanto, temos que o único equilíbrio de Nash desse jogo é o jogador bater o pênalti à direita com 40% de probabilidade e o goleiro pula para esse lado com 30% de chances. Qualquer desvio dessas probabilidades de um dos envolvidos fará com que o outro não mais …que indiferente entre suas estratégias puras, escolhendo uma delas com probabilidade de 100%, o que fará com que o primeiro também altere sua escolha anterior e assim inde…nidamente, caracterizando a ausência de outros resultados que caracterizem um equilíbrio de Nash. Exemplo 41 Vejamos agora um caso um pouco mais complexo, que envolve mais de duas estratégias puras para um dos jogadores, baseado em exemplo parecido apresentado em Kreps (1994):

jogador 1

A B

C 1; 100 100; 1

jogador 2 D 100; 1 1; 100

E 0; 0 0; 0

Como solucionar esse jogo??? Dê uma olha e veri…que como uma pequena alteração na estrutura do jogo (agora passamos a ter um jogo onde um dos jogadores, o jogador 2, tem um espaço de estratégias com três elementos, C; D e E) pode complicar de uma forma signi…cativa a busca do equilíbrio. Note que no jogo acima não há nenhum Nash em estratégias puras, o que, pelo teorema da existência do equilíbrio em jogos …nitos, nos garante que haverá pelo menos um equilíbrio em estratégias mistas. Devemos começar procurando condições que façam com que os jogadores …quem indiferentes entre estratégias puras, o que torna possível a utilização de estratégias mistas (em situações de equilíbrio). O processo aqui é mais trabalhoso porque um dos jogadores possui três alternativas de escolhas de estratégias puras. Os payo¤s do jogador 2 em cada situação, dado que o jogador 1 joga A com a probabilidade genérica 1 (A), são u2 (

1 (A) ; C)

=

u2 (

1 (A) ; D)

= 1

u2 (

1 (A) ; E)

= 0

100

1 (A)

1 (A)

+ 1 (1

100 (1

1 (A)) 1 (A))

A randomização do jogador 2 poderá ser entre as três estratégias puras possíveis a ele ou entre um par delas. Todas essas possibilidades têm de ser observadas. 52


o jogador 2 é indiferente entre C e D tal que 100 1 (A) + 1 (1 1 (A) = 0:5

1 (A))

=1

1 (A)

100 (1

1 (A))

A condição para o jogador 2 aleatorizar entre C e D é a citada acima. Todavia, com 1 (A) = 0:5, é preferível para o jogador 2 jogar E: com C ou D o seu payo¤ é menor que zero, que ele tem com certeza ao jogar E. Portanto, não há equilíbrio com o jogador 2 randomizando entre C e D22 . o jogador 2 indiferente entre C e E tal que 100 1 (A) + 1 (1 1 1 (A) = 101 Como 1 101

1 (A) 100 100 101

1 (A))

=0

1 = 101 , u2 ( 1 (A) ; C) = u2 ( 1 (A) ; E) = 0 > u2 ( 1 (A) ; D) = 10000 = 1 101 . Portanto, é possível que o jogador 2 randomize entre

C e E. jogador 2 é indiferente entre D e E. Logo 1

1 (A) 1 (A)

=

100 (1

1 (A))

=0

100 101

Como 1 (A) = 100 101 , u2 ( 1 (A) ; D) = u2 ( 1 (A) ; E) = 0 > u2 ( 1 (A) ; C) = 100 10000 100 100 101 + 1 100 = 101 100 + 1 101 . Portanto, também é possível que o jogador 2 randomize entre D e E. Por outro lado, vejamos as condições de randomização para o jogador 1. Os payo¤s do jogador 1 em cada situação, dado que o jogador 2 joga C com probabilidade 2 (C), D com probabilidade 2 (D) e E com probabilidade (1 2 (C) 2 (D)), são u1 (A;

2 (C) ;

2 (D))

= 1

u1 (B;

2 (C) ;

2 (D))

=

2 (C)

100

22

100

2 (C)

2 (D)

+1

+0

2 (D)

+0

Para avaliar a possibilidade de um equilíbrio de Nash com estratégias mistas, devem ser consideradas as duas condições enunciadas e (informalmente) demonstradas no texto: (1) de que o jogador que utiliza uma mista em um equilíbrio de Nash deve ser indiferente entre as puras que a compõe; e (2) que elas devem gerar um payo¤ no mínimo igual ao que poderia ser obtido caso ele utilizasse uma outra estratégia pura disponível. Quando há apenas duas estratégias puras possíveis para um jogador, veri…car a primeira condição é su…ciente. Contudo, se há mais de duas possíveis, é necessário observar também a segunda. Como visto neste exemplo, pode ocorrer que um jogador seja indiferente entre duas estratégias em determinadas circunstâncias, mas que nesses casos exista uma terceira (ou quarta, quinta etc.) possibilidade mais vantajosa, de modo que a indiferença entre as duas estratégias passa a não signi…car nada em termos de equilíbrio.

53


O jogador 1 …cará indiferente entre A e B se o payo¤ jogando cada uma dessas possibilidades for o mesmo: 1

2 (C)

100 2 (D) = 2 (C) = 2 (D)

100

2 (C)

+1

2 (D)

O jogador 1 irá randomizar apenas se a probabilidade do jogador 2 jogar D ou C for a mesma. Analisando essa possibilididade, façamos 2 (C) = 2 (D) = k, onde k 0. A utilidade do jogador 2 fazendo isto será: dada por u2 (k; k; 1

2k) =

1 (A) (

100k + k + 0) + (1

1 (A) (k

100k + 0)) = k

100k

Escolhendo o k possível que maximiza a expressão acima23 temos k = 0, o que implica que, se o jogador 2 coloca a mesma probabilidade em jogar as estratégias C e D (a condição para o jogador 1 randomizar), então ele irá jogar E com certeza (uma vez que 1 2k, com k = 0, é igual a um)24 . Mas, para o jogador 2 não ter incentivos a desviar da estratégia de jogar E com certeza, 1 (A) tem que ser tal que E seja a melhor resposta para o jogador 2. Portanto, o conjunto de estratégias que constituem equilíbrio de Nash é o jogador 2 jogar E e o 1 jogador 1 aleatorizar entre A e B, desde que 1 (A) não seja inferior a 101 e não seja 100 superior a 101 . Note que se 1 (A) não estiver nesse intervalo, não valeria a pena para o jogador 1 jogar E, e sim C ou D. Sendo assim, temos aqui um caso não com um, dois ou três, mas in…nitos equilíbrios de Nash, onde em todos eles o jogador 2 escolhe uma estratégia pura (E) e o jogador 1 escolhe qualquer uma das mistas possíveis desde 1 100 que 1 (A) 2 101 ; 101 . O equilíbrio de Nash portanto é ( 1 100 1 (A)) tal que 1 (A) 2 101 ; 101 1 = ( 1 (A) ; 1 2 = (0; 0; 1) Vejamos a abordagem grá…ca do problema25 . (Fazer) No desenho acima, está representado o payo¤ do jogador 2, com ele jogando cada uma de suas três possibilidades para cada probabilidade possível que o jogador 1 der às 1 100 suas estratégias puras. Note que com 1 (A) 2 101 ; 101 , o melhor para o jogador 2 é jogar E com probabilidade um. Como isto faz o payo¤ do jogador 1 (assim como o do jogador 2) igual a zero com certeza, ele pode randomizar entre suas opções e então temos 1 os equilíbrios de Nash encontrados acima. Por sua vez, com 1 (A) < 101 , o jogador 23 24

A solução do problema do jogador 2, de maxu2 (k; k; 1 k

2k) =

99k é tal que k = 0.

O que já era possível de se perceber quando derivamos a condição para o jogador 2 ser indiferente entre C e D: nesse caso, seria melhor para ele jogar E com certeza, o que acabamos de obter aqui. 25 Note que não é possível (pelo menos bidimensionalmente) apresentar gra…camente o payo¤ do jogador1 segundo as estratégias possíveis do jogador 2, uma vez que esse último possui três estratégias puras disponíveis.

54


2 pre…rirá estritamente a opção C, e então o jogador 1 jogará A com probabilidade um, que corresponde à extrema direita do desenho e portanto não é compatível com a 1 hipótese utilizada de 1 (A) < 101 . Raciocínio análogo aparece no caso de 1 (A) > 100 101 . Uma nota importante a respeito de estratégias mistas que constituem equilíbrios de Nash é o fato de que os jogadores, como assinalado acima, não têm preferências em jogar a estratégia mista ou alguma das estratégias puras que a constitui. Além disso, o que determina as probabilidades em que os jogadores randomizam é a necessidade do outro(s) jogador(es) …car(em) indiferente(s) entre as estratégias em que ele(s) coloca(m) probabilidade positiva na(s) sua(s) estratégia(s) mista(s). Isto leva ao fato de se questionar o porquê de um jogador se preocupar em aleatorizar, dado que isso não incrementaria seu payo¤ esperado. Se o jogo for jogado várias vezes, torna-se fácil de se perceber a vantagem do comportamento aleatório, pois não procedendo assim o(s) outro(s) jogador(es) explorarão em proveito deles essa previsibilidade de comportamento (lembre, por exemplo, o caso do pôquer citado no início da seção). No caso de um jogo que não irá mais se repetir (ao menos com uma certa probabilidade), a questão torna-se mais delicada. Uma resposta possível é que, na realidade, as pessoas em geral não aleatorizam. O que elas fazem é guiarem-se por alguns sinais inconsequentes (para o jogo em si) e, a partir daí, de…nem suas opções. O importante é que o outro jogador não perceba o signi…cado de tais sinais e enxergue o primeiro como se ele estivesse aleatorizando. Voltemos ao exemplo do goleiro à frente de uma penalidade máxima. Pode ser que o jogador saiba em que lado ele irá chutar. Mas como o goleiro não tem essa informação, pode acreditar que o jogador irá aleatorizar de alguma forma, e apenas isso já seria su…ciente para justi…car um comportamento aleatório de sua parte.

2.5

Aplicações

Nessa seção apresentaremos algumas aplicações do conceito de equilíbrio de Nash. Temos, ao fazer isso, dois objetivos em mente. O primeiro é mostrar o quanto pode ser útil a utilização da linguagem de teoria dos jogos em situações descritas a partir do comportamento de agentes econômicos bem de…nidos, como por exemplo as …rmas que compõem um determinado oligopólio. O segundo obejtivo é apresentar a teoria de escolha sob interdependência estratégica a partir de espaços de estratégias tão ricos quanto se queira. Ou seja, vamos trocar as situações descritas nos exemplos apresentados no texto até aqui, em que cada jogador tem no máximo cinco estratégias disponíveis, por casos em que há um contínuo de possibilidades de escolha. O nosso foco principal será a teoria de concorrência imperfeita, quando trataremos de alguns modelos canônicos de oligopólio e cartel. No entanto também discutiremos uma interessante situação de …nanciamento e provimento de um bem público.

55


2.5.1

Oligopólio de Cournot

Um oligopólio é uma estrutura de mercado intermediária entre os casos limites de monopólio e de competição perfetia. Nesse sentido a de…nição decorre de imediato: em um oligopólio há um número de …rmas n > 1 tal que nenhuma das …rmas é capaz, sozinha, de determinar o preço do produto no mercado (como seria o caso de um ambiente monopolista) mas no entanto cada uma dessas …rmas é capaz de in‡uenciar em alguma medida o preço que se estabelecerá. O modelo de Cournot é um dos mais tradicionais modelos de oligopólios existentes na literatura. Embora originalmente, no trabalho de Cournot (1897, com a primeira edição em 1838), não tenha sido utilizado o conceito de equilíbrio de Nash (dado que esse não havia nem mesmo sido de…nido), a abordagem é necessariamente de teoria dos jogos - assim como é a maior parte da literatura moderna de organização industrial26 . A hipótese básica do modelo é que os jogadores (as …rmas envolvidas) escolhem isoladamente a quantidade a se produzir, ignorando a escolha da(s) outra(s) …rma(s). O preço de mercado torna-se, portanto, endógeno: dada a quantidade total produzida no mercado, ele é de…nido com base na demanda agregada do setor. Outra hipótese é que os produtos de cada …rma não são diferenciados27 pelos consumidores, i.e., são homogêneos. De…niremos as funções de custo de cada …rma e a de demanda do mercado da maneira mais simples possível, assim como faz Gibbons (1992), de modo a evitar “algebrismos” desnecessários e a destacar o mais importante, que é o processo de resolução do modelo. Segue então que o modelo de Cournot diz respeito a um jogo estático onde as …rmas escolhem simultâneamente o quanto produzir. Ainda que numa primeira aproximação possa parecer estranho conceber …rmas decidindo simultâneamente, como num jogo de par ou ímpar, isso tem uma apelo intuitivo imediato: signi…ca apenas que cada …rma, ao fazer a sua escolha, não sabe qual foi a escolha da rival, situação essa que é extremamente comum no mundo real. Cada …rma sabe apenas que a rival sabe que ela também não conhece a sua escolha e que a rival sabe que ela sabe que a rival não conhece a sua escolha e assim in…nitamente. Como é habitual, o problema da …rma consiste em fazer suas escolhas de forma a obter o maior lucro possível. No entanto - e distintamente 26

Grosso modo, organização industrial é o ramo da (micro)economia que estuda o comportamento das …rmas no contexto da estrutura dos mercados em que elas estão inseridas. Em geral, essa estrutura é descrita pela demanda dos consumidores pelo bem que esse mercado produz, pela tecnologia que as …rmas utilizam e que caracterizarão a sua e…ciência relativamente às suas concorrentes e pelo grau de competição que as …rmas enfrentam. 27 Duas …rmas produzem bens homogêneos se os consumidores se preocupam apenas com o preço quando fazem a escolha de qual …rma comprar. Outros atributos como a qualidade do produto ou outras características quaisquer se tornam irrelevantes para a análise do processo de decisão de compra dos consumidores. Segue que uma única curva de demanda agregada para as …rmas representa a procura dos consumidores pelo bem em questão.

56


do modelo competitivo - a …rma toma sua escolha considerando o fato de que as escolhas alheias (no caso as decisões de produção de suas competidoras) vão afetar o seu payo¤, caracterizando um elemento estratégico. Basicamente, ao tomar suas decisões, as …rmas vão considerar um conjunto de restrições dadas pelas demanda dos consumidores do bem (especi…cada pela curva de demanda pelo produto), por restrições tecnológicas (que serão incorporadas na estrutura de custo de cada …rma) e por restrições de competição dadas pelo número e pelas características dos seus competidores. Vamos considerar um modelo simples onde duas …rmas, 1 e 2, produzem um bem homogêneo cuja demanda é dada por P (Q) = a

Q

onde a > 0 e Q = q1 + q2 é a oferta da indústria, dada pela soma do produto das …rmas que compões essa indústria. Vamos considerar que para ambas as …rmas o custo …xo é nulo é que o custo marginal (aqui ao custo médio) é constante e idêntico para as empresas, ( C1 (q1 ) = cq1 C2 (q2 ) = cq2 onde c 2 (0; a] por um motivo que …cará claro adiante. Podemos então representar esse jogo na forma normal G = fS1 ; S2 ; u1 ; u2 g tal que temos 1. os jogadores: as …rmas 1 e 2; 2. os espaços de estratégias dos jogadores, S1 e S2 onde vamos supor que Si = [0; q i ], i = 1; 2 . Note que nesse caso os conjuntos de escolhas das …rmas é dado pelo espaço aonde as …rmas podem escolher produzir: no mínimo zero e no máximo uma quantidade muito grande porém …nita; 3. a função de ganho dos jogadores, u1 e u2 . No caso de …rmas, essas funções de ganhos são exatamente a função de lucro de cada uma delas, dadas por ( cq1 1 (q1 ; q2 ) = P (Q) q1 cq2 2 (q1 ; q2 ) = P (Q) q2 que se expressa na diferença entre a receita e o custo da …rma. Note que, como esperado, a função de ganho caracteriza o elemento de comportamento estratégico. O ganho de cada …rma é determinado não só pela sua escolha - pela quantidade que ela resolveu produzir - como também pela escolha da concorrente.

57


Como dito anteriormente, no modelo de Cournot o problema das …rmas é escolher quantidades simultaneamente, procurando maximizar seus respectivos lucros. Tomemos o caso da …rma 1 inicialmente. O seu problema é 8 > max 1 (q1 ; q2 ) = P (Q) q1 cq1 = > > q1 2S > 1 01 > > > > > > C B > < = @a QA q1 cq1 = | {z } P (Q) > 0 1 > > > > > > B C > = @a (q1 + q2 )A q1 cq1 > > > | {z } : Q

de modo que as condições de primeira ordem do problema acima nos mostram que @ 1 =a @q1

2q1

tal que, resolvendo,

q2

c=0

c q2 2 o que nos dá exatamente a melhor resposta que a …rma 1 pode dar para toda conjectura a respeito da produção da …rma 2. Chamamos essa expressão de “função de reação” da …rma 1 e colocamos o termo entre aspas pelo fato de se tratar de um jogo de escolha simultânea: as …rmas não estão reagindo exatamente à uma ação que elas observaram, mas sim à uma ação esperada da(s) concorrente(s). No entanto essa expectativa não é tomada aleatoriamente, mas assumindo que a …rma rival está operando também na sua função de reação correspondente. Uma outra observação relevante diz respeito à inclinação da “função de reação”. Observe que @q1 (q2 ) 1 = >0 @q2 2 q1 (q2 ) =

a

o que nos mostra que a melhor reação que uma …rma pode tomar em relação à variações na oferta da concorrente é seguir na direção contrária. Procedendo da mesma forma para a …rma 2, decorre (faça as contas) que q2 (q1 ) =

a

c 2

q1

será a “função de reação” da …rma 2, a melhor resposta que ela pode dar às escolhas da rival. Uma vez que temos em mãos as respectivas melhores respostas das …rmas, …ca trivial determinar o equilíbrio de Nash desse jogo: como de…nimos anteriormente, esse

58


é dado pela intereseção das melhores respostas. Substituindo q2 (q1 ) em q1 (q2 ), é fácil veri…car que 1 q1 = (a c) 3 de modo que o equilíbrio de Nash desse jogo é dado por 1 (a 3

(q1 ; q2 ) = Como qi 2 [0; q i ], concluímos que a Q = q1 + q2 =

1 (a 3

c) ;

1 (a 3

c)

c. A oferta da indústria é c) +

1 (a 3

c) =

2 (a 3

c)

e o preço de mercado P (Q) = a

Q=

1 (a + 2c) 3

de modo que o lucro da …rma 1 seria 1

= P (Q) q1 cq1 = q1 (P (Q) 1 1 (a c) (a + 2c) c = 3 3 1 = (a c)2 9

c)

Analogamente, 1 (a c)2 9 Por …m note que as hipóteses utilizadas de que há apenas duas …rmas com estruturas de custos idênticos produzindo são apenas para simpli…car a nossa análise. Nos exercícios essas hipóteses são violadas e são dadas chances a vocês de entender o que muda com isso. Na verdade, não há problemas algum em relaxá-las. Mostraremos abaixo o caso onde existem n oligopolistas e manteremos a hipótese de custos marginais iguais entre as …rmas, apenas para obter um resultado de comparação mais fácil com o caso inicial, com duas …rmas. Resolva como exercício o duopólio de Cournot onde, por exemplo, o custo marginal das duas …rmas se diferem, comparando os resultados com os obtidos acima. Utilizando a mesma estrutura anterior, teremos certamente quantidades produzidas idênticas para todas as n …rmas, uma vez que suas estruturas de custos são as mesmas, o que de resto vai caracterizar um equilíbrio simétrico. Segue o problema de uma …rma 2

=

59


i qualquer é max qi

i

= fP (Q) qi = f(a

cqi g

Q) qi

cqi g

= f(a q1 q2 ::: 80 1 n < X @a = qj A qi :

qi cqi

j=1

de modo que as CPO’s nos mostram que a

2qi

n X

qj

::: 9 =

qn ) qi

cqi g

;

c = 0.

j=1 j6=i

A “função de reação” do jogador i é dada por 0 1B a qi (q i ) = B 2@

c

n X j=1 j6=i

1

C qj C A

(q i ) onde, notemos, @qi@q < 0 8j 6= i; a função de reação, como usual em Cournot, j tem inclinação negativa. Nesse ambiente, com bens homogêneos e tecnologias similares (função custo), a implicação imediata de um equilíbrio simétrico é que, em equilíbrio, n P q1 = q2 = ::: = qn , de modo que qj = (n 1) qi . Segue que a expressão acima …ca j=1 j6=i

a

2qi

n X

qj

c=a

(2 + (n

1)) qi

c=0

j=1 j6=i

Logo, em equilíbrio, qi =

1 (a n+1

c) > 0 para a > c.

O equilíbrio de Nash28 desse jogo é portanto cada …rma produzir da indústria e o preço do produto serão, respectivamente, 8 n < Q = P qj = n (a c) n+1 . j=1 : a+nc P (Q) = a Q = n+1 28

1 n+1

(a

c). A oferta

Note que obtemos um resultado genérico. Veja o que ocorre quando n = 2 e compare o equilíbrio desse jogo. Faça o mesmo para a oferta da indústria, o preço de mercado e o lucro de cada …rma.

60


Segue que o lucro da i-ésima …rma em equilíbrio será i

= P (Q) qi a + nc = n+1 {z |

P (Q) c

=

cqi = (P (Q) c) qi 1 c (a c) n+1 }| {z } qi

1 (a (n + 1)2

c)2 , i = 1; 2; :::; n

Se n ! 1, então podemos veri…car (L’Hopital) que a oferta da indústria e o preço serão, respectivamente, ( Q=a c P (Q) = c e o lucro de equilíbrio i

= 0, i = 1; 2; :::; n

caracterizando um equilíbrio em competição perfeita (veri…que). Se n = 1, então 8 1 > < Q = 2 (a c) P (Q) = 21 (a c) > : 1 c)2 i = 4 (a

como esperaríamos em um monopólio. Dito de outra menira, quanto maior for o número de …rmas do mercado, n, menor será a produção de cada …rma. Particularmente, se existirem apenas duas …rmas, voltaríamos ao caso anterior, como mostramos. Por outro lado, se n tende a in…nito, a produção tende a zero, denotando o reduzido espaço que cada uma teria no mercado. Note por …m que o resultado acima nos dá outra interpretação genérica para esse ambiente: se a estrutura da indústria for um duopólio, o mercado corresponderá a apenas 2/3 do mercado de concorrência perfeita. Para uma indústria com 3 …rmas, n seria 3/4. Para 4 …rmas, 4/5 e assim sucessivamente dado pelo termo n+1 . Estabilidade do equilíbrio de Nash: cartel no modelo de Cournot Uma das propriedades dos resultados de equilíbrio (de Nash) em jogos estáticos de informação completa diz respeito à estabilidade desse resultado. Nesse sentido dizemos que o equilíbrio de Nash é um resultado “estrategicamente estável”, o que signi…ca que, uma vez que os jogadores tenham identi…cado o equilíbrio de Nash do jogo, nenhum deles tem qualquer incentivo para se desviar e jogar uma outra estratégia fora do equilíbrio. Na verdade esse tipo de questão é totalmente pertinente quando consideramos jogos como Dilema dos Prisioneiro, abaixo representado na sua forma estratégica.

61


1

não confessa confessa

2 não confessa 1; 1 0; 9

confessa 9; 0 6; 6

Como sabemos, o único equilíbrio de Nash desse jogo é (C; C), ainda que não seja um resultado e…ciente. É fácil ver que (N C; N C) é um resultado em que ambos os jogadores estão melhores do que no equilíbrio. A questão que surge é se há algum tipo de arranjo que pode ser feito entre os jogadores de forma a dar suporte a (N C; N C) como resultado do jogo. Por exemplo, podemos permitir que haja comunicação entre os jogadores, de modo que eles estabeleçam um compromisso mútuo sobre as suas escolhas. Ainda que isso seja possível (a comunicação e o compromisso) restaria questionar se esse acordo seria merecedor de credibilidade. Isso é, deveríamos acreditar que algum do jogadores de fato iria cumprir a sua promessa e adotar a estratégia acordada com o outro jogador? A resposta a essa pergunta é um estrondoso não! Se foi feito o acordo e ambos prometram “não confessar”, ainda assim devemos esperar que o resultado do jogo seja o equilíbrio de Nash, (C; C). É fácil ver porque: uma vez que o acordo foi feito, cada jogador se questionaria sobre a sua escolha. Se ele acredita que o outro jogador irá cumprir o compromisso, a melhor resposta que ele pode dar a essa posição ainda assim é “confessar”. Nesse caso seu ganho seria de 0 e o do oponente seria 9. Em uma outra conjectura, se ele por algum motivo crê que o outro jogador não cumprirá o acordo, “confessa”continua sendo a melhor resposta. Se …zermos um raciocínio análogo para o outro jogador a resposta seria a mesma. Concluímos portanto que o compromisso não é crível e que o resultado do jodo de fato será o equilíbrio de Nash. Para ilustrarmos o que foi dito acima, considere o oligopólio de Cournot acima descrito. Nesse mesmo ambiente, considere agora o que seria a escolha ótima de um monopolista. Ou seja, considerando que haja apenas uma …rma nesse mercado - a sua oferta é igual à oferta da indústria, Qm = qm - o problema dessa …rma é max

qm 2Sm

m

= P (qm ) qm

cqm = (a

qm ) qm

cqm

de modo que 1 (a c) = Qm 2 menor do que a oferta da indústria em duopólio, como esperado. O preço em monopólio será maior 1 P (qm ) = (a + c) 2 qm =

62


e o lucro do monopolista será também maior do que o lucro dos duopolistas em Cournot, m

= (P (qm ) =

1 (a 4

1 (a + c) 2

c) qm =

1 (a 2

c

c)

c)2

Mas mais do que maior do que o lucro dos duopolistas em Cournot, podemos veri…car que o lucro de monopólio é mais do que duas vezes maior que o lucro das …rmas em competição, m

2

=

1 (a 8

c)2 >

i

=

1 (a 9

c)2

Emerge então uma questão natural natural: talvez devêssemos esperar que os duopolistas de Cournot se coordenassem e constituíssem um cartel de forma a aumentar o seu poder de determinação do preço de mercado. Nesse acordo, cada …rma produziria a metade da quantidade de monopólio, qi = q2m = 14 (a c), tal que a oferta da indústria seja aquela de monopólio, Q = q1 + q2 = qm , o preço seria o mesmo de monopólio, P (Q) = P (qm ) = 21 (a + c), e o lucro da INDÚSTRIA seria o lucro de monopólio, 1 c)2 . Como cada …rma produziu a mesma quantidade, elas dividiriam o lucro da 4 (a indústria igualmente, de modo que os lucros seriam i

=

1 (a 8

c)2 , i = 1; 2

que seriam os lucros das …rmas em cartel. Como ambas as …rmas estão melhor se coordenando em cartel do que competindo em Cournot, podemos imaginar num primeiro momento que essa arranjo de fato seria a estratégia ótima a ser adotada pelas …rmas. No entanto, pelo argumento desenvolvido no começo dessa seção, restaria analisar se o cartel é um equilíbrio, no sentido de, uma vez que ele seja constituído, nenhum dos jogadores, das …rmas, venha a ter incentivos para desviar do compromisso de produzir exatamente a quantidade acordada, 41 (a c). Considere então uma situação em que o cartel foi constituído e que as …rmas concordaram sobre o plano de produção acima descrito. Vejamos o caso da …rma 1 - o caso da …rma decorre por analogia de imediato. Há duas conjecturas que a …rma 1 pode fazer sobre o comportamento da …rma 2, quais sejam (i) a …rma 2 vai cumprir o acorddo e (ii) a …rma 2 não vai cumprir o acordo. No caso (ii) a melhor resposta que a …rma 1 pode dar é não cumprir o acordo também e se estabeleecer uma competição de Cournot, com os payo¤s dados pelos valores acima descritos. Esse resultado está representado no jogo abaixo. Vejamos qual é problema da …rma 1 quando ela conjectura que a …rma 2 vai cumprir o acordo feito na constituição do cartel. Nessa hipótese de o cartel ter sido constituído e 2 respeitá-lo, o problema de otimização da …rma é escolher a sua oferta de forma a maximizar o seu lucro, dado que a …rma 63


2 está cumprindo o acordo e produzindo q2 = 14 (a c). Ou seja, como era de se esperar, a …rma 1 vai incorporar no seu processo de decisão a informação de que a outra …rma estaria respeitando o acordo. Isto é, o seu problema seria max

q1 2S1

= = = =

max

q1 2S1

max

q1 2S1

max

q1 2S1

max

q1 2S1

1 =q2

=

1 (a 4

c)

1 (a c) 4 1 (a Q) q1 cq1 =q2 = (a c) 4 1 (a q1 q2 ) q1 cq1 =q2 = (a 4 1 (a c) q1 cq1 a q1 4 P (Q) q1

cq1 =q2 =

c)

de modo que as condições de primeira ordem nos mostram que ( a 2q1 41 (a c) c = 0 q1 = 38 (a c) > 41 (a c) Concluímos portanto que seria ótimo para …rma 1 não cumprir o acordo e produzir uma quantidade maior do que aquela estabelecida no cartel. Essa otimalidade …ca claro quando notamos que a oferta da indústria será 5 Q = (a c) 8 e o preço 3a + 5c P (Q) = 8 de onde segue que o lucro da …rma 1 seria = (P (Q) c) q1 3a + 5c 3 = c (a c) 8 8 9 1 = (a c)2 > (a c)2 64 8 Note que o lucro da …rma 1 seria superior ao lucro de cartel, o que nos permite concluir que a …rma teria incentivos a não respeitar o acordo com a …rma 2 e produzir uma quantidade maior do que aquela acordada. Já o lucro da …rma 2 seria 1

2

= (P (Q) c) q2 3a + 5c 1 = c (a c) 8 4 3 1 = (a c)2 < (a c)2 32 9 64


auferindo ganhos menores do que aqueles que ela teria se engajasse em uma competição com a …rma 1. Podemos desenvolver um raciocínio análogo para a …rma 2 e gerar, por simetria, resultados semelhantes. Segue que na forma normal esse jogo seria exatamente um Dilema dos Prisioneiros, como abaixo descrito,

…rma 2 …rma 1

cartel compete

1 8 9 64

(a (a

cartel c)2 ; 18 (a c)2 3 c)2 ; 32 (a c)2

3 32 1 9

(a (a

compete 9 c)2 ; 64 (a c)2 c)2 ; 19 (a c)2

onde o único equilíbrio de Nash é competir em Cournot. Podemos ver que o payo¤ associado ao cartel é estritamente maior do que o ganho de equilíbrio para ambas as …rmas, de modo que o equilíbrio não é e…ciente. No entanto o acordo não é crível na medida em que nenhuma das …rmas tem incentivos a jogar nenhuma estratégia que não aquela(s) que compõem o equilíbrio de Nash do jogo: o equilíbrio de Nash é um resultado (estrategicamente) estável. Antes de discutirmos o resultado acima a partir de um exemplo no mundo real, considere uma palavra de precaução. O que a análise mostrou não foi que cartéis não existem ou mesmo que não devemos esperar que venham a existir. O que mostramos foi que nessa estrutura, analisando um jogo estático de informação completa NÃO REPETIDO, o cartel não é um resultado crível. Não obstante, podemos adiantar que mesmo em situações em que o cartel possa ser caracterizado como uma estratégia de equilíbrio, haverá um componente de instabilidade signi…cativo. O ponto é que em relacionamenteos repetidos, onde os jogadores usam suas respectivas reputações (o que eles …zeram no passado) para suportar esse resultado de cartel, a constituição de um sistema penal entre os jogadores que dê lastro ao compromisso pode ser extremamente complexa e via de regra vai estar sujeita a choques que irão comprometer essa credibilidade ao longo do tempo. O Cartel da OPEP Um dos exemplos clássicos de comportamento colusivo para a determinação do preço de uma mercadoria diz respeito ao mercado internacional de petróleo. O cartel da OPEP (Organização dos Países Exportadores de Petróleo) foi formado em 1960 pela Arábia Saudita, Venezuela, Kuwait, Iraque e Irã como resposta aos esforços de re…narias americanas (lideradas pela Standard Oil) para reduzir os preços dos que elas estavam pagando pelo óleo importado dessas regiões29 . Até o 29

Nesse sentido o cartel da Opep - que busca manter o preço do petróleo em um nível acima daquele que vigoraria em caso de competição - surge com uma resposta ao comportamento de um cartel de compradores no sentido de reduzir o preço do produto.

65


boicote de 1972, a OPEP tinha pouco impacto sobre o mercado mundial e apenas no começo dos anos 80 a organização tentou explicitamente aumentar o preço do óleo30 . A estratégia adotada para manter altos preços foi similar à descrita acima nessa nota. Os países membros deveriam restringir a sua produção; ou eles acabariam produzindo uma quantidade maior do que a demanda mundial, convergindo para uma situação de competição perfeita. Nesse sentido cada país acordou em respeitar uma quota de produção, de modo que em 1982 a OPEP determinou um produto limite diário de 18 milhões de barris de petróleo - em 1979 havia sido de 31 milhões barris e o preço chegou a US$ 34,00 por barril. No arranjo …rmado entre os membros, cada país tinha uma quota individual de produção, exceto a Arábia Saudita, que era o maior produtor e que …cou responsável em ajustar a sua oferta como necessário para manter os preços. Como argumentamos no modelo apresentado acima, o estabelecimento e a manutenção de um cartel não é algo trivial de se conseguir. No caso da OPEP não foi diferente. Não obstante o baixo número de membros e a natureza pública das informações com relação ao cumprimento ou não das quotas estabelecidas, via de regra o acordo era quebrado. Em algumas situações a Arábia Saudita colocou no mercado um volume de petróleo que fazia com que o preço do barril estivesse abaixo daquele estabelecido no acordo, auferindo dessa forma lucros acima daqueles que obteria se cumprisse o acordo e provocando perdas aos outros países que respeitaram as suas quotas. Outro exemplo interessante de violação do cartel ocorreu durante o período da guerra Irã-Iraque (1980-1985), quando não raramente o volume total ofertado de óleo excedia aquele acordado entre os países. Esse tipo de comportamento acabou abarrotando o mercado de petróleo e, a despeito dos esforços da Arábia Saudita para controlar a ofeta global, os preços despencaram. Além de todas essas questões relacionadas à instabilidade do arranjo arquitetado entre os países, ocorreram várias disputas envolvendo empresas que não pertenciam ao cartel, como a British National Oil Company que estabeleceu um preço de US$ 3,00 em 1983, provocando uma guerra de preços com alguns dos países membros da Opep. Hoje em dia a produção da Opep ocupa pouco menos do que 30% do mercado mundial de petróleo. Com o preço do barril estando abaixo dos US$ 20,00, o efeito do cartel sobre a determinação desse preço é em certa medida negligível. Em vários outros mercados de commodities tem havido esforços para cartelização, como café, chá etc. Alguns destes têm experimentado algum sucesso no curto prazo, como foi o caso dos produtores de bauxita e urânio, mas não se sustentaram ao longo do tempo - uma excessão digna de crédito diz respeito à produção de diamantes. Em geral, a maioria dos cartéis internacionais têm se mostrado ine…cazes em afetar de uma 30

Um ponto relevante nesse ambiente diz respeito aos aspectos legais desse tipo de comportamento colusivo. Na medida em que a OPEP é controlada por países, as leis antitrustes das demais a nações não têm alcance sobre as medidas de…nidas pela organização.

66


maneira substancial os preços por um longo período de tempo. 2.5.2

Oligopólio de Bertrand Betrand (1883): como Cournot, trata-se de um jogo de escolha simultânea e de informação completa, mas aqui as …rmas competem entre si via escolha de preço, não de quantidade. Hipóteses: – duas …rmas, 1 e 2, que produzem um bem homogêneo. – custo …xo é nulo e o custo marginal é contante e idêntico para ambas as …rmas, c > 0. – assuma uma curva de demanda linear (para compararmos com Cournot) no produto total Q=a p onde p é o preço de mercado. as …rmas declaram simultaneamente os preços e se dispõem a ofertar tudo o que for demandado àqueles preços. – os consumidores compram da …rma que cobra mais barato: segue que a …rma anuncia o menor preço detém todo o mercado enquanto a outra …rma …ca forma do mercado. – se ambas as …rmas declaram o mesmo preço, então elas dividem o mercado igualmente, cada uma uma com metade. o lucro de cada …rma, como habitual, depende não apenas de sua própria escolha mas também é afetado pela escolha da rival. Tome o caso da …rma 1, por exemplo, seu lucro será 8 > < (p1 c) (a p1 ) se c < p1 < p2 1 (p ; p ) = c) (a p1 ) se c < p1 = p2 1 1 2 2 (p1 > : 0 caso contrário

– note que o lucro de 1 é positivo se p1 > c. Além disso, ele será tanto maior se seu preço for menor do que o da rival e apenas a metade se for igual. Por …m o lucro nunca será negativo na medida em que cada …rma tem a prerrogativa de cobrar um preço igual ao custo marginal e assegurar lucro 0 na pior das hipóteses.

67


– como a situação é a mesma para a …rma 2, vamos restringir nossa atenção para preços tais que pi c, i = 1; 2 qual o equilíbrio de Nash desse mercado? – paradoxo de Bertrand: o único equilíbrio de Nash será ambas as …rmas cobrarem um preço igual ao custo marginal e ambas terem lucro zero. – como a função lucro é descontínua, nós não podemos mostrar esse resultado pelos argumentos padrões, diferenciando e resolvendo as condições de primeira ordem. – então, o que fazer??? observe que a …rma com o menor preço detém todo o mercado. Segue que cada …rma tem um incentivo a anunciar um preço menor do que o da rival. Em última instância, isso direcionará o preço de equilíbrio para baixo, até o custo marginal. Vejamos agora o argumento formal para isso. 1. note que um equilíbrio de Nash do jogo é cada …rma cobrar o custo marginal: nesse caso cada …rma tem metade do mercado e aufere lucro zero porque cada unidade é vendida ao seu custo de produção. – porque é um equilíbrio? Se ela elevar seu preço, ela perderá toda a demanda que tinha posto que o preço da rival será estritamente menor! nenhuma …rma tem incentivos a desviar. – segue que não é possível que nenhuma …rma tenha lucro maior do que zero, de modo que a escolha de preço de cada …rma é ótima dada a escolha alheia (melhor resposta). 2. agora vamos mostrar que não há outro equilíbrio de Nash. Como cada …rma i = 1; 2 escolhe pi c, é su…ciente mostrar que não há equilíbrio para pi > c. Então, deixe (p1 ; p2 ) ser um equilíbrio. – se p1 > c, então porque p2 maximiza o lucro de 2 dada a escolha de 1, teremos p2 2 (c; p1 ], de modo a ter um lucro estritamente positivo - fora desse intervalo seria nulo. – além disso, p1 6= p2 , pois se …rma 2 pode ter lucro positivo escolhendo p2 = p1 e dividindo o mercado com 1, ela pode ter um lucro maior ainda cobrando um preço um pouco abaixo de p1 e desfrutando de todo o mercado quase ao mesmo preço. Logo p1 > c ! p2 > c e p2 < p1 68


– mas para uma estória similar para as …rmas com os papéis trocados p2 > c ! p1 > c e p1 < p2 de modo que se o preço de uma …rma está acima do custo marginal, ambos os preço devem estar acima do custo marginal e cada …rma deve anunciar um preço um pouco menor do que a rival, o que é impossível. no modelo de Bertrand, o preço será igual ao custo marginal com apenas duas …rmas. Isso está em forte contraste com o que ocorre em Cournot, onde a diferença entre o preço e o custo marginal cai apenas na medida em que o número de …rmas no mercado aumenta. 2.5.3

Oligopólio de Bertrand com bens diferenciados

Os modelos de Cournot e Bertrand que apresentamos acima são modelos que tomas como hipótese que as …rmas produzirão um bem homogêneo e nesse sentido a ínica variável que vai distinguir esse bem aos olhos dos consumidores é o preço. Na verdade, essa hipótese poderia ser relexada naquele ambiente, mas vamos tomar isso como motivação para abordarmos o modelo de Bertrand (Joseph Louis François Bertrand, 1822-1900), que toma um modelo que em certa medida se assemelha com Cournot - por se tratar de um jogo simultâneo - e no entanto tem uma característica que o distingue, qual seja o fato de que a variável de escolha das …rmas é o preço. Nesse sentido trataremos novamente de um duopólio onde duas …rmas, 1 e 2, produzem bens difereciados31 onde a demanda por cada um dos bens é dada por ( q1 (p1 ; p2 ) = a p1 + bp2 q2 (p1 ; p2 ) = a p2 + bp1 onde a > 0 e b > 0. O fato de que b > 0 re‡ete o grau em que o produto de uma das …rmas é substituto do produto da outra. Como no modelo anterior, e sem perda de generalidade, vamos assumir que não há custo …xo para as …rmas produzirem e que o custo marginal é constante e igual a c > 0. Na forma normal temos (i) os jogadores, que são as …rmas 1 e 2, (ii) o espaço de estratégia de cada …rma, que em Bertrand é dado pelo conjunto no qual as …rmas podem estabelecer seu preço, pi 2 (0; p] ; i = 1; 2 e que supomos ser tal que a …rma cobra no mínimo um preço muito baixo mas positivo pelo bem e no máximo um preço muito alto porém de…nido tal que o conjunto (0; p] seja compacto e (iii) a função de ganho de cada jogador que, no caso de …rmas, é dada pela função lucro, i (p1 ; p2 ), 31

Aqui, diferente do caso de bens homogêneos, os produtos se distinguem aos olhos dos consumidores potenciais não mais apenas em função de preços, mas também em função de outras características, físicas ou não, tais que torna-se necessário especi…car para cada produtor uma curva de demana particular.

69


i = 1; 2 e que caracteriza a interação estratégica entre as partes na medida em que os payo¤s de cada jogador são afetados pelas escolhas alheias. O problema de uma …rma qualquer, por exemplo da …rma 1, é portanto max

p1 2(0;p]

1

= p1 q1 (p1 ; p2 ) = p1 [a = (p1

c1 (q1 )

p1 + bp2 ] c) [a

c [a

p1 + bp2 ]

p1 + bp2 ]

tal que as condições de primeira ordem nos mostram que a

2p1 + bp2 + c = 0

tal que a + c + bp2 2 é a “função de reação” da …rma 1 e nesse sentido nos diz qual é a melhor resposta 1 (p2 ) que a …rma 1 pode dar às eventuais escolhas da …rma 2. Note agora que @p@p = 2 b 2 > 0 tal que, ao contrário de de Cournot, em Bertrand a função de reação das …rmas tem inclinação positiva, o que nos diz que a melhor resposta que uma …rma pode dar à variações nos preços das concorrentes é seguir na direção oposta, reduzindo ou aumentando seus preços de forma a maximizar os seus ganhos. Fazendo raciocínio análogo para a …rma 2, temos p1 (p2 ) =

a + c + bp1 2

p2 (p1 ) =

tal que torna-se trivial encontrar o equilíbrio de Nash na medida em que tenhamos entendido o conceito como uma interseção de melhores respostas dos jogadores. Sustituindo p2 (p1 ) em p1 (p2 ) obtemos p1 =

a+c b + 2 2

a + c + bp1 2

4p1 = 2 (a + c) + b (a + c) + b2 p1 4

b2 p1 = (2 + b) (a + c) a+c p1 = 2 b

Analogamente para a …rma 2,

a+c 2 b tal que o equilíbrio de Nash é cada …rma cobrar o preço p2 =

p1 = p 2 = 70

a+c 2 b


Para pi 2 (0; p] e (a; b; c) …rma i = 1; 2 será

0 temos que b 2 (0; 2). Com isso em mãos, a oferta da a+c a+c +b 2 b 2 b a c + bc , i = 1; 2 2 b

qi (p1 ; p2 ) = a qi (p1 ; p2 ) =

; i = 1; 2

e o lucro de cada …rma será dado por i

=

a

c + bc 2 b

2

; i = 1; 2.

de modo que as …rmas têm lucro positivo. 2.5.4

O problema dos comuns

Nesta seção apresentaremos um exemplo de aplicação de teoria dos jogos - especi…camente de jogos estáticos de informação completa, que é o nosso objeto de análise até aqui - que não seja um oligopólio. Novamente tratamos de uma situação em que o espaço de estratégias dos jogadores é tão rico quanto se queira e em que a presença de interação estratégica tem implicações diretas sobre o comportamento dos agentes econômicos envolvidos na situação. Pelo menos desde David Hume (1739), …lósofos e economistas compreendem que se os cidadãos respondem apenas a incentivos privados, haverá uma subprovisão de bens públicos e os recursos públicos serão sobre-utilizados. Hoje em dia, mesmo uma análise casual do meio-ambiente da terra revela a força dessa idéia. Vamos analisar essa situação através de um exemplo bucólico. Considere uma vila povoada por n > 1 famílias de fazendeiros cuja atividade principal seja a criação de bodes. Em cada verão, todos os fazendeiros levam seus animais para se alimentar em um pasto da vila que pertence a todas as famílias da vila - ou seja, esse pasto é um bem público32 . Denote o número de bodes que o i-ésimo fazendeiro tem por gi , de modo que o número total de bodes da vila é G=

n P

gi = g1 + g2 + ::: + gn

i=1

O custo de comprar e criar um bode é dado por c > 0, independente do número de bodes que o fazendeiro possui. O valor para um fazendeiro de levar um bode para pastar na área pública quando há G bodes pastando é v (G) por bode. Como um bode 32

Relembre a de…nição de bem público em algum manual de micro. Aqui estamos supondo que o pasto é um bem não-excludente e não-rival. Mas... o que isso signi…ca mesmo?

71


precisa de no mínimo de um certo montante de grama para sobreviver, há um número máximo de bodes que pode pastar no gramado, de modo que ( v (G) > 0 para G < Gmax v (G) = 0 para G Gmax Além disso, como os primeiros bodes a pastar encontram grama em abundância, adicionar um animal a mais na área comum implica em um pequeno dano para aqueles que já estão se alimentanto, mas quando muitos bodes já estão pastando (um número tão grande que eles se alimentam apenas para sobreviver), então a adição de um bode a mais no gramado provoca um dano dramático dos demais animais. Formalmente, para G < Gmax v 0 (G) < 0 e v 00 (G) < 0 como na …gura abaixo …gura - aqui Durante a primavera, os fazendeiros escolhem simultaneamente o tamanho de seu rebanho. Assuma que os animais sejam continuamente divisíveis. Uma estratégia para um fazendeiro i 2 n qualquer é a escolha do número de bodes ele levará para pastar no campo da vila, gi 2 [0; Gmax ]. O payo¤ desse fazendeiro quando leva gi bodes para pastar e o número de bodes pastando dos demais fazendeiros é g1 + g2 + ::: + gi 1 + gi+1 + ::: + gn é dado por ui (gi ; g i ) = gi v (G)

cgi

= gi v (g1 + ::: + gi + ::: + gn )

cgi

Logo, se gi ; g i é um equilíbrio de Nash do jogo, então, para cada jogador i 2 n, gi deve maximizar ui (gi ; g i ) dado que os demais fazendeiros escolhem g i . As cpo’s desse problema implicam que @ui (gi ; g i ) = v gi + g @gi

i

+ gi v 0 gi + g

i

c=0

ou ainda, v (G ) + gi v 0 (G )

c=0

condição que é verdade para todo fazendeiro i = 1; 2; :::; n. Somando para esses n fazendeiros, temos nv (G ) + G v 0 (G ) nc = 0 ou melhor, v (G ) +

1 G v 0 (G ) n 72

c=0


onde G =

n P

i=1

gi = g1 + g2 + ::: + gn . Por outro lado, o ótimo social, denotado por G ,

decorre do problema de max Gv (G)

0 G<

cG

tal que as cpo’s nos mostram que @ [Gv (G) @G

cG]

= v (G ) + G v 0 (G )

c=0

Proposição 42 Comparando as duas expressões, podemos mostrar que G > G . Prova. Suponha que não, que G G . Nesse caso, como v 0 < 0, então v (G ) v (G ). Do mesmo modo, como v 00 < 0, então 0 < v 0 (G ) v 0 (G ). Por …m, G n < G . Logo, o lado esquerdo do problema de Nash excede o lado esquerdo do problema social, o que é impossível na medida em que ambos são iguais a zero. O fato de que G > G implica que há muitos bodes pastando no campo público quando comparado com a quantidade que seria desejável do ponto de vista social. As cpo’s do problema de Nash re‡etem os incentivos que têm um fazendeiro que já tem gi bodes pastando mas que está considerando adicionar um animal a mais no pasto (ou, falando corretamente, um fração de um bode). O valor do bode adicional é v gi + g i e seu custo é c. O dano aos fazendeiros cujos bodes que já estão pastando é v 0 gi + g i por bode, ou gi v 0 gi + g i no total. O recurso comum é sobre-utilizado porque cada fazendeiro considera apenas os seus próprios incentivos, não os efeitos de suas ações 0 sobre os demais fazendeiros, como mostra a presença de G vn(G ) no problema de Nash ao invés de G v 0 (G ) do ótimo social.

73


3

Jogos Dinâmicos de Informação Completa

Essa seção inicialmente abordará jogos de informação completa que tenham também informação perfeita. Isto é, quando escolhem suas estratégias, os jogadores sabem qual foi toda a história pregressa do jogo até então, o que não ocorria nos jogos vistos até aqui, onde cada jogador não sabia, não observava, o que demais jogadores tinham feito. De outra forma, antes o jogo ocorria como se fosse simultâneo (estático) - agora iremos trabalhar com jogos em que as escolhas dos jogadores se dão sequencialmente. Esses jogos são ditos jogos dinâmicos. No …nal da seção, analisaremos também situações que sejam parcialmente dinâmicas e parcialmente estáticas. Ou seja, trabalharemos com jogos dinâmicos ditos jogos de informação imperfeita, que são jogos com movimentos sequenciais dos jogadores, mas que não seja necessário que todos os jogadores saibam toda a história pregressa do jogo. O que caracteriza a informação completa é que os payo¤s dos jogadores para cada combinação de movimentos são de conhecimento comum (“common knowledge”). A questão central nos jogos dinâmicos diz respeito à credibilidade das ameaças e promessas dos agentes. Às vezes, por exemplo, pode ser ótimo saber que o outro jogador observa sua atitude antes de tomar suas decisões. Essas questões serão detalhadas durante esta seção e na próxima. Exemplo 43 Sequestro com granada33 . Suponha que um sequestrador possa fazer apenas uma ameaça a seu sequestrado: caso esse último não lhe dê um cheque de R$1.000.000,00 , ele irá explodir uma granada no esconderijo em que estão, que certamente matará ambos. A vítima pode lhe dar o cheque ou não. O que você faria? Supondo que o sequestrador é racional, como usualmente se faz, você não deveria fazer o cheque. É claro que o sequestrador não gostará disso, mas, uma vez que você resolveu não dar o cheque, o melhor que ele pode fazer é não explodir a granada, pois isso pioraria muito o seu bem-estar. Portanto, o equilíbrio (como iremos de…nir abaixo) neste jogo será você não fazer o cheque e o sequestrador, ainda que “malvado”, não explodir a granada. O ponto fundamental é que a ameaça do sequestrador não é crível, pois se ele a cumprir ele se prejudicará mais que se não a cumprisse. O sequestrado, estando ciente disso, não deve deixar se levar por uma ameaça que não será cumprida34 . 33

Baseado em Gibbons (1992). Estamos supondo aqui que o sequestrador é racional (faz o melhor para ele mesmo) e que morrer é a pior coisa que pode ocorrer a ele. Obviamente, se ele aparentar sinais de pouca lucidez ou, mesmo em sã consciência, não estiver aparentando dar muito valor à vida ou pertencer a seitas radicais ou qualquer coisa que o valha, então é claro que será preferível ao sequestrado fazer o cheque, preservando sua própria vida. 34

74


3.1

Forma Extensiva

Nós representamos os jogos até agora apenas pela forma normal (ou estratégica). Veremos, entretanto, que há uma outra forma de representação: a forma extensiva, uma forma mais detalhada do que a forma normal. Segue daí que um jogo na forma extensiva em geral sofre perdas de informação quando o passamos para a forma normal, enquanto o inverso nem sempre é possível de se fazer. Nos jogos estáticos, não há problemas em tratá-lo apenas na forma estratégica, sendo inclusive mais conveniente. Todavia, isso com certeza ocorreria nos jogos dinâmicos. Por isso, os abordaremos utilizando a forma extensiva. Um jogo (de informação completa e perfeita) na forma extensiva nos dá as seguintes informações: quais são os jogadores participantes, quais são as ações possíveis para cada jogador em cada vez em que ele for chamado a decidir, a ordenação do jogo: quem age e quando, toda a história pregressa do jogo quando cada jogador tem de tomar uma decisão, os payo¤s dos jogadores para cada conjunto possível de ações que tenham sido tomadas, até o …nal do jogo. Exemplo 44

Na …gura acima temos a representação de um jogo na forma extensiva. Por convenção (mas, novamente, nem sempre) o jogador 1 (j.1) é o primeiro a jogar. Esse ponto é dito "nó inicial"e é único, no sentido a …car claro ao longo do texto. Esse jogador pode jogar duas estratégias, ou e ou d. Diferentemente de jogos estáticos, agora o jogador 2 observa a escolha de 1 e só então faz a sua escolha. Ele também ou joga e ou joga d. No entanto é fundamental dizer que em jogos dinâmicos a noção de estratégia (e de conjunto de estratégias) de um jogador é mais complexa do que a mesma noção 75


em jogos de escolha simultânea. Aqui uma estratégia deve ser vista como "um plano completo de ação", deve especi…car para o jogador em questão as suas possibilidades de ação contingentes à todas as ações possíveis dos jogadores que jogaram antes35 dele. No jogo acima, por exemplo, o espaço de estratégias do jogador 2 é 8 > (jogar e dado que o jogador 1 jogou e, jogar e dado que o jogador 1 jogou d), > > < (jogar e dado que o jogador 1 jogou e, jogar d dado que o jogador 1 jogou d), S2 = > (jogar d dado que o jogador 1 jogou e, jogar e dado que o jogador 1 jogou d), > > : (jogar d dado que o jogador 1 jogou e, jogar d dado que o jogador 1 jogou d)

Uma vez que os jogadores 1 e 2 …zeram as suas escolhas, o payo¤s são dados pelos números situados após os últimos nós de decisão, ditos nós terminais. Por convenção, o primeiro número se refere ao payo¤ do jogador que jogou primeiro, o segundo número ao payo¤ do jogador que jogou em segundo lugar e assim sucessivamente no caso de jogos com mais de dois jogadores. Logo, lendo o jogo acima na forma extensiva, temos 1. os jogadores: 1 e 2, 2. os espaços de estratégias, S1 = fe; dg e S2 como acima exposto, 3. a ordenação: 1 joga primeiro, 2 observa a escolha de 1 e então faz a sua escolha, 4. a história pregressa do jogo36 : quando 2 é chamado a jogar ele sabe inequivocadamente qual foi a escolha de 1, 5. os payo¤s: os ganhos dos jogadores para toda combinação possível de escolhas dos jogadores. Note então que a representação na forma extensiva apresenta todas as características destacadas acima. Ela possui em geral (mas nem sempre, como veremos em exemplos abaixo) o formato de “árvores crescendo para baixo”. E a título de curiosidade discutiremos isso logo abaixo - o resultado desse jogo será "o jogador 1 jogar d e o jogador 2 jogar e se 1 jogou e, jogar d se 1 jogou jogou d". Os payo¤s serão (4; 1). 35

Como o jogador 1 foi o primeiro a jogar, então o seu conjunto de estratégias é similar àquele que especi…caríamos na forma normal. 36 Uma hipótese que sempre adotaremos é que os jogadores têm “perfect recall”, memória perfeita: eles não esquecem as suas jogadas anteriores e as informações que eles detinham em um determinado ponto do jogo também não são esquecidas posteriormente, ainda que o jogo se prolongue por um número arbitrariamente grande de rodadas. Além disso essa hipótese é de conhecimento comum.

76

9 > > > = > > > ;


Podemos veri…car se no jogo abaixo há memória perfeita dos jogadores envolvidos.

Será explicado mais detalhadamente à frente o signi…cado da linha pontilhada mostrada acima. Em suma, ela signi…ca que o jogador, quando tem que agir, não sabe em qual dos pontos ligados pela linha tracejada ele está. Essa é uma possibilidade que encontraremos em vários jogos a serem vistos adiante. No caso acima, todavia, quando o jogador 1 é chamado a jogar novamente, caso ele possuísse “memória perfeita” não teria dúvidas sobre estar na posição que se segue à estratégia d do jogador 2 ou na posterior à e. Isso porque, dependendo do que ele tiver feito na sua primeira escolha, uma das duas possibilidades não mais será factível ao jogador 2. Portanto, para ter dúvidas entre essas duas possibilidades, o jogador 1 tem de ter se esquecido da sua ação inicial. Possibilidades como essa serão ignoradas nestas notas, uma vez que a hipótese de “perfect recall” será sempre utilizada. Para comentários adicionais a respeito da hipótese, ver Kreps (1990).

3.2

Indução Retroativa: jogos de informação completa e perfeita

Os jogos de informação completa e perfeita podem ser sintetizados da seguinte forma (para o caso de dois jogadores; com mais de dois, não há mudança signi…cativa): 1. o jogador 1 escolhe uma ação entre as suas possibilidades delimitadas pelo conjunto de possibilidades de estratégias, 2. o jogador 2 observa a escolha do jogador 1 e então escolhe uma ação no seu conjunto de estratégias factíveis, que agora depende da ação que o jogador 1 tomou, 3. o jogo termina e os payo¤s cada jogador são determinados em função da sua escolha e também do elemento de interação estratégica, a escolha do outro jogador. Essa de…nição simples segue a apresentação de Gibbons (1992), mas pode ser muito ampliada. Além da possibilidade de existência de mais de dois jogadores, poderia ocorrer que dentro de um mesmo jogo um ou mais jogadores pudessem vir a jogar 77


mais de uma vez. Além de diversas situações mais relevantes, inclusive de natureza econômica, mesmo outras mais simples se adaptariam claramente a esses casos. Pense, por exemplo, na maior parte dos jogos de cartas ou de tabuleiros: em geral, jogam de duas a seis pessoas, uma após a outra, com ações tomadas um grande número de vezes durante o jogo. Normalmente, pelo menos a maioria deles pode ser analisada como jogos dinâmicos de informação perfeita e completa. A forma de se resolver situações dessa natureza é a descrita a seguir. Assim como em jogos estáticos, solucionar jogos dinâmicos é também um exercício de previsão em que o analista busca antever o comportamento dos jogadores envolvidos tendo em mente algumas premissas sobre a postura geral dos jogadores. Mas se antes os jogadores consideravam estratégias que fossem racionalizáveis apenas, agora eles têm de trabalhar com estratégias que sejam sequencialmente racionais. Isto é, aquelas que não envolvam promessas/ameaças não críveis (como a do sequestrador que ameaça explodir a granada e se matar). De…nição 45 Uma estratégia que seja sequencialmente racional deve prescrever formas de agir que sejam racionais em cada ponto de decisão que o jogador possa estar. Ou seja, o jogador não joga apenas estratégias racionalizáveis, ele jogará estratégias racionalizáveis sempre que for chamado a jogar. Ou seja, caso o jogador esteja em determinado ponto na árvore de decisão, ele deve ter estratégias que são ótimas a partir daí, dadas as possíveis estratégias e escolhas futuras dos outros jogadores. Trabalhando inicialmente apenas com o exemplo mais simples de jogos de informação perfeita e completa dado acima (com apenas dois jogadores fazendo uma escolha cada um durante o desenrolar do jogo), o procedimento que adotamos para resolvêlo é dito indução retroativa ("backward induction") e é descrito da seguinte forma. Começamos sempre pelo …nal do jogo, analisando o jogador que joga por último37 , no caso o jogador 2. Esse jogador já observou a escolha do jogador 1 e deve escolher uma estratégia tal que, condicional à escolha de 1, lhe dê o maior payo¤ possível. O jogador 2 faz então a sua escolha. Passamos a seguir para a análise do problema de escolha do jogador 1. O fundamental aqui é entender que, como se trata de um ambiente de informação completa, o jogador 1 também sabe qual será a melhor atitude38 que o jogador 2 pode tomar para cada escolha que ele, jogador 1, venha a fazer. O jogador 1, por isso, não escolherá aleatoriamente sua estratégia …cando, depois, “torcendo” para que o outro jogador faça algo que também seja favorável a ele. Na verdade, no momento 37

Daí o termo "retroativa". Para uma descrição formal do método, veja o apêndice. Dito de outra maneira, o jagador 1 consegue antecipar perfeitamente qual será a reação do jogador 2 para cada ação que ele tomar. Segue daí que o problema de 1 pode ser posto como o problema de tomar uma ação tal que induza o jogador 2 a uma reação que seria ótima do ponto de vista do jogador 1. 38

78


de fazer a opção da melhor estratégia a se tomar ele já considerará que, dependendo do que ele escolher, isso afetará a escolha do jogador 2 e esse pensará apenas no seu próprio bem-estar no momento de de…nir sua estratégia. Procedendo assim, e dado que a forma de resposta do jogador 2 é dada pela sua escolha condicional à decisão de 1, o seu problema é o problema de escolher uma estratégia que lhe dê o maior payo¤ possível dado que o jogador 2 reagirá de forma ótima à sua tomada de decisão. Da solução desse conjunto de tomadas de decisão, do jogador 1 e do jogador 2, teremos um (ou mais) par de estratégias que caracterizará o resultado de indução retroativa desse jogo. Esse resultado elimina qualquer tipo de ameaça ou promessa que não sejam críveis, pois o jogador 1 antecipa o que o jogador 2 fará em cada uma das situações possíveis, buscando o seu próprio bem-estar. Assim, jogador 1 não acredita em eventuais ameaças que possam ser feitas pelo jogador 2 e que incorporem atitudes desse último que não sejam ótimas para ele mesmo, uma vez que o jogador 1 já fez a sua ação. Exemplo 46 Considere o Exemplo 43, no início dessa dessa seção. Por indução retroativa, analisemos incialmente o problema do jogador 2. Se o jogador 1 jogou e, será ótimo para ele jogar e também39 , pois o ganho que ele teria nesse caso seria 4, maior do que 2, o ganho que ele teria se jogasse d. Por outro lado, conjecturando que o jogador 1 jogou d, será ótimo para 2 jogar d também40 , pois o ganho que ele teria seria 1, maior do que 0, o ganho que ele teria se jogasse e. Porém o jogador 1 consegue antecipar os possíveis movimentos do oponente: como se trata de um jogo de informação completa onde a racionalidade sequencial dos jogadores é de conhecimento comum, então ele sabe quais serão as reações de 2 para cada ação que ele tomar. Tendo isso em mente, o melhor que ele pode fazer é jogar d, pois nesse caso 2 jogaria também d e seu ganho seria 4, maior do que o ganho que ele teria se jogasse e, pois nesse caso o jogador 2 também escolheria e e seu ganho seria 1. Logo o resultado do jogo por indução retroativa é "o jogador 1 jogar a estratégia d e o jogador 2 jogar a estratégia jogar d dado que 1 jogou d". O payo¤ s de equilíbrio serão (4; 1). Exemplo 47

39 40

Na verdade seria jogar a estratégia "jogar e dado que o jogador 1 jogou e". Ou mehor, jogar a estratégia "jogar d dado que o jogador 1 jogou d".

79


Qual o resultado de indução retroativa do jogo acima? Vejamos o que o jogador 2 deve fazer em cada uma das situações possíveis: se o jogador 1 joga e, o jogador 2 deve jogar e também e obter payo¤ de 3 unidades (dando 1 para o jogador 1), pois a alternativa seria obter apenas 2 unidades, caso escolhesse d. se o jogador 1 joga d, o jogador 2 deve também jogar d e obter payo¤ de 1 unidade (gerando 2 para o jogador 1), preferível a zero, que é o que seria obtido se nesse caso ele escolhesse e. Como o jogador 1 antecipa isso perfeitamente, ele sabe que as opções efetivamente alcançáveis são apenas (e; e) e (d; d). Diante disso, irá jogar d e assim garantirá utilidade de 2 unidades. O resultado de indução retroativa é, portanto, (d; jogar d dado que 1 jogou d). Note, por outro lado, que esse resultado está longe de constituir algo próximo do que se poderia denominar “socialmente ótimo”, e…ciente ou a…m. Se ele fosse, por exemplo, (e; d), ambos os jogadores estariam melhor. Sendo assim, por que não sugerir um acordo entre os jogadores que possa levar a esse resultado? Porque o jogador 1 sabe que, uma vez que ele cumprisse sua parte no acordo, o jogador 2 não teria incentivos em mantê-lo, pois poderia obter um payo¤ superior. Ciente disso, o jogador 1 não se deixa levar por promessas como essas, por não serem críveis. Da mesma forma, mesmo que o jogador 2 ameace jogar e, caso o jogador 1 jogue d, esse último sabe que tal ameaça também não é crível, e portanto não a aceita. Tudo isso é simples consequência do pleno conhecimento de racionalidade (sequencial) entre os jogadores. Nesse caso, não se requer muito, bastando que ambos os indivíduos sejam racionais e que o jogador 1 saiba que o jogador 2 também o seja. É importante lembrar também que não é necessário que cada jogador jogue apenas uma vez durante o jogo, como já comentamos antes. Cada um deles pode ser chamado a escolher mais de uma vez, sendo que a lógica de resolução não se altera. Sempre se olhará inicialmente para o …m do jogo, destacando as respostas ótimas em cada situação, e se encontrará o resultado de indução retroativa tomando como base tais possibilidades. Exemplo 48 Encontrar o resultado de indução retroativa do jogo da …gura abaixo,

80


conhecido como “mini-centopéia”.

Na forma extensiva, temos: 1. os jogadores: 1 e 2, 2. os espaços ou conjuntos de estratégias, 8 > a, jogar e dado que jogou b e 2 jogou d; > > < a, jogar f dado que jogou b e 2 jogou d; S1 = > b; jogar e dado que jogou b e 2 jogou d; > > : b, jogar f dado que jogou b e 2 jogou d;

9 > > > = > > > ;

S2 = fjogar c dado que 1 jogou b; jogar d dado que 1 jogou bg

3. a ordenação: 1 joga primeiro, 2 observa a escolha de 1 e então joga, 1 oberva a sua própria escolha, a escolha de 2 e então joga novamente e os payo¤ são dados. 4. a história pregressa do jogo: 2, ao jogar, sabe qual foi o movimento de 1. E 1, ao jogar pela segunda vez, sabe qual foi seu movimento inicial e qual foi a escolha de 2. 5. os payo¤s: se 1 joga a o jogo termina no primeiro estágio e os ganhos são (2; 0). Se 1 joga b e o jogador 2 joga c,o jogo termina no segundo estágio e os ganhos são (1; 1). Se 1 joga b e 2 joga d, o jogo vai para o terceiro estágio. Ali, se 1 joga e o jogo termina e os ganhos são (3; 0) e se 1 joga f o jogo também termina e os ganhos são (0; 2). Por indução retroativa, primeiramente vejamos qual seria a opção escolhida pelo jogador 1 (o jogador que joga por último nesse caso) se o jogo alcançar o terceiro estágio. Nessa possibilidade, o melhor para ele será escolher a opção e e obter payo¤ de 3 > 0. Sabendo disso, o jogador 2, caso jogue, preferirá escolher c e terminar o jogo sem que esse alcance o terceiro estágio, pois assim obteria payo¤ de uma unidade, e não de zero 81


- o que ocorreria se o jogador 1 voltasse a jogar. Por sua vez, o jogador 1, ao fazer a sua primeira opção, já sabe dessa estratégia do jogador 2. Para ele é preferível, portanto, terminar o jogo (jogando a) logo na primeira rodada, obtendo payo¤ de 2, e não de 1, que ele teria caso o jogo continuasse - com o jogador 2 …nalizando-o em seguida. Sendo assim, o resultado de indução retroativa é o jogador 1 jogar a na primeira rodada e terminar o jogo. Podemos escrever as estratégias que levam a isso da seguinte forma: jogador 1: joga a na primeira vez que joga e na segunda vez joga e se ele jogou b e 2 jogou d jogador 2: joga c se o jogador 1 jogou b. Em palavras: jogador 1: escolhe a; caso o jogo alcançasse a segunda rodada e o jogador 2 escolhesse d, jogaria e. jogador 2: caso o jogador 1 escolha inicialmente b, utiliza sua opção c. No jogo anterior - assim como em qualquer outro -, perceba que, apesar do jogo terminar no seu primeiro estágio, saber o que ocorreria caso ele continuasse é fundamental para determinarmos o resultado por indução retroativa. Deve-se portanto sempre considerar o que ocorreria caso o jogo continuasse. Eventualmente poderá valer a pena para os jogadores continuar o jogo. No jogo acima, esse não foi o caso, mas essa é apenas uma possibilidade. O fundamental é ver que, mesmo para saber que ele seria terminado na primeira rodada, foi necessário analisar toda a estrutura do jogo. Pense, por outro lado, o que estaria ocorrendo caso o jogador 1 não terminasse o jogo na primeira rodada. A conclusão é que, nesse caso, a racionalidade dos indivíduos não seria de conhecimento comum (“common knowledge”). Poder-se-ia pensar, como uma hipótese, que o jogador 1 não seria racional. Entretanto, poderia ser o caso também de o jogador 1 acreditar que o jogador 2 não fosse racional e esperar que ele não termine o jogo. Assim ele poderia tentar obter payo¤ de 3 unidades, uma vez que o jogo atingisse a terceira rodada. Uma outra possibilidade é o jogador 1 saber que o jogador 2 é racional, ser ele mesmo racional mas achar que o jogador 2 possa não ter tal informação. Assim, ele poderia continuar o jogo esperando que o jogador 2 também o …zesse, na expectativa de incrementar para 2 o seu payo¤ - o que ocorreria caso o jogador 1 jogasse d na terceira rodada. Portanto, não se pode determinar precisamente onde está o desvio de racionalidade. Sabe-se apenas que ele existe, i.e., que a racionalidade não é de pleno conhecimento entre os jogadores. Nesse caso, a indução retroativa perde o seu poder em determinar o resultado do jogo. A idéia, contudo, é trabalhar sempre supondo a existência de “common knowledge” da racionalidade entre os jogadores, de modo a viabilizar as previsões das situações onde exista interdependência estratégica. 82


Uma observação pertinente é notar a fraqueza do conceito de equilíbrio de Nash em jogos dinâmicos. Nesses casos, sua utilização pode levar a resultados que incorporem ameaças/promessas não críveis. É por esse motivo que trabalhamos acima com um conceito diferente para se prever os resultados desses jogos. Equilíbrio de Nash é, de fato, uma forma adequada de se prever os resultados em muitos jogos, mas desde que esses tenham caráter estático. No caso dinâmico, é necessário que se re…ne esse conceito no sentido de se eliminar as possibilidades de que as tais ameaças e promessas enão críveis sejam consideradas - e é exatamente daí que segue a necessidade de representarmos jogos dinâmicos na forma extensiva, pois a forma normal poderia viesar a análise do resultado do jogo. Exemplo 49 Considere o tradicional jogo onde uma …rma está instalada (I) em um mercado enquanto monopolista e uma outra …rma (E) está considerando entrar nesse mercado. Ela escolhe entre entrar ou não. Caso entre, a antiga monopolista escolhe entre lutar (fazer uma guerra de preços, por exemplo) ou acomodar-se (constituir um duopólio, um mercado onde apenas duas …rmas produzem). Vejamos a forma extensiva deste jogo :

Na forma extensiva teríamos 1. os jogadores: as …rmas E e I, 2. os espaços de estratégia, SE = ffora, entrag SI

= fluta se a …rma E entra, acomoda se a …rma E entrag

3. ordenação: a …rma E decide se entra ou não, a …rma I observa a decisão de E e então decide se reage ou se acomoda, 4. a história pregressa: I, ao fazer sua escolha, sabe o que E jogou, 5. os payo¤s. O resultado por indução retroativa (faça) será a a …rma E entrar no mercado e a …rma I acomodar-se. Isto porque, se E entra, o payo¤ de I é maior caso ela acomode. 83


Como E sabe disso, ela irá entrar, apesar de uma eventual ameaça da …rma I de lutar caso ela faça isso. Podemos representar o jogo acima também na forma normal:

…rma E

fora entra

…rma I luta se …rma E entra acomoda se …rma E entra 0; 2 0; 2 3; 1 2; 1

Nota-se, portanto, que há dois equilíbrios de Nash no jogo acima: o resultado por indução retroativa e o conjunto de estratégias onde E não entra e I luta se E entra. A questão central aqui é que essa última ameaça não é crível e portanto não deveria ser considerada. Temos, portanto, que o conceito de equilíbrio de Nash não elimina tais possibilidades, pois ele não incorpora a idéia de que as estratégias devem ser sequencialmente racionais. Apenas um equilíbrio de Nash no jogo acima pode ser obtido via indução retroativa e, portanto, apenas esse equilíbrio é um resultado sequencialmente racional. Um outro resultado muito importante na teoria de jogos dinâmicos é o chamado Teorema de Zermelo. Ele nos diz que todo jogo …nito de informação perfeita possui um equilíbrio de Nash em estratégias puras que pode ser obtido via indução retroativa (e que será, portanto, sequencialmente racional). Além disso, se nenhum jogador possui payo¤s iguais em pontos terminais distintos, então existe apenas um equilíbrio de Nash que pode ser derivado dessa forma. Exemplo 50 Encontre o(s) resultado(s) de indução retroativa do seguinte jogo:

Se o jogador 1 joga à esquerda (e), jogador 2 também o faz. Se o jogador 1 joga à direita (d), o jogador 2 também o faz. Em ambos os casos, o jogador 1 obtém payo¤ de 2 e por isso não prefere estritamente nenhum deles ao outro. Portanto, temos dois resultados de indução retroativa: (e; e) e (d; d). Como o teorema de Zermelo a…rma, a unicidade do resultado de indução retroativa depende da inexistência de payo¤s iguais nos pontos terminais para cada um dos jogadores, o que não é o caso acima. Sendo assim, tornou-se possível encontrar mais de um equilíbrio. Todavia, note que a existência de payo¤s iguais em pontos terminais para algum jogador não implica que o resultado de indução retroativa não será único, e sim que, em princípio, haverá essa possibilidade, que poderá ou não se veri…car dependendo do caso. 84


3.3 3.3.1

Aplicações O modelo de Stackelberg semelhante a Cournot, porém é um jogo dinâmico. tome um modelo onde duas …rmas, 1 e 2, produzem um bem homogêneo cuja demanda é P (Q) = a Q – a > 0 e Q = q1 + q2 é a oferta da indústria. – o custo …xo é nulo é que o custo marginal é constante e idêntico para as empresas, ( C1 (q1 ) = cq1 C2 (q2 ) = cq2 Na forma extensiva temos 1. os jogadores: as …rmas 1 e 2; 2. os espaços de estratégias dos jogadores, S1 e S2 , tais que ( S1 = [0; q 1 ] S2 = f[0; q 2 ] =s1 2 S1 g 3. ordenação: 1 joga, 2 observa e então joga. Vamos chamar 1 de …rma “líder” e 2 de …rma “seguidora”. 4. história: quando 2 escolhe, a escolha de 1 é de conhecimento comum. a função de ganho de cada jogador, u1 e u2 . No caso de …rmas, ( cq1 1 (q1 ; q2 ) = P (Q) q1 (q ; q ) = P (Q) q cq2 2 1 2 2 solução: por IR, o problema da seguidora, 2, é 8 > 2 (q1 ; q2 ) = P (Q) q2 < qmax 2 2S2 = (a Q) q2 cq2 = > : = (a q1 q2 ) q2 cq2 CPO:

@ 2 =a @q2

2q2

q1

a

c 2

q2 (q1 ) = 85

cq2 =

c=0 q1


– função de reação da …rma 2 (sem aspas)! jogo dinâmico. Já o problema da líder é determinar o quanto produzir de forma a induzir na seguidora uma reação que seja ótima sob o seu prisma. Como essa reação é de conhecimento comum, a líder max f

q1 2S1

1 (q1 ; q2 ) =q2 (q1 )g

=

= (P (Q) q1 cq1 ) =q2 (q1 ) = = ((a Q) q1 cq1 ) =q2 (q1 ) = =0 ((a q1 q2 ) q1 cq1 ) =q1 2 (q1 ) = B B = Ba @

=

a c q1 2

CPO:

c q1 C C C q1 2 A {z }

a

q1

|

cq1 =

q2 (q1 )

q1

a c @ 1 = @q1 2 a q1 =

q1 = 0 c 2

– substituindo na reação de 2, q2 (q1 ) =

a

c 4

– o ENPS (e por IR também) é portanto q1 =

a

c 2

; q2 (q1 ) =

a

c 4

a oferta da indústria é Q = q1 + q2 =

1 (a 2

c) +

1 (a 4

c) =

3 (a 4

c)

– e o preço de mercado P (Q) = a

Q=

1 (a + 3c) 4

– tal que o lucro da líder será 1

= P (Q) q1 cq1 = q1 (P (Q) 1 1 = (a c) (a + 3c) c 2 4 1 = (a c)2 8 86

c)


– e o lucro da seguidora 2

= P (Q) q2 cq2 = q2 (P (Q) 1 1 = (a c) (a + 3c) c 4 4 1 (a c)2 = 16

c)

Como esperado a …rma líder leva vantagem sobre a seguidora,

1

>

2.

Stackelberg X Cournot. 1. Qs = 2. ps =

3 4 (a 1 4 (a +

2 3 (a < 13 (a

c) > 3c)

c) = Qc , e portanto + 2c) = pc

3. note que o lucro da líder em Stackelberg é maior do que o lucro dos duopolistas em Cournot mas que esse é maior do que o lucro da seguidora em Stackelberg. – no entanto nada podemos dizer com relação ao bem-estar social: ainda que a soma dos ganhos das …rmas em Cournot seja maior do que em Stackelberg 3 2 16 < 9 , o fato de o preço do bem ser menor em Stackelberg faz com que o excedente do consumidor seja maior nesse caso. 3.3.2

Barganha sequencial

Barganha é algum tipo de situação que encontramos corriqueiramente no dia-a-dia. Observamos desde situações muito simples, quando um …lho adolescente barganha com o pai o horário que ele pode chegar em casa nas noites de sexta-feira e sábado, em que ele propõe chegar mais tarde em troca de algum tempo a mais de estudo diário, até situações complexas, em que presidiários barganham com os representantes do Estado o …m de uma rebelião, ou países que barganham tarifas comerciais sobre o conjunto de produtos que eles comercializam. Na verdade, exemplos de situações de barganha são extremamente fáceis de encontrar e nós de fato nos deparamos com tais situações em todos os momentos - ainda que não tenhamos em mente que tal caso especí…co possa ser analisado teoricamente como um jogo dinâmico de informação completa. O processo de barganha é geralmente interpretado como o processo de construção de um acordo mútuo sobre a provisão de um contrato. No mundo real, o protótipo básico é a negociação entre um vendedor e um comprador sobre um bem em troca de dinheiro: o contrato especi…ca o preço a ser pago pelo ítem. Em uma negociação salarial, por exemplo, o sindicato é o vendedor, a …rma o comprador e o preço é o salário-base.

87


Tanto em contextos econômicos quanto legais, um acordo pode ser retardado na medida em que as partes prolonguem a negociação. Eventualmente pode acontecer de as partes interessadas nunca chegarem a um acordo. Via de regra esse atraso implica em algum tipo de custo às partes interessadas: um custo de oportunidade da negociação, ou seja, dos ganhos que cada parte poderia estar obtendo se o acordo já tivesse sido fechado, e um custo pecuniário inerentes à negociação, como por exemplo custos processuais. Esses custos de oportunidade podem ser representados pela produção que não se realizou e os custos pecuniários pelos gastos com a intermediação do acordo. Tais custos podem ser signi…cativos em casos importantes, como aquisições corporativas, greves patrocinadas por sindicatos de trabalhadores e em diversos litígios civis. Se não se chega a um acordo, então em algum período de tempo as partes param de barganhar, como no caso em que comprador e vendedor buscam parceiros alternativos para fazer seus negócios. Nesse caso, se pensarmos no contexto legal, uma corte impõe alguma regra que as partes devem seguir. Nesse sentido, essas cortes legais são um exemplo de resolução judicial de impasses. No que se segue vamos analisar o modelo teórico de barganha tendo como pano de fundo um processo de negociação entre um sindicato de trabalhadores e uma entidade patronal, representante das empresas na quais esses trabalhadores são funcionários. Não custa uma palavra de precaução aqui: como em todo modelo teórico, essa representação é uma simpli…cação das negociações que de fato ocorrem no mundo real e nesse sentido não buscamos generalizar os resultados que obtivermos para enriquecer a nossa compreensão de negociações como um todo, mas tão somente entender esses processos de negociações como jogos dinâmicos de informação completa4142 . O jogo se dá como se segue. Há, dois jogadores, 1 e 2, onde vamos considerar que 1 representa uma associação patronal e que 2 representa um sindicato de trabalhadores. Eles estão negociar sobre a divisão dos benefícios da produção de um determinado período, um ano por exemplo. Esse benefício é de conhecimento comum e, obviamente, sua totalidade soma 100%. A negociação se dá entre as partes de forma a decidir o 41

Existe uma literatura consolidada de barganha em ambientes de informação incompleta. De…nitivamente essa literatura foge do escopo deste curso. O aluno curioso e interessado pode achar em Rubinstein (19??) uma exposição do tema, mas não há nenhuma exposição do assunto que não demande um conhecimento mais pormenorizado tanto de teoria dos jogos quanto da parte formal. 42 Como dito acima, uma transação, contrato ou disputa legal qualquer requer algum tipo de barganha entre as partes, seja sobre o preço seja sobre outros aspectos do acordo. Via de regra esse processo parece ser ine…ciente em função de atrasos (por exemplo uma greve que prejudica tanto os salários dos trabalhadores quanto a produção da …rma) e de gastos diretos que poderiam ter sido evitados concluindo um acordo similar antes. Os estudos do papel de informação privada (jogos de informação incompleta) em negociações indicam, entretanto, que esses custos são consequências dos incentivos das partes em se comportarem estrategicamente e da necessidade de comunicação para estabelecer uma base comum de forma a montar o acordo.

88


percentual que cada um dos interessados tem direito sobre essa totalidade43 . Ambas as associações desejam obter o máximo possível para os seus associados e a dinâmica da negociação se dá do seguinte modo: 1. a associação patronal propõe uma divisão; 2. o sindicato pode aceitar ou rejeitar a proposta: se o sindicato aceita, o jogo termina e cada jogador obtém o acordado. Caso contrário, ele não aceita, o jogo continua; 3. o sindicato propõe uma divisão; 4. a associação patronal pode aceitar ou rejeitar a proposta: se aceita o jogo termina e cada parte recebe o combinado. Se rejeita a proposta, então a Justiça do Trabalho impõem uma divisão de 50% para cada uma das partes e o jogo também termina. É necessário algum tempo para preparar cada proposta e contraproposta. Por isso, se o acordo for fechado em 2, então os jogadores têm 1 (100%) para repartir. Se terminar com a associação patronal aceitando a proposta no quaem 4, os benefícios serão apenas de 2 (0; 1); e se a barganha terminar com a intervenção da Justiça, então os benefícios são apenas de 2 . Esse termo é dito taxa de desconto intertemporal e re‡ete o fato de que as pessoas (e instituições) avaliam de maneira distinta uma mesma quantia monetária em diferentes períodos de tempo, captando portanto o custo de oportunidade acima discutido. Ou seja, re‡ete o custo de oportunidade de não receber o valor imediatamente. Em geral essa taxa de desconto é determinada pela taxa de juros da seguinte forma, 1 = 1+r onde r é a taxa de juros de mercado. Observe que quanto maior r, menor a taxa de desconto, de forma que os agentes estariam descontando com peso maior o tempo. Observe ainda que essa taxa pode re‡etir caracterísitcas especí…cas das partes engajadas na barganha. Imagine por exemplo o custo de uma greve seja maior para uma das partes. Ou que um trabalhador especí…co assumiu compromissos tais com sua renda 43

Pense por exemplo que a divisão desses benefícios se dá através de uma campanha salarial. Ou mais ainda, não só uma campanha salarial onde os trabalhadores gostariam de ver incorporados nas suas remunerações os benefícios da produção, mas também a inclusão de diversos outros ítens que indiretamente afetam essa remuneração, como por exemplo assistência médico-odontológica para cada trabalhador e sua família, a criação de uma creche na empresa para atender pais e mães com …lhos pequenos, a melhoria no refeitório da …rma, questões de transporte dos funcionários etc. Para quem acha que essas nunaces são por demais abrangentes, considere que é comum uma pauta de negociação com mais de 100 ítens em alguns setores maiores e mais organizados, como metalúrgicos no ABC ou sindicatos de bancários.

89


que uma paralisação no seu ‡uxo de renda nesse período especí…co pode lhe ser particularmente custosa44 . Para facilitar a nossa análise e sem perda de generalidade, vamos considerar que ambas as partes têm a mesma taxa de desconto. Na forma extensiva o jogo é representado como especi…cado pela árvore abaixo …gura: o jogo na forma extensiva Logo há dois jogadores (1 e 2), as estratégias são as descritas na árvore, assim como a ordenação e os payo¤s. Como trata-se de um ambiente de memória perfeita, os movimentos dos jogadores em cada nó de decisão é de conhecimento comum em cada um desses nós. Sendo mais especí…co, observe o que acontece no primeiro movimento: o jogador 1 diz ao jogador 2 que do total que eles estão barganhando, ele quer x 2 [0; 1], ou x%, de forma que ele está oferecendo a 2 (1 x) %. Como dito, 2 pode ou não aceitar. Se aceita a barganha termina e os ganhos são dados. Caso contrário 2 faz a contraproposta ao jogador 1: do total a ser dividido, ele que (1 y) %, de modo que oferece a 1 y%. Da mesma forma o jogador 1 pode aceitar ou rejeitar. Se 1 aceita o jogo termina e os ganhos são dados. Note porém que agora já estamos no segundo estágio do jogo, de forma que as partes já incorreram em algum custo decorrente do fato de que elas não chegaram a um acordo no primeiro período. De Pede-se: 1. Taxa de desconto intertemporal (já está feita em jogos repetidos, mas ter em mente a questão da in‡ação, taxa de juros, reputação e o exemplo do sorvete derretendo). 2. Represente o jogo na sua forma extensiva. Os payo¤s são (x; 1 x) no primeiro estágio, ( y; (1 y)) no segundo estágio e 2 2 caso seja necessária a intervenção da Justiça do Trabalho. 2; 2 2. Quanto cada jogador vai obter em equilíbrio perfeito. 44

O exemplo clássico que ilustra a taxa de desconto é dado pelo caso em que dois irmãos ganham da mãe um pote de sorvete. Eles barganham sobre quanto cada parte tem direito sobre o total (100%) do produto. Se eles discutem e não chegam a um acordo em um determinado tempo, então o sorvete derrete um pouco e o montante que eles têm para dividir passa a ser menor do que o inicial. No …nal, se eles não chegam ao acordo, então a mão intercede e decide ela mesma o quanto cada um tem direito (pode mesmo ser “perdi a paciência!!! Ninguém vai ganhar sorvete hoje!”).

90


Por indução retroativa, no segundo (e último) estágio da barganha, o sindicato oferece (y) aos empresários, que aceitam se e somente se 2

y

2

Logo a proposta será y=

2 2

2

e os ganhos nesse estágio seriam Up = y = 2 e Ut = (1 y) = 2 . No primeiro estágio do jogo os empresários ofertam (1 x) aos trabalhadores que aceitam se e somente se 2

1

x

1

x=

2

de modo que a oferta ótima será 2

2

2

2

e os ganhos seriam Up = x = 1 + 2 e Ut = 1 x = 2 . Logo o equilíbrio de Nash perfeito em subjogos (o que nesse jogo equivale ao resultado por indução 2 retroativa) será a associação patronal ofertar (1 x) = 2 aos trabalhadores no primeiro estágio, os trabalhadores aceitarem a proposta feita, o jogo terminar 2 2 e os ganhos serão dados por Up = 1 + 2 e Ut = 2. 3. Se você representasse os trabalhadores, você preferiria fazer a proposta em primeiro lugar ou ouvir primeiro a oferta dos empresários? A primeira coisa a ser feita é representar o jogo na forma extensiva supondo que o sindicato de trabalhadores faça a oferta em primeiro lugar, no primeiro estágio. Nesse caso os payo¤s seriam (1 x; x) no primeiro estágio, ( (1 y) ; y) 2 2 no segundo estágio e 2 ; 2 caso fosse necessária a intervenção da Justiça do Trabalho. Resolvemos o jogo da mesma maneira, de modo que no segundo estágio da barganha, os empresários oferecem (1 y) aos trabalhadores, que aceitam se e somente se 2

(1

y)

1

y=

2

Logo a proposta será 2 2

2

e os ganhos nesse estágio seriam Up = y = (1 y) = 2 . 2 e Ut = No primeiro estágio do jogo os trabalhadores ofertam x aos empresários. Estes aceitam se e somente se 2

x

2 91


de modo que a oferta ótima será 2

x=

2

2

2

e os ganhos seriam Up = x = x= 1 + 2 . Segue que o 2 e Ut = 1 equilíbrio de Nash perfeito em subjogos será o sindicato dos trabalhadores ofertar 2 x= 2 aos patrões no primeiro estágio, os empresários aceitarem essa proposta 2 2 e o jogo terminar ali. Os ganhos seriam dados por Up = + 2. 2 e Ut = 1 Note que os trabalhadores estarão melhor fazendo a oferta no primeiro estágio se 1

+

2

2

2

2

ou seja, se 2

o que é sempre verdade para todo

3.4

2 +1

0

2 [0; 1].

Equilíbrio Perfeito em Subjogos

Até agora estudamos separadamente jogos dinâmicos e jogos estáticos. Entretanto, é bastante usual trabalharmos com jogos que tenham partes simultâneas e outras não simultâneas, i.e., que tenham informação imperfeita em pelo menos algum de seus estágios. A forma de resolução segue a mesma lógica anterior: começar de trás para diante até chegarmos no início do jogo. Entretanto, sempre quando nos depararmos com um “mini-jogo” com lances simultâneos (ou, no mesmo sentido, que tenha informação imperfeita), devemos resolvê-lo como visto na seção anterior e então tomarmos seu resultado (o equilíbrio de Nash encontrado) como os payo¤s a serem distribuídos caso o jogo atinja essa parte simultânea. Um exemplo facilitará a compreensão. Exemplo 51 Considere o jogo visto acima onde uma …rma cogita em entrar no mercado onde há uma outra que é monopolista. Façamos, no entanto, uma modi…cação: a …rma que pensa em entrar (E) tem agora a opção de, caso entre, lutar ou acomodar-se após a entrada. A representação na forma extensiva …caria assim:

92


O signi…cado da linha tracejada entre dois pontos de decisão signi…ca que essa parte do jogo é simultânea, i.e., quando o segundo joga ele não sabe o que o primeiro fez. Note que, sendo assim, não faz diferença se, nessa parte do jogo, trocássemos a ordem dos jogadores na árvore de decisão. De qualquer forma, nenhum dos dois sabe o que o outro está fazendo nesse instante. Antes de analisar o jogo com informação imperfeita, vamos ignorar a linha tracejada e analisar o jogo no caso em que não uma parte dele que seja simultânea. Tomando o jogo na forma extensiva, observe que o espaço de estratégias dos jogadores (entendido, como sempre, como um plano completo de ação) será SE = f(F; l) ; (F; a) ; (E; l) ; (E; a)g ( ) (l se el e l se ea) ; (l se el e a se ea) ; SI = (a se el e l se ea) ; (a se el e a se ea) onde, por exemplo, (F; a) para o entrante signi…ca que ele joga “fora, acomodar se ele entra” e (a se el e l se ea) para o incumbente signi…ca que ele “acomoda se o entrante entra e luta e luta se o entrante entra e acomoda”. Podemos representar o jogo 4 4 na forma normal e veri…car o(s) equilíbrio(s) de Nash - faça isso como exercício. Por indução retroativa, veri…que que o resultado será f(E; a) ; (l se el e a se ea)g Vamos incorporar informação imperfeita (considerar a linha tracejada) e ver o que muda. Tomando o espaço de estratégias dos jogadores como um plano de ação para cada contigência do jogo, o fato de o jogador E não mais observar qual foi o segundo movimento de I (o primeiro movimento ele sabe, pois se ele não joga pode concluir que I jogou “fora”no primeiro estágio e se ele é chamado a jogar infere que I jogou “entra” - e isso é de conhecimento comum) altera o seu espaço de estratégias, que passa a ser apenas SI = fl se E entra; a se E entrag O procedimento para solucionar esse jogo será resolver primeiro o chamado subjogo (a ser de…nido abaixo) simultâneo, pois ele é a parte …nal do jogo como um todo. Para tanto, podemos representá-lo na forma normal, como usualmente se faz com os jogos estáticos. …rma I acomoda luta …rma E acomoda 3; 1 2; 1 luta 1; 2 3; 1 O equilíbrio de Nash do jogo acima é, portanto, ambos acomodarem. Sabendo disso, podemos substituir na árvore do jogo original o jogo simultâneo acima pelo resultado do seu equilíbrio de Nash. 93


No jogo reduzido acima, apenas a …rma E escolhe. Ela preferirá claramente entrar e obter payo¤ de 3 unidades, ao invés de zero, que obteria caso não entrasse. Isto porque ela acredita que, entrando, o resultado do jogo simultâneo será o seu equilíbrio de Nash, onde ambas as …rmas resolvem se acomodar. O resultado será f(E; a) ; (a se E entra)g Observe a diferença com indução retroativa nesse caso: as payo¤s serão os mesmos e o jogo no …m seguirá na mesma direção nos dois casos (nem sempre isso será verdade, nesse exemplo foi). Porém observe a diferença nas estratégias dos jogadores dada pela presença ou não de informação imperfeita, de uma parte do jogo que se assemelha a um jogo simultâneo. Podemos também representar todo o jogo inicial na forma normal, especi…cando cada estratégia (de…nida, como visto na seção II, como um plano completo de ações45 ) possível para os jogadores.

…rma E

fora, acomoda se entra fora, luta se entra entra, acomoda se entra entra, luta se entra

…rma I acomoda se E entra luta se E entra 0; 2 0; 2 0; 2 0; 2 3; 1 2; 1 1; 2 2; 1

Podemos notar que existem três equilíbrios de Nash no jogo acima. Um deles é o resultado que havia sido encontrado via indução retroativa tomando o equilíbrio de Nash da parte simultânea do jogo como dado. Os outros dois, embora constituam equilíbrio de Nash, não são sequencialmente racionais. O problema deles é admitir que a …rma E considere a ameaça da …rma I de lutar caso ela entre. Tal ameaça, no 45

Nos jogos simultâneos, a percepção do que é uma estratégia é extremamente simples, constituindose simplesmente em uma ação possível a um determinado jogador. Nos jogos sequenciais, essa de…nição é bem mais sutil. Nesse tipo de jogo, uma estratégia tem que de…nir qual seria a escolha do jogador em cada uma das possibilidades que ele pudesse vir a ser chamado a jogar. Isso signi…ca que, mesmo que, quando o jogo vier a ser efetivamente jogado, o jogador não tenha que fazer uma escolha em um ponto especí…co dele, porque esse não ter sido alcançado, uma estratégia terá que de…nir o que ele faria caso fosse necessário escolher naquela circunstância. A idéia é que, se o jogador especi…casse uma estratégia e a dissesse a um procurador, esse saberia o que fazer em qualquer hipótese que porventura viesse a se veri…car quando o jogo fosse efetivamente jogado.

94


entanto, não é crível: uma vez que a …rma E resolveu entrar e o fez, é pouco razoável que a …rma I lute, pois essa estratégia não compõe nenhum equilíbrio de Nash no jogo simultâneo que se inicia após a entrada de E. Con…rma-se então, novamente, a fragilidade do conceito de equilíbrio de Nash quando trabalhamos com jogos dinâmicos. O conceito que utilizaremos para resolver jogos dinâmicos que tenham informação imperfeita é um re…namento de equilíbrio de Nash, chamado Equilíbrio de Nash Perfeito em Subjogos (ENPS). O resultado encontrado no exemplo anterior (onde a …rma E entra no mercado e, em seguida, ambas acomodam) é um caso de um resultado caracterizado por um Equilíbrio de Nash Perfeito em Subjogos. Entretanto, para de…nir o conceito mais precisamente, é necessário de…nir previamente a noção do que vem a ser um subjogo. De…nição 52 Um subjogo de um jogo J na forma extensiva é um subconjunto do jogo que tem as seguintes propriedades: inicia-se em um ponto de decisão único (não ligado a nenhum outro por “linhas tracejadas”) contém todos os pontos de decisão que o sucedem, e apenas esses pontos; não divide nenhum subjogo, no sentido de que se um determinado ponto de decisão pertence a um subjogo, então todo ponto ligado a ele por alguma “linha tracejada” também pertence, i.e., os subjogos não cortam tais linhas46 . Exemplo 53 No exemplo anterior, há dois subjogos: um que se inicia após a …rma E resolver entrar até o …m do jogo e outro que é o próprio jogo. Exemplo 54 Em jogos de informação perfeita, todos os pontos de decisão iniciam subjogos. Portanto, nesse tipo de jogo, haverá tantos subjogos quantos forem os pontos de decisão. De…nição 55 (Selten, 1965) Um conjunto de estratégias ' = ('1 ; :::; 'I ) em um jogo J dinâmico com I jogadores é um Equilíbrio de Nash Perfeito em Subjogos (ENPS) se ele induz a um equilíbrio de Nash em cada um dos subjogos de J. Em outras palavras, as estratégias serão um ENPS se de…nirem um equilíbrio de Nash em todos os subjogos do jogo. Note que todo ENPS é um equilíbrio de Nash (uma vez que o jogo como um todo também é um subjogo, como se depreende da de…nição de subjogo), mas nem todo 46

Denomina-se “conjunto de informação” todos os pontos de decisão únicos e todos os conjuntos de pontos de decisão que não sejam únicos, e sim ligados por uma “linha tracejada”. Pode-se dizer, portanto, que um subjogo não divide nenhum conjunto de informação.

95


equilíbrio de Nash é perfeito em subjogo. Esse último não permite que os jogadores considerem ameaças não críveis, como o equilíbrio de Nash permite. Por exemplo, o primeiro resultado que encontramos no jogo do exemplo 1 desta seção consatitui um ENPS, mas não os outros dois EN encontrados. Em jogos com informação perfeita, o resultado de indução retroativa coincide com o conjunto de estratégias que constituem ENPS. Como consequência imediata do teorema de Zermelo, temos que todo jogo …nito de informação perfeita possui um ENPS em estratégia puras. Além disso, se nenhum jogador tem os mesmos payo¤s em dois dos postos terminais dos jogos, pode-se garantir também que existe um ENPS que é único. Exemplo 56 Encontre o ENPS do jogo abaixo:

Antes de mais nada é importante identi…car o espaço de estratégias dos jogadores, S1 = f(e1 ; e4 ) ; (e1 ; d4 ) ; (d1 ; e4 ) ; (d1 ; d4 )g

S2 = f(e3 ; e2 ) ; (e3 ; d2 ) ; (d3 ; e2 ) ; (d3 ; d2 )g

onde, por exemplo, para o jogador 1 a estratégia (e1 ; d4 ) signi…ca “jogar e1 , jogar d4 se 1 jogou d1 e 2 jogou e2 ou d2 ”e para o jogador 2 a estratégia (e3 ; d2 ) signi…ca “jogar e3 se 1 jogou e1 e jogar d2 se 1 jogou d1 ”. Em seguida identi…camos os subjogos do jogo. Nesse jogo acima há três, identi…que-os. Feito isso, resolvemos o subjogo com informação imperfeita:

jogador 1

d4 e4

jogador 2 e2 d2 2; 2 0; 0 1; 4 3; 1

onde, observe, o (único) equilíbrio de Nash no subjogo acima é (d4 ; e2 ). Substituindo o subjogo pelos payo¤s associados ao seu equilíbrio de Nash na árvore original, o jogo

96


se reduz a

Podemos agora resolver o subjogo em que o jogador 2 começa jogando: uma vez alcançado aquele ponto de decisão, o jogador 2 escolherá d3 , que lhe dará utilidade de 3 (>1). Substituindo esse resultado no jogo, teremos a árvore reduzida abaixo, onde apenas o jogador 1 tem de escolher:

Obviamente, o jogador 1 escolherá d1 . O resultado previsto do jogo é, portanto, (d1 ; d4 ; e2 ). O ENPS que o caracteriza, por sua vez, é um pouco mais detalhado, sendo composto pelas estratégias: jogador 1: (d1 ; d4 ), “jogar d1 , jogar d4 se 1 jogou d1 e 2 jogou e2 ou d2 ” jogador 2: (d3 ; e2 ), “joga d3 se 1 jogou e1 e jogar e2 se 1 jogou d1 ”. Simpli…cadamente, escreveremos ENPS = f(d1 ; d4 ) ; (d3 ; e2 )g . O exemplo acima, como visto, possui apenas um ENPS. Seria possível a existência de mais de um ENPS em um jogo? Sem dúvida, e voltaríamos então para o problema de multiplicidade de equilíbrios, di…cultando também aqui previsões mais precisas acerca dos possíveis resultados. A discussão anterior sobre múltiplos equilíbrios de Nash aplicaria-se portanto também aqui. Exemplo 57 Encontrar o(s) ENPS no jogo abaixo:

97


Inicialmente, iden…quemos as estratégias dos jogadores, ( ) (a; h) ; (a; i) ; (a; j) ; S1 = (b; h) ; (b; i) ; (b; j) ( ) (c; e) ; (c; f ) ; (c; g) ; S2 = (d; e) ; (d; f ) ; (d; g) onde, por exemplo, para o jogador 1 a estratégia (b; i) signi…ca “jogar b e jogar i se 1 jogou b e 2 jogou e; f ou g” e para o jogador a estratégia (c; f ) signi…ca “jogar c se 1 jogou a e jogar f se 1 jogou b”. Novamente há três subjogos no jogo e você deve ser capaz de identi…cá-los. Vamos agora solucionar o subjogo que se inicia no nó de decisão de 2 condicional ao jogador 1 ter adotado a ação “b”. Teremos o seguinte subjogo simultâneo:

jogador 1

h i j

e 1; 1 2; 0 3; 4

jogador 2 f 3; 0 5; 2 0; 0

g 4; 0 0; 1 1; 0

Neste subjogo há dois equilíbrios de Nash. Para encontrar-se o(s) ENPS, o procedimento é o mesmo de antes, com a diferença de que se deve fazê-lo utilizando os dois equilíbrios de Nash encontrados no subjogo. Substituindo inicialmente o resultado (j; e), a decisão inicial do jogador 1 será entre escolher a e obter payo¤ de 4 unidades (pois nesse caso o jogador.2 irá preferir d) e optar por b e alcançar apenas 3, …cando, logicamente, com a primeira opção. Por outro lado, substituindo o equilíbrios de Nash (i; f ) na árvore de decisão, o jogador 1 preferirá optar por b em sua primeira escolha, pois nesse caso obterá payo¤ de 5 unidades. Os ENPS do jogo são, portanto, dois, assim de…nidos: ENPS 1: – jogador 1 escolhe a; se optasse por b, jogaria posteriormente j; – jogador 2 escolhe d se o jogador 1 jogou a; e opta por e se o jogador 1 jogou b. ENPS 2: – jogador 1 escolhe b; em seguida, joga i; – jogador 2 escolhe d se o jogador 1 jogou a; e opta por f se o jogador 1 jogou b. 98


Exemplo 58 O jogo da “centopéia”. Este conhecido jogo, popularizado por Rosenthal (1981), é representado na Figura 13 abaixo, onde cada vez que um jogador tem a vez de jogar, ele tem a opção de parar o jogo ou continuá-lo, passando a vez ao outro jogador. Os payo¤ s, no entanto, têm uma lógica especial: em cada estágio, sempre que um jogador resolve não terminar o jogo, no ponto terminal seguinte (que seria alcançado se o outro jogador terminasse o jogo logo em seguida) ele terá uma unidade a menos, enquanto o outro jogador obterá duas unidades de payo¤ s a mais.

O resultado do jogo acima, como de praxe, deve começar a ser pesquisado analisandose o seu …nal. Caso se alcance a última rodada, o jogador 2 preferirá jogar para baixo e obter payo¤ de 101 (>100). Sabendo disso, o jogador 1 prefere terminar o jogo antes de o jogador 2 fazer sua última jogada, pois assim ele ganharia 99 (>98). Mas o jogador 2 , sabendo disso, preferiria terminar o jogo uma rodada antes para obter 100 (>99). E assim sucessivamente, até se chegar no início do jogo, onde o jogador 1 o termina sem dar chances do jogador 2 jogar. Cada um deles ganha, portanto, uma unidade de payo¤. Tal resultado parece paradoxal, mas é apenas consequência do “common knowledge” da racionalidade sequencial dos jogadores. Pense o que ocorreria se o jogador 1 não terminasse a partida na primeira rodada. Talvez ele não fosse racional, ou achasse que o outro jogador não fosse racional, ou que o jogador 2 não soubesse que ele era racional e quisesse “…ngir” que era irracional, ou ainda outras possibilidades. Nesse caso não haveria “common knowledge” da racionalidade dos jogadores e o jogo poderia se prolongar por mais algum tempo. Não poderíamos, no entanto, determinar até quando isso iria ocorrer. Sendo jogado algumas vezes com alunos do curso de Teoria dos Jogos da PUC-MG (com uma versão simpli…cada da “centopéia”, correspondente a 90% inferior ao jogo mostrado acima), em nenhuma delas o jogo terminou na primeira rodada. Isso ocorria apenas quando se estava faltando duas ou três rodadas para que o jogo terminasse de qualquer forma (no …m da centopéia). Tais resultados indicam que nesse caso a hipótese de pleno conhecimento da racionalidade pode ser forte demais. O que veri…camos nas experiências em sala de aula foi que, na verdade, apenas após várias escolhas fazendo o jogo continuar, vendo esse caminhar para o seu …nal automático (a última rodada possível), é que os jogadores envolvidos paravam realmente para pensar no melhor a se fazer. Isso leva a uma outra possibilidade de explicação: como os payo¤s eram apenas imaginários e os alunos, com pouco tempo para se decidirem sobre o que fazer, encaravam a experiência como uma brincadeira, não faziam grandes esforços para pensar na sua melhor etratégia, pelo menos no início do jogo, quando esse se apresentava 99


relativamente ainda muito complexo. Eventualmente, com payo¤s reais e signi…cativos para os jogadores, e com um tempo superior para a análise do jogo, poderia ser que o resultado fosse de fato o de indução retroativa (que também é ENPS). Outra forma de explicação para o resultado improvável de indução retroativa no jogo da centopéia é que a exigência de “racionalidade” é exagerada. O problema é que as iterações necessárias do tipo “todos são racionais; todos sabem que todos são racionais; todos sabem que todos sabem que todos são racionais etc.” para se chegar ao resultado de indução retroativa nesse caso são muito numerosas. Quando se exigem apenas duas ou três, nenhuma contestação é feita ao mecanismo e o resultado previsto parece con…ável. Entretanto, quando esse número cresce, a credibilidade das previsões derivadas desse método se reduz. No jogo da centopéia, exige-se 200 iterações! Uma alternativa é tentar modelar a “irracionalidade” emergente em casos como esses. Não é nosso objetivo entrar nessa discussão, mas apenas introduzir a questão e alertar para as de…ciências da teoria. No entanto, o leitor interessado pode consultar Kreps (1990) para avançar no tema. Além disso, hoje estuda-se uma outra linha de pesquisa chamada de “racionalidade limitada”, que também procura dar respostas a questões como essas. Ou seja, jogos onde as previsões dadas pela teoria dos jogos convencional são “pouco razoáveis”, não sendo assim muito úteis. Uma das idéias básicas da “racionalidade limitada” é que os agentes aprendem com o tempo. Além disso, ela tenta explicar as falhas da teoria convencional em jogos que sejam muito complexos para os jogadores resolverem utilizando os conceitos de equilíbrio usuais. Um exemplo claro é o jogo de xadrez: é um jogo de informação completa e perfeita; entretanto, nem mesmo o melhor computador da IBM, o Deep Blue, construído essencialmente para jogar xadrez, obteve êxito de decifrar todas as possibilidades do jogo - uma vez que perdeu uma partida para o campeão Gary Kasparov. Os novos desenvolvimentos que incorporam a idéia de “racionalidade limitada”, contudo, ainda não se consolidaram e também ultrapassam o escopo dessas notas. Para uma didática introdução ao tema, ver Kreps (1994). Exemplo 59 Pode ocorrer também que em um determinado jogo não exista nenhum ENPS. Esse é o caso deste jogo, baseado em Kreps (1994). No primeiro estágio, dois jogadores escolhem, simultaneamente, entre duas opções, X e Y. Caso ambos escolham Y, cada um recebe $5. Se um escolher Y e o outro X, ninguém recebe nada. Se ambos escolherem X, passa-se ao segundo estágio, onde eles, também simultaneamente, escolhem um número inteiro qualquer. O que escolher o maior, recebe o correspondente em unidades monetárias, enquanto o outro …ca com metade daquele valor. O subjogo …nal, similar a outro já apresentado na seção anterior, não possui nenhum equilíbrio de Nash. Sendo assim, não pode existir um resultado que induza a um equilíbrio de Nash em todos os subjogos, constituindo um ENPS. O que há nesse 100


jogo é um equilíbrio de Nash, no jogo como um todo. Esse corresponde a ambos os jogadores escolherem inicialmente a opção Y. Nenhum teria, pois, incentivo a desviar. Obviamente, o conceito de equilíbrio de Nash em jogos sequenciais é falho, por motivos já comentados. Nesse caso, mais uma vez, ele terá muito pouca relação com a realidade, uma vez que é muito pouco provável que algum jogador escolha inicialmente Y. Note que o teorema de Zermelo não se aplica aqui, uma vez que o jogo não é de informação perfeita. Por isso foi possível a não existência de um ENPS.

4

Jogos Repetidos

Nesse tópico analisaremos novamente se ameaças e promessas em relação ao futuro podem in‡uenciar o comportamento atual dos agentes. Ao fazer isso, buscamos mostrar o que muda em uma análise de previsão do resultado de jogos quando esses são jogados mais de uma vez. Uma das principais idéias é a de cooperação: será possível obtê-la caso o jogo se repita? Intuitivamente, poderíamos pensar que sim, pois um jogador poderia cooperar “hoje” para que os outros cooprerem com ele “amanhã”, e isso poderia valer para todos os envolvidos. Deve-se, portanto, veri…car quando e sob que condições essa intuição de fato poderá se manifestar na realidade. Os jogos repetidos são divididos em dois grupos: aqueles repetidos um número …nito de vezes e aqueles repetidos “in…nitamente”. Em relação ao primeiro grupo, a intuição fundamental pode ser apreendida apenas analisando-se o caso de jogos repetidos duas vezes, o que iremos fazer a seguir. Aqueles repetidos in…nitamente exigem alguns conceitos adicionais, apresentados na seção dois.

4.1

Jogos repetidos …nitos

A característica fundamental dos jogos repetidos …nitos é que todos os jogadores envolvidos sabem, antecipadamente, quantas vezes aquele jogo se repetirá. Pense, por exemplo, em um Congresso X de três dias que ocorrerá em um determinado hotel. Existindo dois vendedores de pipoca naquela região, eles sabem que esse jogo (o mercado que vende pipocas na porta do hotel naqueles dias com demanda especialmente ampliada) durará exatamente três dias, e com base nessa informação é que de…nem suas estratégias. A questão a se veri…car é o que muda no caso onde o jogo é jogado apenas uma vez, como visto até agora, e quando se repete um número especí…co de vezes. Como sempre, vamos iniciar a exposição através do um exemplo do “dilema dos prisioneiros”. Suponha então que o jogo fosse jogado duas vezes, sendo que, quando se reinicia o jogo, o resultado do primeiro estágio já é conhecimento comum. Os payo¤s dos jogadores serão tidos como simplesmente a soma dos payo¤s nas duas vezes em que se joga.

101


A forma de resolução de jogos de tal natureza é similar àquela vista para se encontrar ENPS, i.e., deve-se analisar de trás para frente. No caso especí…co citado acima, os jogadores, uma vez que se iniciará a segunda rodada do “dilema dos prisioneiros”, sabem que o resultado do primeiro estágio já foi consolidado e, portanto, não têm mais como mudá-lo. Sendo assim, eles se preocupam apenas com o que virá, ou seja, a segunda rodada do jogo em questão. Pensando dessa forma, o que eles irão fazer no segundo estágio do jogo? Irão proceder como fariam se o jogo fosse jogado apenas uma vez (pois, a…nal, o que ocorreu na primeira rodada não poderá mais ser mudado): como ambos têm uma estratégia dominante, que é confessar, a jogarão na segunda vez.

jogador 1

NC C

jogador 2 NC C 1; 1 9; 0 0; 9 6; 6

Como dito acima, a idéia por trás dos jogos repetidos é que, como ele será jogado mais de uma vez, pode ser que valha a pena cooperar no início para que o outro também coopere com você nos estágios subsequentes. Todavia, perceba que uma vez que se saiba que se alcançou o último estágio do jogo, ninguém mais irá cooperar, pois não mais se necessitará que o outro também coopere no futuro, uma vez que o futuro, para tal jogo, não existirá - pois aquela é a última rodada. Portanto, podemos concluir que: Observação 60 Em um jogo repetido um número …nito de vezes, onde os payo¤ s dos jogadores são a soma dos payo¤ s obtidos em cada vez que o jogo é repetido, na última rodada será jogado um Nash do jogo não repetido em questão, ainda que exista uma combinação de estratégias que dê payo¤ s maiores para todos os jogadores mas que não seja em equilíbrio de Nash. Esta seria atingível apenas via cooperação, mas essa não existirá na última vez em que o jogo é repetido. No dilema dos prisioneiros jogado duas vezes, no primeiro estágio, os jogadores, portanto, sabem que na rodada seguinte ambos irão confessar e, assim, obter um payo¤ de 6 cada. Eles podem então pensar o jogo repetido duas vezes apenas como o jogo em seu primeiro estágio acrescido de 6 para ambos nos payo¤s referentes a todos os resultados possíveis, uma vez que eles antecipam que esse será o ganho de cada um na última rodada. O jogo original é, portanto, encarado como se fosse o seguinte:

jogador 1

NC C

jogador 2 NC C 7; 7 15; 6 6; 15 12; 12

O que se fez acima foi simplesmente adicionar “ 6” em todos os payo¤s possíveis de todos os jogadores. Visualizando esse jogo, eles devem então novamente confessar, 102


dado que essa permanece sendo uma estratégia dominante para ambos. Conclui-se que o resultado do “dilema dos prisioneiros”repetido duas vezes será os dois jogadores confessarem em todas elas. A cooperação não pode, portanto, ser atingida em nenhum estágio, ainda que houvesse a promessa de um deles de que iria cooperar na primeira vez, por exemplo. Ainda assim o outro não cooperaria, porque ele saberia que, agindo assim, uma vez que o resultado do primeiro estágio emergisse, no segundo ninguém iria cooperar. E então não cooperar no primeiro daria um payo¤ total superior a ele, independente do que o outro …zesse, sendo, pois, uma estratégia dominante. Essas conclusões permanecem inalteradas mesmo se mudássemos apenas o número de vezes em que o jogo é repetido. Isto é, o resultado é válido mesmo para o “dilema” - ou qualquer outro jogo de informação completa - jogado n vezes, sendo n um número …nito. Imagine que ele fosse repetido quatro vezes. Na última ninguém cooperaria, pois não haveria um “futuro” para o jogo que justi…casse essa atitude. Na penúltima rodada, também ninguém cooperaria, porque todos saberiam que na última não haveria cooperação. O mesmo ocorreria na segunda rodada: cooperar para quê, dado que na terceira e na quarta ninguém o fará? Na primeira, o mesmo raciocínio se manteria. O resultado geral pode ser apresentado da seguinte maneira: Observação 61 De…nindo um jogo repetido T vezes como J (T ), sendo J o jogo simultâneo de informação completa que é repetido e tendo que, quando se reinicia um estágio de J (T ), todos sabem quais são os resultados dos estágios anteriores; e de…nindose os payo¤ s dos jogadores como simplesmente a soma dos payo¤ s obtidos nos T estágios de J (T ), se cada um dos estágios (J) de J (T ) possui um equilíbrio de Nash único, J (T ) possui um único ENPS, qual seja, o equilíbrio de Nash de J em todo estágio de J (T ). Se o jogo J é dinâmico (mas também com informação completa) e possui um único ENPS, o ENPS do jogo repetido, J (T )47 , será também o ENPS de J em cada estágio. Em suma, se um jogo com apenas um Nash - ou ENPS - (e com informação completa, como todos os que vimos até agora) for repetido um número …nito de vezes, o ENPS do jogo repetido será o equilíbrio de Nash - ou ENPS - sendo jogado em todos os seus estágios - desde que os payo¤s do jogo repetido seja apenas a soma dos payo¤s obtidos em cada estágio. Apesar do resultado “desanimador”visto acima, de que mesmo se o jogo for repetido n vezes a cooperação não será atingida em nenhum estágio - dadas nossas hipóteses 47 T P

Note que em um jogo estático e repetido T vezes, J (T ), haverá um número de subjogos igual a

ri

1

, onde r é o número de resultados possíveis de J (1), ou, da mesma forma, o número de pontos

i=1

terminais do jogo estático. Se J (1) conter alguma dinâmica, possuindo portanto mais de um subjogo, T P digamos n, o total de subjogos de J (T ) será então n ri 1 . i=1

103


adicionais -, um caso diferente emerge se existem mais de um Nash no jogo que será jogado mais de uma vez. Um exemplo deixa claro tal possibilidade: Exemplo 62

jogador 1

A B C

D 1; 1 0; 5 0; 0

jogador 2 E 5; 0 4; 4 0; 0

F 0; 0 0; 0 3; 3

No jogo acima, temos dois Nash: (A; D) e (C; F ). Vamos supor que ele será jogado duas vezes. Pela lógica vista acima, sabemos que, no segundo estágio, será jogado um Nash. Mas não sabemos qual!!! Os jogadores podem fazer então o seguinte acordo: se no primeiro estágio o resultado for (B; E), no segundo eles jogam (C; F ). Caso contrário, jogam (A; D) na segunda vez em que o jogo é jogado. Essa poderá ser uma forma de se conseguir um resultado de cooperação, no caso caracterizado por (B; E) - onde ambos ganham mais que em qualquer dos equilíbrios de Nash do jogo não repetido -, pelo menos no primeiro estágio do jogo repetido, uma vez que se sabe que no último isso não será possível. Se não há possibilidade de renegociação após efetivada a primeira rodada, o jogo que os jogadores visualizam no momento de começar, segundo o acordo, é o jogo estático apresentado acima somados os payo¤s que eles terão no segundo estágio em cada possibilidade que possa vir a ocorrer. Portanto, soma-se os payo¤s (1; 1) em todas as células, com exceção de (B; E), onde deve se somar (3; 3), que gera a seguinte matriz:

jogador 1

A B C

D 2; 2 1; 6 1; 1

jogador 2 E 6; 1 7; 7 1; 1

F 1; 1 1; 1 4; 4

Há, no jogo visualizado no primeiro estágio, três equilíbrios de Nash. Todos eles constituem ENPS, quando consideramos o jogo completo, em seus dois estágios. Contudo, um deles confere payo¤s maiores para ambos os jogadores, sendo assim um caminho óbvio a se jogar. Uma observação interessante é que podemos encontrar um ENPS que compreenda no primeiro estágio um resultado que não seja um Nash do jogo jogado apenas uma vez, neste caso o resultado (B; E). Essa possibilidade é obtenível em função da multiplicidade (dois, neste caso) de equilíbrios de Nash no jogo que será repetido e do arranjo que foi feito antes do jogo começar. Fundamental aqui foi também a hipótese de que não poderia ocorrer renegociação após o primeiro estágio. 104


O resultado obtido no exemplo acima é uma prova de que promessas/ameaças críveis a respeito de comportamentos futuros podem ser consideradas e, de fato, in‡uenciar o comportamento corrente dos agentes. A cooperação pode então ser obtida em estágios anteriores aos últimos, em tais casos. Note, porém, que a existência de tais ameaças/promessas críveis requer que no jogo não repetido existam pelo menos dois EN, pois, se elas considerarem a hipótese de se jogar ao …nal estratégias que não constituem EN, não deverão ser consideradas como possibilidades concretas . Uma outra questão é a possibilidade de renegociação: caso ela exista, então não poderíamos ter o resultado cooperativo descrito acima. Por que? Ora, caso se possa renegociar, porque não, antes do segundo estágio se iniciar, os jogadores - mesmo se um deles tiver ”traído”o pacto inicial - não se reúnem e combinam de jogar o equilíbrio de Nash que dê maior payo¤ para ambos? Mesmo com algum dos jogadores se sentindo ”traído”pelo seu “companheiro”, ele deveria aceitar a renegociação, pois assim ganharia mais do que não agindo assim. A…nal, as perdas passadas são irrecuperáveis e ele deve preocupar-se em maximizar seu payo¤ daquele momento em diante. Portanto, caso se saiba que a renegociação seja possível, não há porque cooperar no primeiro estágio, e então o resultado desse também tem de ser um equilíbrio de Nash no jogo não repetido. No exemplo anterior, isso corresponderia a simplesmente adicionar aos payo¤s do primeiro estágio os payo¤s do resultado do jogo em sua segunda rodada, (3; 3). Os ENPS restantes seriam então apenas (A; D) ou (C; F )) no primeiro estágio, e (C; F ) no segundo. O arranjo proposto anteriormente, portanto, pode ser considerado um ENPS no jogo repetido duas vezes, mas não é um ENPS a prova de renegociação. O conceito de ENPS em jogos de informação completa não é, pois, uma panacéia, não eliminando os resultados sensíveis a renegociações nos jogos repetidos …nitos. O problema destacado acima emerge porque o “traído”, ao punir o “traidor”, jogando o equilíbrio de Nash que é pior para ambos no segundo estágio, está ao mesmo tempo punindo a ele mesmo. Por isso, uma renegociação destituiria de sentido prático tal possibilidade. Todavia, em alguns jogos é possível encontrarmos ameaças/promessas que induzam à cooperação nos seus estágios iniciais e que sejam também resistente a renegociações. Exemplo 63 O exemplo anterior com mais duas estratégias possíveis para cada jogador: jogador 2 D E F G H A 1; 1 5; 0 0; 0 0; 0 0; 0 B 0; 5 4; 4 0; 0 0; 0 0; 0 jogador 1 C 0; 0 0; 0 3; 3 0; 0 0; 0 Y 0; 0 0; 0 0; 0 4; 0:5 0; 0 Z 0; 0 0; 0 0; 0 0; 0 0:5; 4 105


Existem no jogo não repetido acima quatro equilíbrios de Nash, como se percebe. Suponha que os jogadores combinem antes do primeiro estágio o seguinte acordo: se o resultado desse for (B; E), na segunda vez ambos jogam (C; F ); caso apenas o jogador 1 desvie inicialmente dessa estratégia, na segunda rodada eles jogam (Z; H), correspondendo a uma punição ao jogador1; caso o jogador 2 isoladamente desvie, no segundo estágio joga-se (Y; G), punindose esse último; se ambos desviarem de (B; E), eles jogam (C; F ) na segunda vez. Dessa forma, eles terão incentivos a cooperar no primeiro estágio do jogo repetido e, mesmo que ocorresse alguma “traição”, nenhum deles gostaria de deixar de aplicar a punição ao que desviou, pois, ao aplicá-la, ele está fazendo algo que é melhor para ele mesmo, e então não aceitará renegociar. Como ambos sabem disso, nenhum irá querer deixar de cooperar no primeiro estágio, e teremos então entre os ENPS, um com (B; E) no primeiro estágio e (C; F ) no segundo, que incorpora um resultado que não é um equilíbrio de Nash no jogo não repetido e, além disso, é também fechado para renegociações. Para que essas conclusões …quem mais claras, vejamos o jogo que é visualizado por ambos os jogadores caso as estratégias de…nidas pelo acordo citado acima se veri…cassem. Para tanto, basta adicionar os payo¤s (0:5; 4) em todas as células onde o jogador 2 escolhe E e o jogador 1 não escolhe B; (4; 0:5) em todas as células onde o jogador 1 joga B mas o jogador 1 não joga E; e (3; 3) em todas as outras:

jogador 1

A B C Y Z

D 4; 4 4; 5:5 3; 3 3; 3 3; 3

E 5:5; 4 7; 7 0:5; 4 0:5; 4 0:5; 4

jogador 2 F G 3; 3 3; 3 4; 0:5 4; 0:5 6; 6 3; 3 3; 3 7; 3:5 3; 3 3; 3

H 3; 3 4; 0:5 3; 3 3; 3 3:5; 7

Portanto, temos nesse jogo repetido duas vezes também três ENPS, com um deles tornando-se focal segundo as estratégias sugeridas, pelo fato de gerar payo¤s superiores a todos os jogadores. Como comentado, esse incorpora na sua primeira rodada um resultado que não é Nah no jogo estático jogado apenas uma vez, correspondendo a um autêntico resultado de “cooperação”, obtenível apenas porque existem mais de um Nash no jogo sem repetição. Além disso, é à prova de renegociação, uma vez que é possível penalizar um eventual “traidor” sem que se puna a si mesmo. Novamente, vale lembrar que resultados como esse último poderiam ser alcançáveis também se o jogo se repetisse mais de duas vezes, com a cooperação sendo possível 106


até o penúltimo estágio. Bastaria que a mesma estrutura se mantivesse, com o número de repetições determinado e por todos conhecido, sendo também os payo¤s no jogo repetido a simples soma dos ganhos em todos os estágios.

4.2

Jogos repetidos in…nitamente

Mais uma vez o nosso objetivo aqui será avaliar se ameaças/promessas em relação ao comportamento futuro podem afetar o comportamento presente. No caso …nito veri…camos que resultados que não são equilíbrios de Nash em cada estágio podem ser alcançáveis antes do último estágio sob certas condições, particularmente de que exista mais de um equilíbrio de Nash no jogo não repetido. Para o caso de repetição in…nita - termo de…nido de modo mais preciso abaixo -, mostraremos a possibilidade de algo ainda mais forte: será possível encontrar um ENPS que não seja equilíbrio de Nash em nenhum dos estágios do jogo tomados isoladamente, e mesmo que exista apenas um equilíbrio de NashEN no jogo jogado apenas uma vez, como no Dilema dos Prisioneiros. Vamos assumir a hipótese de que, ao iniciar-se um novo estágio do jogo, todos os jogadores sabem os resultados dos estágios anteriores. Entretanto, suponha que mantivéssemos aqui a hipótese de que os payo¤s dos jogadores fossem de…nidos como antes, i.e., como sendo simplesmente o somatório do payo¤ de cada estágio. Dessa forma, não haveria diferença entre, por exemplo, alcançar um payo¤ de uma unidade em cada rodada ou de dez unidades (ou de qualquer quantidade positiva) em cada uma delas. Em qualquer das hipóteses, o payo¤ do jogo in…nitamente repetido seria um número in…nito, e não se poderia fazer comparações precisas entre eles. De outra forma: 1 1 1 X X X n = 1 8n > 0. 10 = 1=

Segue portanto que a nossa de…nição dos payo¤s do jogo repetido in…nitas vezes deve ser diferente. O que se faz em geral é utilizar da mesma idéia inserida a respeito de fatos futuros existente na aplicação de barganha sequencial, vista anteriormente. Isto é, supõem-se que os indivíduos valorizem mais o presente que o futuro. Essa hipótese é extremamente razoável. Senão vejamos. Pergunte a você mesmo - ou a qualquer pessoa “normal” - o que seria preferível: receber agora cem reais ou receber, daqui a dez anos, os mesmos cem reais? Não há dúvidas de que todas as pessoas (ou pelo menos quase todas) preferiria receber o dinheiro agora. Poder-se-ia argumentar que isso seria devido à in‡ação, mas pode-se refazer a mesma pergunta supondo o valor corrigido por um índice “razoável’qualquer (que corrija a in‡ação e os juros reais do período) que a resposta não deverá alterar-se. A idéia é que, recebendo os reais agora, você poderá fazer tudo o que poderia fazer caso os recebesse após algum tempo e mais alguma coisa - gastá-los entre hoje e o período seguinte quando você também poderia recebê-los. Portanto, generalizasse que o mesmo payo¤ hoje é preferível (ou, pelo menos, não é

107


pior) a ele mesmo daqui a algum tempo futuro qualquer; e quanto mais distante for o período de recebimento, menos valor ele terá para você hoje (imagine o valor de mil reais a se receber, por exemplo, daqui a setenta e cinco anos...). O que fazemos é utilizar uma taxa de desconto (d) para os payo¤s futuros, que será tanto maior quanto mais distante o período. O payo¤ de um jogador em um jogo repetido in…nitamente será então o somatório do que ele irá ganhar em cada estágio, mas com esses valores descontados para o presente. Isto é o mesmo que dizer que trabalharemos com o “valor presente”do ‡uxo dos payo¤s que os jogadores irão obter, ou seja, quanto vale hoje para o jogador um determinado payo¤ que deverá receber apenas em um período seguinte. Isso é equivalente a se perguntar, por exemplo, qual seria o valor que faria com que um determinado jogador …casse indiferente entre recebêlo hoje e receber cem reais (corrigidos pela taxa de juros nominal) daqui a um ano. Se ele dissesse que seria 93 reais, seria um indicador de que a sua taxa de desconto anual seria algo em torno de 7:5%48 . Ao invés de trabalhar com a taxa de desconto, utilizaremos um indicador similar de manuseio mais simples -, que denominaremos fator de desconto e representaremos pelo símbolo , com 2 (0; 1). Em relação à taxa, ele signi…ca =

1 , 1+d

de modo que, quanto maior d, menor será . Um fator de desconto quase igual a um, por exemplo, corresponde a um caso onde payo¤s futuros valem quase o mesmo que os presentes. Por outro lado, se for muito próximo de zero, representará uma situação onde o relevante será fundamentalmente o presente, com pouco valor para acontecimentos futuros. Em suma, quanto maior for o valor do fator de desconto, mais se valorizará o futuro, e vice-versa. Entretanto, o fator de desconto pode signi…car, além da redução do valor que o indivíduo confere hoje a um valor futuro, também a probabilidade do jogo terminar no próximo período. Nesta interpretação, um jogo repetido in…nitamente é entendido como um jogo que a cada período tem uma probabilidade (menor que um) de terminar. Ainda que o indivíduo valorizasse igualmente presente e futuro, ele preferiria um payo¤ no estágio atual do jogo a esse mesmo valor no próximo período, pois existe determinada probabilidade de tal estágio não ocorrer. Pense, por exemplo, na briga de mercado para refrigerantes sabor cola entre Coca-Cola e Pepsi. É provável que tal jogo se repita um número muito grande de vezes. Mas existe, em cada período - seja qual for a sua de…nição de período -, uma chance de o jogo acabar - com uma das …rmas fechando, 48

Não seria exatamente 7%, como se poderia imaginar, porque a de…nição de uma taxa de desconto VF é um valor d que faz com que V P = 1+d , onde V P é o valor presente e V F é o valor futuro. No exemplo dado, V F é 100 e V P é 93. O valor de d, portanto, é dado por d = V FV PV P , que nesse caso é aproximadamente 0:075.

108


por exemplo -, ainda que pequena49 . Portanto, o fator de desconto re‡ete os dois fatos: a menor valorização de payo¤s futuros em relação a presentes e a probabilidade do jogo terminar sem alcançar o próximo estágio. Quanto às diferenças entre os jogos repetidos …nita e in…nitamente, a principal delas é que nesses últimos não existe um último estágio - pelo menos ele não existe com certeza. Esse era o fato que levava à não cooperação nos jogos …nitos com apenas um Nash em cada estágio. Como nos jogos repetidos in…nitamente isso não existe, a cooperação é possível - como veremos abaixo - mesmo se houver apenas um Nash no jogo não repetido. O que iremos utilizar nesta seção são as chamadas “estratégias de gatilho (trigger)”. Elas possuem esse nome por se referirem a estratégias que de…nem para o jogador que a utiliza uma posição de cooperação50 com os demais, que é mantida enquanto os outros também cooperam. Caso algum deles cesse o “acordo”, o jogador “dispara o gatilho”, i.e., pára de cooperar daí em diante, enquanto durar o jogo. Deve-se ter em vista que essa é uma possibilidade, embora seja uma das mais estudadas em teoria dos jogos repetidos in…nitamente - provavelmente pela sua facilidade analítica. Nos jogos repetidos, dinâmicos por de…nição, o conceito-chave para se fazer previsões a respeito de possíveis resultados de jogos é também o de ENPS. Como visto, para um conjunto de estratégias constituir em um ENPS, ela deve induzir um equilíbrio de Nash em todos os subjogos do jogo em questão. Mas, no caso de repetição in…nita, o que seria um subjogo? Dada a de…nição mostrada anteriormente, é fácil perceber que nesses casos haverá um número in…nito de subjogos. Sendo o jogo repetido in…nitamente simultâneo - como no dilema dos prisioneiros -, existirão subjogos se iniciando em cada vez que um novo estágio se iniciar. Raciocínio análogo aplica-se se o jogo sem repetição for dinâmico. Note que um estágio do jogo visto isoladamente não constitui um subjogo! Eles apenas se iniciam nesse ponto (recorde a de…nição de subjogo, se necessário). Veja, por outro lado, que quando se inicia um estágio do jogo, cada subjogo é exatamente idêntico ao que havia começado anteriormente, uma vez que o jogo é in…nito! Por exemplo, um subjogo que se inicia no primeiro estágio é exatamente o mesmo que se inicia no quarto, oitavo ou n ésimo (para um n …nito) estágio. Sabendo disso, o que se poderá concluir a respeito de um resultado que seja um equilíbrio de Nash no jogo como um todo? Que ele deve ser também um equilíbrio de Nash em todos os outros subjogos, e, portanto, um ENPS! Assim, basta encontrar os 49

Se não fosse assim, estaríamos supondo que Coca e Pepsi interagir-se-iam no mercado de refrigerantes sabor cola durante muito mais que, por exemplo, um trilhão de séculos, o que não seria razoável - nem para esse e nem para nenhuma outra situação de interdependência estratégica. 50 Por “cooperação”, tanto aqui como nos jogos …nitos, entende-se uma escolha que, tendo em vista apenas o estágio do jogo isoladamente, não seria uma opção ótima para o jogador. Entretanto, pode constituir-se em uma desde que ela induza os outros jogadores a também cooperarem em estágios futuros.

109


equilíbrios de Nash do jogo inteiro (que de…ne um subjogo que será igual a todos os demais) para termos também os ENPS. Exemplo 64 Dilema dos prisioneiros repetido in…nitamente. Tome o jogo abaixo jogado in…nitas vezes, de…nindo-se o payo¤ dos jogadores como o valor presente dos payo¤ s obtidos em cada estágio do jogo, e sendo o fator de desconto entre dois períodos consecutivos chamado de 2 (0; 1).

jogador 1

NC C

jogador 2 NC C 1; 1 9; 0 0; 9 6; 6

Vamos propor uma ”estratégia de gatilho” para ambos os jogadores: cooperar (não confessar) no primeiro estágio; em qualquer estágio subsequente, coopera se o resultado do período anterior tiver sido (N C; N C), i.e., se tiver ocorrido cooperação; caso contrário, o jogador não coopera mais e confessa daí em diante”. Se ambos os prisioneiros/jogadores jogam com essa estratégia, sempre haverá cooperação, pois ambos começarão cooperando; no estágio seguinte, virão que terá ocorrido (N C; N C) no anterior e permanecerão cooperando, ocorrendo o mesmo no terceiro, quarto etc. estágios. Mas isso, em si mesmo, não diz nada: o que se requer é que ambos tenham incentivos em de fato utilizar aquela estratégia. Tem-se então que se testar se ela, de fato, constitui um ENPS, o que ocorrerá se nenhum jogador quiser desviar em nenhum subjogo. Vejamos inicialmente se a estratégia de gatilho pode ser um equilíbrio de Nash no jogo como um todo. Caso um dos jogadores a estiver jogando, será o melhor para o outro também jogá-la? Suponha que ele desvie na primeira rodada: obterá então payo¤ igual a zero, ao invés de 1. Entretanto, ele sabe que, fazendo isso, o outro jogador nunca mais irá cooperar. O resultado após o primeiro estágio será então sempre ambos confessarem. O payo¤ do jogador que desviou será, pois, o valor presente dos seus payo¤s obtidos em cada rodada do jogo, i.e.: 0 + ( 6) + ( 6)

2

+ ( 6)

3

+ ::: = ( 6)

1

Mas, para saber se o desvio proposto acima é uma boa alternativa, temos que comparar o payo¤ que ele confere ante o payo¤ que seria obtido caso o jogador resolvesse não desviar, e portanto também jogasse a estratégia de gatilho acima descrita. Como o outro, por hipótese, também a está seguindo, o payo¤ que ele receberá em cada estágio 110


será aquele emergente de quando ambos cooperam. No caso do dilema dos prisioneiros apresentado acima, seria obter sempre 1. O valor presente do ‡uxo total dos payo¤s seria então 1 + ( 1) + ( 1) 2 + ( 1) 3 + ::: = ( 1) 1 Portanto desviar no primeiro estágio vale a pena apenas se ( 6)

1

( 1)

1

$

1 . 6

Ou seja, para valores relativamente pequenos de - o que signi…ca que o jogador valoriza pouco o futuro -, vale a pena para ele desviar, pois o fato de ganhar menos no futuro é menos signi…cativo para ele que a vantagem de obter um payo¤ superior no primeiro período. De outra forma, caso o fator de desconto não seja tão pequeno (não seja menor que 1=6), então será preferível ao jogador também utilizar a estratégia de gatilho inicialmente proposta, dado que o outro também a está utilizando. Como o jogo, neste exemplo, é simétrico, a mesma condição obtida para um jogador vale para o outro: se > 1=6 , nenhum dos jogadores terá incentivo a desviar no primeiro estágio da estratégia de gatilho proposta. Vimos acima, portanto, qual a condição necessária para que a estratégia de gatilho seja um equilíbrio de Nash no dilema dos prisioneiros repetido in…nitamente. Entretanto, requer-se que ela seja também ENPS, i.e., que seja um equilíbrio de Nash em cada subjogo. Como sabe-se que os subjogos nesse caso são idênticos, temos então que o requerimento para que se obtenha um equilíbrio de Nash no jogo inteiro é exatamente o mesmo para que ela seja ENPS. Nesse caso, a estratégia de gatilho proposta para os dois prisioneiros/jogadores serão ENPS também caso o fator de desconto seja maior do que ou igual a 1=6. Após concluirmos para um exemplo especí…co, somos levados a mostrar um resultado mais geral, conhecido como Teorema de Friedman, ou, mais usualmente, como Folk theorem (“teorema popular”)51 . Vamos de…ní-lo de uma maneira informal: Teorema 65 - “Folk Theorem”: Seja um jogo J, estático, …nito e de informação completa. Caso exista um conjunto de estratégias (mesmo que elas não sejam um equilíbrio de Nash de J) dos jogadores que con…ram payo¤ s f(p1 ; :::; pn )g a todos eles, superiores aos que obteriam jogando um equilíbrio de Nash de J, se o fator de desconto for su…cientemente próximo de um (i.e., se se descontar su…cientemente pouco os valores futuros), então existe um ENPS no jogo J repetido in…nitas vezes onde se alcança, em cada estágio, os payo¤ s f(p1 ; :::; pn )g para os n jogadores. 51

O teorema tem esse nome porque, antes de publicado, já era conhecido pela maior parte dos teóricos de jogos. Na verdade, como aponta Gibbons (1992), o teorema aqui referido não é exatamente o “folk”inicial, mais conhecido. De fato, é parecido, mas com algumas mudanças que o incrementaram, elaboradas por James Friedman em 1971.

111


Podemos então concluir esta seção a…rmando que, sob determinadas condições (um “grande”, basicamente), resultados inalcançáveis em jogos não repetidos ou repetidos tendo-se em vista um horizonte …nito são atingíveis se o jogo se repete inde…nidamente (com uma probabilidade entre zero e um), acarretando payo¤s (considerando-se o jogo inteiro) superiores ao que poderiam ser obtidos de outra forma. Algumas observações …nais devem ser feitas. A primeira refere-se ao fato de que trabalhamos apenas com as chamadas ”estratégias de gatilho”. Na realidade, muitas outras podem ser construídas, como já comentado, levando a uma maior ou menor e…ciência no cumprimento de acordos e a penalizações maiores ou menores caso esses não sejam cumpridos. Contudo, vamos deixá-las de lado por acreditar que a idéia básica já …ca su…cientemente clara apenas pela análise das “estratégias de gatilho”. Assim como várias estratégias podem ser elaboradas, há um outro problema com jogos repetidos que diz respeito à multiplicidade de “equilíbrios” que podem ser encontrados. Inclusive para se gerar um mesmo resultado, várias estratégias podem ser utilizadas pelos jogadores. Esse fato enfraquece o poder de previsão da teoria em jogos com essas características, especialmente se não for possível algum tipo de coordenação prévia e caso não exista qualquer indício da existência de pontos focais. Um último ponto diz respeito ao fator de desconto. Durante toda a seção, foi suposta a existência, conhecida pelos jogadores, de um fator para cada jogo. Na verdade, essa é uma simpli…cação, pois é razoável que se tenha não apenas um em cada jogo, mas, em cada um deles, também um para cada jogador. Ou seja, o futuro pode ter valor diferente para jogadores distintos, assim como eles podem vislumbrar a possibilidade de continuação de um jogo com probabilidades também distintas. Em termos de resolução, nada se altera signi…cativamente com essa modi…cação. A diferença é que os valores críticos dos fatores de desconto (para gerar cooperação sob determinada estratégia, por exemplo) terão de ser calculados para cada jogador.

4.3 4.3.1

Aplicações Duopólio de Cournot repetido in…nitamente

Vejamos o que se altera no modelo (duopólio) de Cournot visto anteriormente caso o jogo se repita in…nitamente, com um fator de desconto entre dois períodos consecutivos igual a , como de praxe. As especi…cações do modelo são as mesmas do jogo sem repetição.Antes obtivemos a existência de apenas um equilíbrio de Nash, onde ambas as …rmas produziam 1 qi = (a c) ; i = 1; 2 3 e lucravam cada uma 1 (a c)2 ; i = 1; 2. i = 9

112


Quando supomos que elas tinham a possibilidade de formar um cartel, produzindo cada uma a metade do que um monopolista produziria, incrementariam assim o lucro agregado do mercado e, também, o de cada uma delas isoladamente. A produção e o lucro nesse caso seriam (resolvendo o problema do monopolista): ( qi = q2m = 14 (a c) ; i = 1; 2 1 m c)2 ; i = 1; 2 i = 2 = 8 (a Entretanto, veri…camos também que tal conluio não era estável, pois ambas iriam ter incentivos em desviar da estratégia proposta. O jogo que resultava dessa análise é o que está descrito abaixo, um Dilema dos Prisoneiros onde o (único) equilíbrio de Nash era as …rmas não constituirem o cartel e competirem em Cournot: …rma 2 …rma 1

1 8 9 64

cartel compete

(a (a

cartel c)2 ; 18 (a c)2 3 c)2 ; 32 (a c)2

3 32 1 9

compete 9 (a c)2 ; 64 (a c)2 2 1 (a c) ; 9 (a c)2

Como antes, é fácil ver que o payo¤s associado ao cartel é estritamente maior do que o ganho de equilíbrio para ambas as …rmas, de modo que o equilíbrio não é e…ciente. No entanto o acordo não é crível na medida em que nenhuma das …rmas tem incentivos a jogar nenhuma estratégia que não aquela(s) que compõem o equilíbrio de Nash do jogo: o equilíbrio de Nash é um resultado (estrategicamente) estável. Mas vejamos o que poderia se alterar caso o jogo fosse repetido com horizonte in…nito. Primeiramente, veri…quemos a condição, no jogo repetido in…nitamente, para que constitua um equilíbrio de Nash a seguinte estratégia de gatilho: produzir q2m no primeiro período; manter q2m em cada período se a outra …rma também tiver produzido essa quantidade no período anterior; senão, produzir a quantidade do equilíbrio de Nash de Cournot não repetido para sempre. Para testar se essa estratégia constitui um equilíbrio de Nash, basta veri…car se o payo¤ obtido a seguindo será maior ou igual ao que se obteria desviando no primeiro período, supondo que o outro jogador esteja jogando a estratégia proposta. Assim, os jogadores não irão desviar - e a estratégia proposta jogada por ambos será um equilíbrio de Nash - se: ( 2 (a c)2 9(a c)2 1 + (a 9c) $ 8 1 64 1 9 17

Pela lógica vista anteriormente, sabemos que se não é menor que 9=17, então ambos os jogadores jogarem a estratégia de gatilho acima será um Nash e um ENPS no jogo repetido in…nitamente. Nesse caso, o cartel, para esse dado problema, torna-se estável. 113


Todavia, essa não é uma regra para todos os conluios de mercado possíveis. Intuitivamente, caso existissem mais jogadores no oligopólio e se houvesse di…culdades de se veri…car quem “furou” o acordo, por exemplo, a coordenação seria muito di…cultada e a estabilidade poderia não ser alcançada. Questões como essas podem ser respondidas, portanto, apenas a partir de uma perspectiva especí…ca para cada caso. 4.3.2

Política Monetária Temporalmente Consistente

Considere um jogo sequencial no qual patrões e empregados negociam salários nominais e posteriormente a autoridade monetária escolhe a oferta de moeda, o que, por sua vez, determinará a taxa de in‡ação do período. Se os contratos salariais não puderem ser perfeitamente indexados, os trabalhadores e os empregadores tentarão antecipar a in‡ação para determinar o salário que vigorará. Entretanto, uma vez que o salário nominal, indexado imperfeitamente, foi determinado, a realização de uma in‡ação acima da in‡ação antecipada vai corroer o salário real, fazendo com que as …rmas expandam os empregos e o produto. Posto isso, a autoridade monetária enfrenta um trade-o¤ entre os custos da in‡ação e os benefícios de redução do desemprego e aumento do produto que decorrem da in‡ação não antecipada. Como em Barro e Gordon (1983), nós analizamos uma forma reduzida desse modelo no seguinte stage-game (o jogo não repetido). Primeiro, os empregadores formam uma expectativa de in‡ação, e . Segundo, a autoridade monetária observa essa expectativa e escolhe um nível de in‡ação que de fato se realizará, . O payo¤ das …rmas é dado por e 2 ( ) Ou seja, as …rmas desejam antecipar corretamente a taxa de in‡ação na medida em que o payo¤ máximo que elas podem atingir é zero, o que ocorre quando = e. A autoridade monetária, por sua vez, gostaria de in‡ação zero e que o produto (y) estivesse no seu nível e…ciente (y ). Nesse sentido o payo¤ da autoridade monetária é dado por U ( ; y) = c 2 (y y )2 onde o parâmetro c > 0 re‡ete o trade-o¤ da autoridade monetária entre os dois objetivos. Suponha que o produto seja função do produto-alvo (o nível e…ciente) e da in‡ação não-antecipada de acordo com a expressão abaixo, y = by + d (

e

)

onde b 2 (0; 1) re‡ete a presença de poder de monopólio no mercado de produtos, de modo que se não houver in‡ação não-antecipada então o produto será menor do que o produto e…ciente, e d > 0 mede o efeito da in‡ação não-antecipada sobre o

114


produto através da compressão dos salários reais, como descrito acima. Podemos então reescrever o payo¤ da autoridade monetária como W( ;

e

)=

2

c

[(b

e 2

1) y + d (

)]

Para resolver o resultado perfeito em subjogos desse jogo não-repetido, nós primeiro computamos a escolha ótima da autoridade monetária de , dada a expectativa dos empregadores, e . Ou seja, a autoridade monetária vai e

maxW ( ;

)

de modo que as CPO´s implicam que @W ( ; @

e)

=

2c

2d [(b

e

1) y + d (

)] = 0

tal que, resolvendo para a variável de escolha, (

e

)=

d [(1 c + d2

e

b) y + d

]

Como (por indução retroativa) as …rmas antecipam perfeitamente a escolha da autoridade monetária, o problema das empresas torna-se escolher uma previsão de in‡ação que maximiza seu payo¤ dado que a função de reação da autoridade monetária, ( e ), é de conhecimento comum. Isto é, max e

e 2

(

) =

=

d [(1 c + d2

=

d (1 c + d2

=

d (1 c + d2

e

(

) 2 e

b) y + d

]

e 2

b) y +

d2 c + d2

1

b) y

c c + d2

e

e

c c + d2

e 2

As CPO´s implicam que 2

d (1 c + d2

c c + d2

b) y

tal que e

=

d (1

b) c

115

y

=0


Substituindo em

(

e)

temos

(

e

d d2 (1 b) (1 b) y + y c + d2 c d2 d (1 b) 1 + y c + d2 c d (1 b) y c

) = = =

onde, observe, = e. Outra forma de analizar a questão (mais simples, inteligente e que, obviamente, deve gerar o mesmo resultado) é lembrar que decorre do problema das …rmas que no ótimo e = tal que temos (

e

e

)=

=

d [(1 c + d2

b) y + d

e

]

ou seja, e

d2 c + d2 c c + d2

1 e

d (1 c + d2 d (1 c + d2

= =

b) y b) y

tal que b) y = s>0 c onde o subscrito s denota o stage-game. De uma maneira equivalente, poderíamos dizer que a expectativa racional para as …rmas formarem é aquela que subsequentemente seja con…rmada pela autoridade monetária, tal que ( e ) = e e portanto e = s . Quando as empresas formam a expectativa de in‡ação e = s , o custo marginal para a autoridade monetária em determinar a in‡ação um pouco acima de s equivale exatamente ao benefício marginal da in‡ação não-esperada. Nesse resultado perfeito em subjogos, espera-se que a autoridade monetária gere in‡ação positiva e de fato ele assim fará, mas seria ainda melhor se ela pudesse se comprometer a não gerar in‡ação. Logo, se as …rmas têm expectativas racionais ( = e ), então in‡ação zero maximiza o payo¤ da autoridade monetária, pois e

=

W( ;

d (1

e

)=

c

2

(b

1) y

2

tal que = 0 é ótimo. Considere agora esse jogo repetido in…nitamente e que ambos os jogadores tenham a mesma taxa de desconto intertemporal . Vamos derivar as condições sob as quais 116


= e = 0 em todo período seja um equilíbrio perfeito de acordo com as seguintes estratégias: no primeiro período, as empresas …xam uma expectativa in‡acionária e = 0, nos períodos subsequentes …xam e = 0 se todas expectativas anteriores foram e = 0 e se todas as in‡ações realizadas até então tenham sido = 0; caso contrário …xam e = s - a expectativa racional do jogo não repetido. Similarmente, a autoridade monetária escolhe = 0 se a expectativa corrente for e = 0, todas as expectativas passadas tiverem sido e = 0 e toda in‡ação realizada até então tiver sido = 0; caso contrário escolhe = ( e ), a melhor resposta que ela pode dar às expectativas das …rmas. Suponha que as …rmas formem a expectativa e = 0 no primeiro período. Dada a estratégia das …rmas (isto é, a forma que elas determinam suas expectativas in‡acionárias após realizar a in‡ação de fato), a autoridade monetária pode restringir sua atenção para duas possibilidades de escolha: (1) = 0, o que leva a e = 0 no próximo período e daí à mesma decisão da autoridade monetária no próximo período e (2) = (0), d e e e de ( ) = c+d2 [(1 b) y + d ], o que leva a = s daí em diante, caso no qual seria ótimo para a autoridade monetária …xar = s daí em diante. Fixando = 0 nesse período resultará em um payo¤ de W (0; 0) em cada período e …xando = (0) nesse período resultará em um payo¤ de W ( (0) ; 0) no período corrente mas em um payo¤ de W ( s ; s ) daí em diante. Logo a estratégia da autoridade monetária será a melhor resposta à regra adotada pelas …rmas se 1 1

W (0; 0)

W(

(0) ; 0) +

1

W(

s;

s)

Simpli…cando a expressão acima teremos que in‡ação zero será crível, será um equilíbrio perfeito no jogo repetido in…nito, se c 2c + d2 onde cada um dos parâmetros, c e d, tem dois efeitos. Um aumento em d torna a in‡ação não antecipada pelo mercado mais efetiva ao afetar o produto e o desemprego, de modo que torna-se mais tentador para a autoridade monetária gerar in‡ação acima daquela esperada, mas pelo mesmo motivo um aumento em d também aumenta s , a in‡ação do jogo não repetido, o que torna a punição mais custosa para a autoridade monetária. Da mesma forma, um aumento em c torna a in‡ação mais custosa, o que faz com que gerar in‡ação não antecipada seja menos atraente, mas também reduz s . Em ambos os casos, o último efeito domina o primeiro, tal que o valor crítico do fator de c desconto necessário para sustentar esse equilíbrio é 2c+d 2 , crescente em c e decrescente em d, 8 c @ 2 2c > 2c+d2 d2 < = 2c+d = (2c+d >0 2 )2 @c (2c+d2 )2 > :

@

c 2c+d2

@d

=

2dc (2c+d2 )2

117

<0


Nós mostramos até aqui que a estratégia da autoridade monetária é a melhor red b) y + d e ] vale. Para mostrar sposta à estratégia das …rmas se ( e ) = c+d 2 [(1 que essa estratégia é um equilíbrio de Nash, resta mostrar que ela é a melhor resposta às …rmas, o que decorre da observação de que as …rmas obtêm seus maiores payo¤s possíveis (zero) em cada período. Mostrar que tais estratégias são perfeitas em subjogos segue os mesmos argumentos utilizados na seção anterior.

5

Jogos bayesianos estáticos e equilíbrio bayesiano de Nash

Vamos começar aqui a estudar jogos de informação incompleta, também ditos jogos bayesianos. Lembre-se que em jogos, estáticos e dinâmicos, de informação completa, por de…nição, a função de ganho dos jogadores era de conhecimento comum. Em contraste, nos jogos de informação incompleta, a função payo¤ de pelo menos um dos jogadores não será de conhecimento comum, o que denota um elemento de incerteza na medida em que pelo menos um jogador estará incerto sobre a função payo¤ dos outros jogadores. Manteremos o formato que estamos seguindo desde o começo e apresentaremos primeiro jogos bayesianos estáticos e posteriormente trataremos de jogos dinâmicos. Um exemplo padrão de jogos estáticos de informação incompleta são leilões fechados. Cada participante (“bidder”) sabe a sua própria avaliação do bem leiloado mas não conhece as avaliações dos demais participantes. O lances (“bids”) são submetidos em envelopes fechados, de modo que os movimentos dos jogadores podem ser considerados simultâneos. No entanto, a maioria dos jogos bayesianos interessantes economicamente são dinâmicos. Como nós veremos na próxima seção, a existência de informação privada leva naturalmente à tentativas da parte informada de se comunicar (ou enganar) e à tentativas da parte não informada de aprender e responder. Essas questões são inerentemente dinâmicas. Na próxima seção vamos de…nir a forma de representar de um jogo bayesiano estático e a noção de equilíbrio correspondente, qual seja equilíbrio bayesiano de Nash. Como tais noções são mais complexas e abstratas do que as vistas até aqui, faremos isso através de um exemplo, um oligopólio de Cournot sob informação incompleta.

5.1

Cournot sob informação incompleta

Considere um duopólio de Cournot padrão em que as …rmas escolhem simultaneamente o quanto produzir. A curva de demanda inversa é P (Q) = a

Q e

Q = q1 + q2

A função custo da …rma 1 é dada por C1 (q1 ) = cq1 118


e isso é de conhecimento comum. Já a função custo da …rma 2 não. Ela é dada por ( cH q2 com probabilidade C2 (q2 ) = , onde 0 < cL < cH cL q2 com probabilidade 1 A …rma 1 não sabe ao certo qual é a função custo da …rma 2 (essa …rma pode ser uma …rma nova no mercado ou pode ter inventado uma nova tecnologia): o que é de conhecimento comum aqui é a distribuição de probabilidades sobre a e…ciência da …rma 2 e a própria estrutura de informação, no sentido de que a …rma 1 sabe que 2 tem informação superior, a …rma 2 sabe que a …rma 1 sabe isso e assim sucessivamente. Como resolver esse jogo? Considere primeiro o caso da …rma 2, a …rma que tem mais informação. Caso ela seja ine…ciente, o seu problema será max

2 (cH )

q2

= P (Q) q2 = (a

q1

cH q2 q2

cH ) q2

E analogamente, caso ela seja mais e…ciente, vai max q2

2 (cL )

= P (Q) q2 = (a

q1

cL q2 q2

cL ) q2

Decorre das CPO´s dos problemas acima que q2 (cH ) =

a

cH 2

q1

e que q2 (cL ) =

a

cL 2

q1

que são as melhores respostas que a …rma 2 pode dar às escolhas de 1 caso ela seja de custo alto ou de custo baixo. Já o problema da …rma 1, a …rma não informada, é maximizar o seu ganho esperado em função da chance de 2 ser ou não e…ciente. Ou seja, a …rma 1 max q1

1

=

[P (q1 + q2 (cH )) q1

=

[(a

q1

=

[(a

c

cq1 ] + (1

q2 (cH )) q1 q1

) [P (q1 + q2 (cL )) q1

cq1 ] + (1

q2 (cH )) q1 ] + (1

) [(a ) [(a

q1 c

q1

cq1 ]

q2 (cL )) q1

cq1 ]

q2 (cL )) q1 ]

tal que as CPO´s implicam que @ 1 = [(a @q1

c

2q1

q2 (cH ))] + (1

) [(a

c

2q1

q2 (cL ))] = 0

tal que [(a

q1 (q2 (cH ) ; q2 (cL )) = =

a

c

c

q2 (cH ))] + (1 ) [(a c 2 [ q2 (cH ) + (1 ) q2 (cL )] 2 119

q2 (cL ))]


será a melhor resposta (esperada) que a …rma 1 pode dar às escolhas de 2. Da interseção dessas 3 equações de melhores respostas segue que q1 =

a

a cH q 1 2

c

+ (1 2

)

a cL q 1 2

ou seja, 4q1 = 2a

2c

a + cH + q1 + (1

) cL + (1

) q1

ou ainda, 2c + cH + (1 ) cL 3 Como curiosidade, veja o que ocorre quando cH = cL = c e compare com o equilíbrio de Nash em Cournot com informação completa. Substituindo essa expressão acima em q2 (cH ) e em q2 (cL ), teremos as demais expressões de equilíbrio, q1 =

q2 (cH ) =

a

a

cH

1 [a 6

2

2c + cH + (1

) cL ]

tal que 6q2 (cH ) = 3a

3cH

a + 2c

cH

(1

) cL + [(1

) cH

(1

) cH ]

ou seja, ) 2cH + c (1 + (cH cL ) 3 6 Analogamente (faça as contas como exercício), a …rma 2 de custo baixo produzirá q2 (cH ) =

a

q2 (cL ) =

a

2cL + c 3

6

(cH

cL )

Logo em equilíbrio as …rmas produzirão 8 > q1 = a 2c+ cH3+(1 )cL < q2 (cH ) = a 2c3H +c + (1 6 ) (cH cL ) > : q2 (cL ) = a 2c3L +c 6 (cH cL ) A oferta esperada da indústria será

Q = q1 + q2 = q1 + q2 (cH ) + (1

) q2 (cL )

Ou seja, Q =

a

2c + cH + (1 ) cL + 3 a 2cH + c (1 ) + + (cH 3 6 a 2cL + c + (1 ) (cH 3 6 120

cL ) + cL )


Logo 3Q = a

2c + cH + (1

) cL + (a

2cH + c) + (1

) (a

2cL + c)

ou ainda, 3Q = 2a

c

cH

(1

) cL

2a

c

cH 3

(1

) cL

2a

c

tal que Q=

O preço esperado por sua vez será P (Q) = a =

Q=a

a + c + cH + (1 3

cH 3

(1

) cL

) cL

Já com relação aos lucros das …rmas em equilíbrio, observe que o lucro da …rma 1 será 1

=

[P (Q) q1

=

(P (Q)

cq1 ] + (1 c) q1 + (1

= (P (Q) c) q1 a + c + cH + (1 = 3 2c + cH + (1 9

(a

=

) [P (Q) q1 ) (P (Q) ) cL

c

cq1 ]

c) q1 a

2c + cH + (1 3

) cL

) cL )2

Para mostrarmos que o raciocínio acima está correto, tome a função lucro da …rma um um pouco mais “aberta”, 1

=

[P (q1 + q2 (cH )) q1

=

[(a

q1

q2 (cH )) q1

= (a

c

q1 ) q1

= [a

c

q1

cq1 ] + (1 cq1 ] + (1

q2 (cH ) q1 q2 (cH )

) [P (q1 + q2 (cL )) q1

(1

(1

) [(a

q1

cq1 ]

q2 (cL )) q1

cq1 ]

) q2 (cL ) q1

) q2 (cL )] q1

Ou seja,

1

2

6 = 4 =

"

a 2c+ cH +(1 )cL 3 (1 ) a 2cH +c + cL ) 3 6 (cH a 2cL +c (1 ) cL ) 3 6 (cH a c a 2c+ cH3+(1 )cL a 2cH +c (1 ) a 2c3L +c 3

a

c

121

3 7 5

#

a

a

2c + cH + (1 3 2c + cH + (1 3

) cL

) cL


tal que 3

1

3

1

3

1

"

3a 3c a + 2c cH (1 = (a 2cH + c) (1 ) (a " # 2a c + cH + (1 ) cL = a c a c+ a+ c = [a

2c + cH + (1

) cL ]

a

) cL 2cL + c) a

#

a

2c + cH + (1 3

2c + cH + (1 3

2c + cH + (1 3

) cL

) cL

) cL

e portanto 2c + cH + (1 ) cL )2 1 9 exatamente a mesma expressão inicial. Como é comum em Cournot, repare que O lucro da …rma 2 ine…ciente, de custo alto, será por sua vez =

2 (cH )

(a

1

= q12 .

= (P (Q) cH ) q2 a 2cH + c (1 ) a + c + cH + (1 ) cL cH + (cH cL ) = 3 3 6 a 3cH + c + cH + (1 ) cL a 2cH + c (1 ) = + (cH cL ) 3 3 6 a 2cH + c cH cH + (1 ) cL a 2cH + c (1 ) = + + (cH cL ) 3 3 3 6 a 2cH + c (1 ) 1 1 a 2cH + c (1 ) = + (cL cH ) = + (cH 3 3 2 2 3 6 a 2cH + c (1 ) a 2cH + c (1 ) = + (cH cL ) ( 2) + (cH cL ) 3 6 3 6

e portanto agora teremos 2 (cH ) 6= (q2 (cH ))2 , o que é bastante comum em Cournot. Para podermos ter uma interpretação mais direta do lucro da …rma 2 de custo alto, considere a expressão abaixo a + c + cH + (1 ) cL a + c ( cH + (1 ) cL ) cH cH 3 3 a + c 3cH + cH + (1 ) cL a + c 3cH ( cH + (1 ) cL ) = 3 3 9 2 (cH ) = (a + c 3cH + cH + (1 ) cL ) (a + c 3cH ( cH + (1 ) cL )) 2 (cH )

=

3cH )2

= (a + c + (a + c = (a + c

(a + c

3cH ) ( cH + (1

3cH ) ( cH + (1 3cH )2

) cL )

) cL ) +

( cH + (1

) cL )2

) cL )2

( cH + (1

tal que 2 (cH )

=

(a + c

3cH )2

122

( cH + (1 9

) cL )2

cL )


Logo 2 (cH )

0 () a + c

3cH > cH + (1

) cL

ou seja, se a+c

(1 ) cL 3+ Analogamente para a …rma 2 de custo baixo, teremos cH

2 (cH )

=

(a + c

3cL )2

( cH + (1 9

) cL )2

de modo que o lucro dessa …rma não será negativo se e somente se 2 (cL )

> 0 () a + c

3cL > cH + (1

) cL

isto é, se cL

6 6.1

a+c 3 + (1

cH )

Informação assimétrica e teoria dos contratos Introdução

O objeto de análise em ambientes de informação assimétrica é de…nido a partir das propriedades dos contratos nesse tipo de ambiente vis-à-vis situações de simetria. Nesse sentido, vamos considerar casos onde a assimetria surge quando (i) o contrato já foi …rmado e o tipo do agente é determinado endogenamente (moral hazard), (ii) antes de o contrato ser feito e com o tipo determinado exogenamente (seleção adversa) e (iii) a parte informada revela alguma informação privada sobre o seu tipo via comportamento individual antes de o contrato ser estabelecido (sinalização). Em todos esses ambientes invariavelmente vamos considerar que todo o poder de barganha pertence ao principal. Um “agreement” será ofertado apenas àqueles que satis…zerem determinadas características e o pagamento ofertado varia de acordo com essas características. Em um ambiente sem informação assimétrica caracterizamos então os contratos ótimos e as variáveis que in‡uenciam essas caracteísticas em função do comportamento dos agentes envolvidos.No setup que nós vamos analisar a característica central está relacionada à noção de incentivos que surgem quando da presença de informação assimétrica. Tome então um relacionamento onde um principal P deseja contratar um agente A e para isso estabelece um contrato de modo a monitorar o agente. O P oferta o contrato ao A que o aceita ou não. O A aceita se e somente se a utilidade esperada de aceitá-lo for maior do que a utilidade de não aceitá-lo; uma utilidade de reserva que

123


re‡ete o custo de oportunidade de aceitar o contrato. Como o A não pode fazer uma contraproposta ao P , segue que todo poder de barganha pertence ao P . Se o A aceita o contrato, ele deve decidir uma ação a tomar. No nosso “benchmark” essa ação se refere a quanto se dedicar ao trabalho, o quanto se esforçar, o que vai afetar o resultado do relacionamento e que tem um custo para o A. Notemos que os interesses das partes são claramente con‡itantes: o custo de um (o quanto o P paga ao A) é a remuneração de outro e o esforço do A, que lhe gera desutilidade, favorece ao P . De…nição 66 Um contrato é um compromisso entre as partes onde as obrigações de cada um estão especi…cadas para toda contingência possível. Um contrato só pode ser estabelecido a partir de variáveis veri…cáveis, que são passivas de serem checadas por um árbitro exógeno. Na presença de variáveis não veri…cáveis é difícil recorrer a uma instância legal, de modo que nesse caso as partes têm incentivos para quebrar os termos do contrato. Dado isso, as partes não assinariam o contrato, pois esse não seria respeitado e não haveria punição para a quebra. De…nição 67 Informação diz respeito à variáveis veri…cáveis no contrato. Notemos então que um contrato não pode ser estabelecido sob uma variável não veri…cável (por exemplo, o esforço de um funcionário qualquer) de modo que o A tem uma vantagem informacional sobre o P . Nesse ambiente o objetivo é analisar situações nas quais uma parte sabe coisas relevantes que a outra parte não sabe. 6.1.1

Dinâmica do relacionamento

Como “benchmark”, tome uma situação onde o P e o A têm a mesma informação sobre o objeto de troca e a escolha do A, o seu esforço, é veri…cável. Ainda que não haja informação assimétrica no setup acima, esta pode ser imperfeita no sentido de que algum elemento aleatório ao comportamento do A pode vir a afetar o relacionamento. Para incorporar essa possibilidade, considere que a natureza N decide sobre alguma coisa, determinando o estado de natureza. Dado isso, o resultado do relacionamento se realiza e os ganhos dos participantes são dados. A …gura abaixo mostra a essa dinâmica …gura1 (aqui) A solução desse jogo é determinada através do(s) equilíbrio(s) de Nash perfeito(s) em subjogo(s). Disso decorre que em cada ponto do tempo a estratégia adotada pelos jogadores é ótima sobre todas as possibilidades: o A escolhe a sua ação (esforço) que maximiza a sua utilidade esperada dado que ele aceitou o contrato. Como o P antecipa o comportamento do A, então para cada estado factível ele oferece um formato de contrato que maximiza a sua utlidade esperada. 124


6.2

Informação simétrica: …rst-best

Como dito acima, ainda que não haja assimetria de informação, há um resultado aleatório aos participantes. Essa aleatoriedade não é perfeita na medida em que o resultado é afetado parcialmente pelo comportamento do A e que caracteriza o risco do ambiente. Iremos mostrar que o solução do problema acima nos dará os ganhos do A e do P como função da distribuição ótima do risco entre eles, o que de resto vai depender do grau de aversão ao risco dos participantes em cada ambiente. 6.2.1

Descrição do modelo

Considere um setup aonde um P propõe um contrato a um A que pode aceitá-lo ou não. Se o A aceita, um resultado decorre desse relacionamento e assume um valor x 2 X, onde X = fx1 ; x2 ; :::; xn g é conjunto de resultados factíveis, cada um associado a um estado de natureza. x 2 X depende de e -a ação (esforço) escolhido pelo A- e da distribuição de X, que assumimos ser de conhecimento comum. Note então que X é uma variável aleatória. Tome X …nito e seja pi (e) = p [x = xi =e] a probabilidade condicionada ao esforço n P exercido pelo agente de ocorrer xi 2 X. Além disso, pi (e) > 0 8i = 1; :::; n e pi (e) = i=1

1. Devemos sempre ter em mente que como a disctribuição de X é de conhecimento comum, então ambos, P e A, têm a mesma distribuição a priori sobre X. Considerando a utilidade von Neumann-Morgenstern para o P e o A, as preferências do P são descritas por UP = B (x w (x)) 0

00

onde x 2 X e w (x) é a remuneração paga ao A. Assumimos B > 0 e B 0, de modo que a concavidade de B indica um principal neutro ou avesso ao risco. É relevante observar que a utilidade do principal não depende diretamente da ação e tomada pelo agente, mas tão somente do resultado do relacionamento e do pagamento acordado associdado àquele resultado. As preferências do agentes são tais que UA = u (w (x))

v (e) :

O fato de tais preferências serem aditivamente separáveis em w e e garante que o grau 00 0 0 de aversão ao risco não é afetado pelo esforço. Assumimos u > 0, u 0, v > 0 e 00 v 0. Essa última condição nos informa que a desutilidade marginal da ação, do esforço, não é decrescente. De UP e UA acima podemos estabelecer os con‡itos que emergem no relacionamento, w; e; x: o contrato torna tais con‡itos compatíveis. 125


6.2.2

O contrato de informação simétrica

Com todo informação relevante veri…cável, buscamos o ENPS do jogo acima. Daí o P desenha um contrato que o A aceita nas melhores condições ao P ; semelhante à indução retroativa. Nesse ambiente o P escolhe a ação e que ele deseja que o A exerça e o salário que ele pagará, fw (xi )gni=1 condicional à realização de X. Para isso ele considera os contratos aceitáveis (que satisfazem a restrição de participação) para o A e escolhe o mais barato. É uma situação e…ciente (veremos isso adiante) e a questão central torna-se achar qual o risk-sharing ótimo entre os participantes emerge do relacionamento. Formalmente, o problema do P é n P

max

pi (e) B (xi w (xi )) fe;[w(xi )]ni=1 g i=1 n P s. a pi (e) u (w (xi )) v (e) U : i=1

Ou seja, o principal maximiza o excedente que ele obtém do relacionamento sob a restrição imposta pela presença do custo de oportunidade de o agente aceitar o contrato, n P pi (e) u (w (xi )) v (e) U . Essa restrição já foi discutida acima e em geral é de…nida i=1

como restrição de racionalidade individual (IR). O contrato tem dois componentes,

fe; [w (xi )]ni=1 g quais sejam a ação e a remuneração condicionada aos resultados. Decorre então que o contrato inclui uma penalização su…cientemente grande para que o A tome o esforço combinado. O Lagrangeano associado ao problema acima é tal que " n # n X X L= pi (e) B (xi w (xi )) + pi (e) u (w (xi )) v (e) U i=1

i=1

onde as condições de primeira ordem nos mostram que @L = @w (xi ) de modo que

0

pi (eo ) B (xi

o

wo (xi )) +

o

0

pi (e) u (wo (xi )) = 0

0

B (xi wo (xi )) = ; 8i = 1; :::; n: u0 (wo (xi ))

Observe que eo é o esforço e…ciente e (wo (xi ))ni=1 a remuneração associada a ele. Além disso, as condições de Kuhn-Tucker implicam que ) ( n X min ; pi (e) u (w (xi )) v (e) U = 0 i=1

126


Proposição 68

> 0:

Prova. Suponha que não, de modo que

n P

pi (e) u (w (xi ))

v (e)

U > 0. Então

i=1

o P poderia extrair mais renda ao diminuir w (xi ) em todo o espaço de resultados possíveis sem afetar a restrição de participação do A. Para um P racional, segue que n P pi (e) u (w (xi )) v (e) U = 0 e que > 0. i=1

O mecanismo ótimo de pagamentos Das CPO’s temos que a distribuição ótima de riscos implica que a equação o

0

=

B (xi wo (xi )) = cte > 0 u0 (wo (xi ))

é satisfeita. Logo as TMS se igulam entre os estados, caracterizando uma alocação e…ciente de risco. Para vermos esse resultado na Caixa de Edgeworth, tome X = fx1 ; x2 g. Segue então que o Lagangeano associado à esse problema seria L = p1 (e) B (x1

w (x1 ))+p2 (e) B (x2

w (x2 ))+ [p1 (e) u (w (x1 )) + p2 (e) u (w (x2 ))

de modo que as CPO’s implicariam que 0

0

B (x2 w (x2 )) B (x1 w (x1 )) = 0 u (w (x1 )) u0 (w (x2 )) p1 (e) u (w (x1 )) + p2 (e) u (w (x2 )) = v (e) U

Figura2 (aqui) Observação 69 a restrição de participação elimina contratos abaixo de U . Como isso é de conhecimento comum, o contrato ótimo vai estar em U . Observação 70 as retas de 450 representam “coisas certas” para o P e para o A: ali o resultado é w1 = w2 para o A e w1 x1 = w2 x2 para o P , portanto invariante ao resultado, ao componente aleatório. P e A avessos ao risco O contrato ótimo estará entre as linhas de 450 e portanto o risco será dividido de acordo com o grau de aversão ao risco de cada um. Para vermos isso, lembre que, das CPO’s, 0

pi (e) B (xi

0

wo (xi )) + pi (e) u (w (xi )) = 0;

Derivando em relação a xi obtemos 00

B (:) 1

0

00

0

w (xi ) + u (:) w (xi ) = 0: 127

> 0:

v (e)

U]


Como

=

0

B (:) , 0 u (:)

segue que 00

0

0

B (:) 1

w (xi ) +

00

B (:) u (:) 0 w (xi ) = 0 u0 (:) 00

B (:) B 0 (:)

de modo que, de…nindo o grau de aversão ao risco absoluta do principal como RP = e o do agente como

RA =

00

u (:) u0 (:)

, obtemos 00

0

w (xi ) =

B (:) B 0 (:) B 00 (:) B 0 (:)

u00 (:) u0 (:)

+

=

RP 2 [0; 1] : RP + RA

Ou seja, o A recebe apenas uma parte, em salário, de um aumento eventual no produto. Note por …m que quanto mais avesso o A maior RA e portanto menos indexado à incerteza ele está.

0

P neutro e A avesso ao risco Nesse caso, para a condição de otimalidade wo (x

0

B (xi i )) u0 (wo (xi ))

0

o

=

(wo (xi )) ; i

= cte > 0, o fato de que B (:) = cte implica que u = 1; :::; n também é constante. Com o A avesso ao risco, a única possibilidade que emerge do 0 0 fato de que u (w (xi )) = u (w (xj )) ; 8xi ; xj 2 X é que w (xi ) = w (xj ) = wo

8xi ; xj 2 X:

Logo, no ponto ótimo o payo¤ do A é invariante ao resultado e todo o risco está com o P. Figura3 (aqui) Observação 71 o contrato ótimo está no ponto em que as curvas de indiferença relacionadas às preferências do P tangenciam U , na reta de 450 do A. Note então que w (x1 ) = w (x2 ) = wo implica em nenhum risco associado ao A. Por outro lado, x1

w (x1 ) 6= x2

w (x2 ) 8 x1 6= x2

de modo que o P segura totalmente o A, assumindo integralmente o risco. Como no ótimo

> 0, então

n P

pi (eo ) u (wo (xi ))

i=1

u (wo ) = v (eo ) + U

de modo que o salário oferecido pelo P é wo = u

1

(v (eo ) + U )

128

v (eo )

U = 0 equivale a


P avesso e A neutro ao risco: franchise Pelo mesmo motivo argumentado 0

o

0

0

i w (xi )) acima, o = B u(x0 (w = cte > 0, o fato de que u (:) = cte implica que B (xi o (x )) i 1; :::; n também é constante. Com o P avesso ao risco, segue que 0 0 B (xi w (xi )) = B (xj w (xj )) ; 8xi ; xj 2 X de maneira que

wo (xi ) = xj

xi

wo (xi )) ; i =

wo (xj ) = k, cte:

Temos portanto que o payo¤ do P é invariante ao estado da natureza e todo o risco é alocado para o A. Observação 72 o contrato ótimo vai estar na linha de 450 do P , quando U tangencia as preferências do P . Como x1

w (x1 ) = x2

w (x2 ) = k

segue que wo (xi ) = xi

k

de modo que w (x1 ) 6= w (x2 ) 8 x1 6= x2 Nesse caso o P não incorre em nenhum risco, que será totalmente alocado para o A. Observação 73 Do modelo acima, temos que wo (xi ) = xi k será a oferta do P ao A, que aceita. Note que o resultado é semelhante à uma franquia : o A …ca com o resultado e paga um montante …xo (k) ao P , invariante à realização dos estados. Da restrição de participação do A, temos que

n P

pi e0 u w0 (xi )

i=1

Para um A avesso ao risco, podemos fazer n X

pi e0 w0 (xi ) = U + v e0

i=1 n X

pi e0 (xi

k) = U + v e0

i=1

e segue daí que a oferta ótima de remuneração será wo (xi ) = xi wo (xi ) = xi

k n X

pi e0 xi + U + v e0

i=1

129

v e0 = U .


O nível ótimo de esforço P neutro e A avesso ao risco Como vimos,

n P

pi (eo ) u (wo (xi )) = v (eo ) +

i=1

U ; w = cte, tal que u (wo ) = v (eo ) + U wo = u O P portanto max e

n X

1

(v (eo ) + U )

pi (eo ) B xi

u

1

(v (eo ) + U )

i=1

ou ainda, para um P neutro ao risco, n X max pi (e) xi e

i=1

u |

1

(v (eo ) + U ) {z } w0

As CPO’s desse problema implicam que 0 0 n X v (eo ) v (eo ) 0 pi (eo ) xi = 0 o = 0 : u (w ) u (v (eo ) + U ) i=1

Exercício 74 Mostre que para que a CPO acima seja uma condição su…ciente para o nível ótimo da ação (esforço) temos que n X

00

pi (eo ) xi

0:

i=1

P avesso e A neutro ao risco Acima mostramos que nesse caso wo (xi ) = n P xi pi e0 xi + U + v e0 . A decisão da ação ótima (e) decorre do problema do A i=1

de

max e

n X

pi (e) w (xi )

v (e) = max e

i=1

max e

n X

pi (e) xi

n X

pi (e) (xi

k

v (e)

k)

v (e)

i=1

i=1

e desse problema decorre as CPO’s: n X

0

0

pi (eo ) xi = v (eo )

i=1

Isto é, o ganho marginal esperado do esforço iguala o custo marginal do esforço. n 00 P Exercício 75 Mostre que pi (eo ) xi 0 é uma condição su…ciente para que a CPO i=1

acima seja um máximo global.

130


6.3

Trade-o¤ entre incentivos e risk-sharing: moral hazard

Moral hazard ocorre em um relacionamento quando a ação do A não é veri…cável pelo P ou quando o A recebe algum tipo de informação privada após o estabelecimento do contrato. Nesse caso o P não pode controlar diretamente a ação do A. No nosso setup o esforço e do A não é veri…cável e portanto não pode ser explicitamente incluído no contrato; o ganho do A não depende diretamente da ação que ele toma. A dinâmica do jogo é tal que …gura4 (aqui) Pode também ocorrer que antes de tomar a sua ação o A observe o estado de natureza e o P não. Daí …gura5 (aqui) e a dinâmica do jogo é a mesma. O fato de ação escolhida pelo A não ser veri…cável pelo P vai implicar em perda de e…ciência no relacionamento especi…cado, alterando o tipo de contrato ofertado e as escolhas ótimas em relação à situações de simetria. Além disso disso, o contrato ótimo agora será determinado pelo trede-o¤ entre dois objetivos con‡itantes: e…ciência (no risk-sharing, seguro, ótimo) e incentivos ao A (risco adicional). Segue dessa estrutura que para o contrato ter o poder de in‡uenciar o comportamento do A, o P deve pagar mais por um ”bom sinal” (resultado) que informa sobre o tipo de A. 6.3.1

Introdução

O modelo que nós iremos analisar é semelhante ao modelo da seção anterior exceto pelo fato de que o esforço e não é veri…cável pelo P , ainda que o resultado desse esforço o seja ao …m do período. Para entendermos a natureza exata do problema, suponha que o P ofereça um contrato de …rst-best ao A quando a ação e não é observável. Tome um P neutro e um A avesso ao risco. Como vimos, nesse caso o A teria uma remuneração constante w (xi ) = w (xj ) = wo 8xi ; xj 2 X de modo que, substituindo na restrição de participação, u (wo ) = v (eo ) + U , com todo o risco sendo alocado ao P . Como a ação e não é veri…cável, se o contrato acima for ofertado a melhor resposta 0 que o A pode dar é aceitá-lo e exercer o menor esforço possível (pois v (e) > 0), de maneira que o retorno esperado do P seria menor do que o correspondente no caso simétrico, já que em{n é menor do que o e…ciente, eo . Essa reação seria antecipada pelo P , que proporia a remuneração i h wo = wm{n = u 1 U + v em{n . 131


Segue que, como (eo ; wo ) 6= em{n ; wm{n caracteriza-se ine…ciência. Para lidar com essa situação o P irá tomar o ganho do A como dependente do estado, de modo que a remuneração não seja mais constante como em …st best, ainda que tenhamos um P neutro e um A avesso ao risco. 6.3.2

Moral Hazard: otimalidade em second best

Com e não observável, ao propor o contrato (w; e), o P deve estar certo que a ação requerida seja aceita pelo A. Isso signi…ca que ( n ) X e 2 arg max pi (e) u (w (xi )) v (e) . e

i=1

Essa restrição é dita restição de compatibilidade de incentivos (IC).e re‡ete, nesse setup, a presença de moral hazard: dado que o contrato foi aceito e a ação e não é observável, o A escolhe e que maximiza o seu ganho esperado. Disso decorre que o problema do P passa a ser n P

pi (e) B (xi w (xi )) fe;[w(xi )]ni=1 g i=1 n P st pi (e) u (w (xi )) v (e) U max

i=1

e 2 arg max e

n P

pi (e) u (w (xi ))

v (e)

i=1

Escolha com e 2 eH ; eL Considere que o espaço de ações do A seja eH ; eL tal H L que v e > v e . Para um P neutro e um A avesso ao risco, qualquer desvio da forma contratual padrão se deve a presença de moral hazard. Seja então X = fx1 ; x2 ; :::; xn g ;

H

pi e

L

pi e

H

= p x = xi =e

L

= p x = xi =e

x1 < x2 < ::: < xn

; pi eH > 0 8x 2 X e L

, pi e

> 0 8x 2 X e

X

pi eH = 1

i

X

pi eL = 1

i

Se o P prefere e = eL , basta ofertar um salário …xo, independente do resultado. Nesse caso o A escolheria e = em{n = eL de modo que w = wm{n = u

1

U + v eL

onde u wL |

v eL

{z

u wH

IC

132

v eH

}


é naturalmente satisfeita na medida em que a remuneração é constante. Por outro lado, se o P preferir eH , o seu problema seria n P

max

fe;[w(xi )]ni=1 g n P i=1

pi eH u (w (xi ))

n P

v eH

i=1

onde, notemos,

w (xi ))

i=1

pi eH u (w (xi ))

st

n P

pi eH B (xi

v eH

U

pi eL u (w (xi ))

v eL

i=1 n X

n X

pi eH <

i=1

pi eL

i=1

8k = 1; 2; :::; n

1

que mostra que maus resultados ocorrem com mais frequência quando o A trabalha sem muito do esforço do que quando trabalha duro, caracterizado dominânica estocástica de primeira ordem, p x > xk =e = eH > p x > xk =e = eL Com o P neutro ao risco, o problema seria max

e;[w(xi )]n i=1

f

st n P

n P

g

n P

pi eH (xi

w (xi ))

i=1

pi eH u (w (xi ))

v eH

U

i=1

pi eH

pi eL

u (w (xi ))

v eH

v eL

i=1

de maneira que as condições necessárias implicariam que, 8i = 1; :::; n, pi eH = pi eH + u0 (w (xi )) onde

pi eH

pi eL

é o multiplicador de Lagrange associado à IC. Somando as restrições obtemos # ( ) " n n n n X X X X pi eH = pi eH + pi eH pi eL u0 (w (xi )) i=1

i=1

i=1

i=1

Segue que na divisão ótima de risco (second best), ( ) n X pi eH = u0 (w (xi )) i=1

onde, como já vimos,

> 0, pois

n P

pi eH u (w (xi ))

i=1

133

v eH = U .


Proposição 76

> 0.

Prova. Por contradição, suponha que não, que = 0. Nesse caso a restrição de incentivos não estaria ativa (voltaríamos ao caso sem assimetria, com e veri…cável) e daí w = wm{n ; e = em{n . Logo > 0 tal que n X

pi eH u (w (xi ))

v eH =

i=1

n X

pi eL u (w (xi ))

v eL

i=1

Segue da proposição acima que há um custo incidindo sobre o P decorrente da não observalidade de e (moral hazard). Analisando a CPO, façamos " # pi eL 1 1 = + pi (eH ) u0 (w (xi )) tal que w (xi ) = u

0

1

8 <

: +

h

1 1

pi (eL ) pi (eH )

i

9 = ;

pi (eL ) Ou seja, quanto maior a razão p (eH ) menor será a remuneração w, caracterizando i antes de mais nada o fato de que nesse setup o salário não é …xo, ainda que o P seja neutro e o A avesso ao risco. Note que isso decorre do fato de que > 0 (se = 0 então a remuneração seria constante entre os estados de natureza), oque caracteriza o custo que incide sobre o P em função da presença de moral hazard; os ganhos do P na presença de moral hazard são estritamente menores do que os seus ganhos em situação de simetria. Seguindo a análise acima, podemos genericamente fazer ! pi eL 0 w (xi ) = f ; f <0 H pi (e )

onde

pi (eL ) pi (eH )

é dita razão de verossimilhança e nos informa a precisão na qual o resultado

realizado xi sinaliza que o esforço exercido foi eH - uma redução na razão de verossimilhança é um aumento na probabilidade de que o esforço exercido foi eH quando o resultado observado foi xi . É portanto uma estatística do esforço do A, não tão informativa quanto o esforço em si mas o su…ciente para que o P pague (dê incentivos) ao A por resultados melhores. Observação 77 No caso onde a ação e era veri…cável, se ambos P e o A são avessos ao risco, vimos que é efeciente distribuir o risco de acordo com o grau de aversão ao 134


risco de cada um. Essa proposição continua sendo verdadeira na presença de moral hazard, porém com uma razão adicional, os incentivos que o P fornece ao A para realização de uma dada ação. Um ponto particularmente relevante que decorre da análise acima é que 8 9 < = 0 1 1 w (xi ) = u não implica que sempre será ótimo pagar salários : + 1 pi (eHL ) ; p i (e

)

maiores para resultados melhores (salários monótonos no resultado). Por exemplo, em situações onde a probabilidade de resultados ruins e de resultados muito bons são altas e a probabilidade de resultados intermediários é baixa, é preferível indexar salários maiores à resultados ruins do que intermediários. 0 Uma condição necessária para que w (xi ) > 0 é que a razão de verossimilhança, pi (eL ) , seja decrescente em xi . Nesse caso dizemos que vale a “propriedade de monotonipi (eH ) cidade da razão de verossimilhança, MLRP”. Segue que se a MLRP é satisfeita, então pi eL pj eL < pi (eH ) pj (eH )

8 xj > xi ,

o que mostra que a razão é tanto mais informativa sobre o a ação e do A quanto maior for o resultado. 8 9 < = 0 1 1 Como no ótimo w (xi ) = u , então L : + 1 pi (eH) ; p i (e

)

0

1- se pi = pi , então w (xi ) = u 1 1 = cte, de modo que w (xi ) = w (xj ) = w 8 xi ; xj 2 X. Tomando w como referência, podemos facilmente ver então que 2- se pi eL > pi eH , w (xi ) < w e se 3- se pi eL > pi eH , w (xi ) > w. eL

eH

Proposição 78 A MLRP não é su…ciente para que

@w(xi ) @xi

> 0.

Prova. Exercício. Quando temos um principal neutro ao risco, note que se ele paga ao agente de acordo com o resultado é tão somente para lhe dar incentivos. Decorre daí que o P deve buscar um equilíbrio entre os benefícios de segurar o A - como no …rst best- e os benefícos de estabelecer os incentivos corretos. Para atingir esse objetivo, no contrato ele usa a única variável veri…cável como uma fonte de informação do comportamento do agente; o P usa o resultado nesse caso com um objetivo similar ao de um problema de inferência estatística. Segue então que o benefíco de introduzir o resultado no contrato é a informação que tal resultado fornece sobre o esforço do A. Por …m devemos notar que em última instância o P não se preocupa de fato com esse problema de inferência estatística na medida em que é ele quem efetivamente escolhe o 135


nível de esforço do A ao resolver o problema de otimização acima especi…cado; ele sabe com certeza como o A se comportará. O salário do A depende do resultado porque essa é a única maneira de in‡uenciar o seu esforço e não porque a escolha que ele faz sobre o esforço uma vez que o contrato foi estabelecido não seja previsível. Continuum de ações: a abordagem de primeira ordem Stole.

6.4

Seleção adversa

Vamos tratar agora de situações de informação assimétrica onde a assimetria surge antes da confecção do contrato. Nessa estrutura a parte que estabelece as condições do contrato, o P , tem menos informação do que a outra parte, o A, sobre alguma característica importante que afeta o valor do contrato. Nós abordaremos uma estrutura bastante simples com apenas um principal e um agente negociando um contrato sobre dois estados de natureza factíveis e os principais resultados que nós mostraremos é que (i) é ótimo para o principal oferecer um menu de contratos para cada tipo possível de agente, incorporando termos que façam com que cada agente escolha o contrato que foi desenhado para o seu tipo, (ii) no menu ótimo de contratos, o agente de tipo mais baixo (ou mais alto, dependendo do problema) vai obter exatamente a sua utilidade de reserva, enquanto todos os demais agentes vão obter alguma renda informacional que será crescente (decrescente) no tipo do agente. Note então que a existência dessa renda informacional vai caracterizar a ine…ciência de cada contrato associado ao tipo do agente. Por …m, (iii) o único contrato e…ciente será aquele desenhado e assinado pelo agente de tipo mais alto (baixo). 6.4.1

Introdução

Em relacionamentos contratuais o principal problema que surge decorre do fato de que via de regra as partes que compõem o contrato não têm toda a informação relevante sobre as outras partes52 . Nós usamos o termo seleção adversa quando a característica de um A é observada de uma forma imperfeita pelo P . O termo vem do exemplo de mercado de seguro: se uma companhia seguradora oferece o seu produto a um único preço baseado no risco médio da população, tal tarifa iria atrair apenas as pessoas de maior risco e portanto incorreria em perda de dinheiro pela …rma. Esse tipo de situação pode induzir a seguradora a transeferir algum risco para o segurado, mesmo quando esse é avesso ao risco e a …rma caracterize um P neutro ao risco. Se o agente tenta, como seria razoável supor, obter algum ganho de informação mantendo-a privada, o 52

Devemos notar que não apenas quando a vantagem informacional se dá em função de características “pessoais”nós caracterizamos a presença de seleção adversa. Quando há assimetria de informação com respeito a qualquer variável relevante no relacionamento contratual nós teremos exatamente o mesmo problema.

136


problema do principal passa a ser encontrar uma forma de reduzir a sua desvantagem informacional. Segue que essa dinâmica vai gerar uma situação claramente distinta do …rst-best no equilíbrio de mercado, caracterizando portanto ine…ciência. Considere então um P que é um vendedor de vinhos e um A que é um comprador. O A é um amador na degustação de vinhos e tanto pode ser um apreciador de bons vinhos quando ter gostos mais modestos. Nós vamos dizer que há dois “tipos”: um A so…sticado (que está disposto a pagar um quantia maior por um bom vinho) e outro cujas preferências são menos esmeradas. Assumiremos que o P não pode observar o tipo do A ou que a lei o proíba de descriminar perfeitamente preços entre os dois tipos. A chave para a solução do problema de seleção adversa é a seguinte: se o agente so…sticado está disposto a pagar mais do que o outro por um aumento na qualidade do vinho, então o P pode segmentar o mercado ofertando duas garrafas diferentes de vinho: ( um vinho de alta qualidade por um alto preço um vinho de baixa qualidade por um baixo preço Veremos abaixo como essas qualidade e os preços serão determinados otimamente. Se todos se comportam de acordo o esquema acima, o tipo so…sticado ecolheria o vinho de alta qualidade e de alto preço enquanto o agente de outro tipo selecionaria o vinho mais barato, de qualidade pior. Ou seja, os dois tipos de A “se revelam”através das suas escolhas. Nós veremos logo adiante que o consumidor de tipo baixo escolherá um vinho que será de qualidade inferior do que aquela que seria socialmente ótima. O ponto central nos problemas de seleção adversa é fazer com que os agentes revelem os seus tipos sem incorrer em distorções sociais muito signi…cativas. Antes de solucionar o problema acima, vamos ver alguns exemplos de seleção adversa que encontramos com alguma facilidade em diversas situações. no contexto de seguro de vida, o segurado sabe o seu próprio estado de saúde (e portanto qual o seu risco de morrer mais cedo ou mais tarde) melhor do que a …rma seguradora, ainda que ele tenha que fazer alguns tipos de exames médicos. Isso nos sugere que a seguradora deve oferecer vários pacotes de seguro, cada um desenhado especi…camente para uma classe de risco dos consumidores. os bancos costumeiramente encontram clientes cujo risco de default não podem ser monitorarados perfeitamente. Por exemplo, considere empresários que desejam …nanciamento para algum projeto arriscado. Uma idéia natural é usar a taxa de juros para discriminar entre os empresários; no entanto isso pode induzir um racionamento de crédito, a não ser que os bancos também variem os níveis de colateral.

137


no mercado de trabalho, empregadores se deparam com empregados em potencial que têm vantagem no que eles sabem sobre suas habilidades melhor do que as …rmas. Essa então pode discriminar os trabalhadores de modo a selecionar aqueles que ela deseja e descartar os demais. várias …rmas (estatais ou não) são reguladas pelo governo ou por agências reguladoras especializadas na área. Claramente a …rma regulada tem mais imformação sobre os custos e sua produtividade do que o regulador. Isso implica que a …rma muito provavelmente tentaria manipular a forma na qual ela informa o governo de modo a aumentar os seus lucros.

6.4.2

Um modelo discreto de discriminação de preços: Mussa-Rosen (1978)

Considere todas as informações acima sobre o relaciomento entre um consumidor e um vendedor de vinhos onde o vendedor oferta vinhos de qualidade distintas à preços distintos na tentativa de segmentar um mercado no qual as preferências dos consumidores são distintas - é portanto um modelo com diferenciação vertical e discriminação de preços de segunda ordem. O consumidor (agente) Seja um agente apreciador moderado de vinho que planeja comprar no máximo uma garrafa de vinho no período no qual nós estamos analisando. Suas preferências são descritas pela função utilidade U ( ; q; t) = u ( ; q)

t= q

t

onde q é a qualidade do vinho que ele compra, é um parâmetro positivo que indexa as suas preferências por qualidade e t é o preço do vinho. Se ele decide não comprar o vinho a sua utilidade é zero. Com essa especi…cação, 8

0

> ; u (q; )

u (q; ) é crescente em q.

Observação 79 A especi…cação acima é a forma discreta da condição de SpenceMirlees, ou “single-crossing property”: em um determinado nível de qualidade, os consumidores mais so…sticados (maior ) estão dispostos a pagar mais do que os consumidores de baixa qualidade pelo mesmo aumento na qualidade. A conidição de SpenceMirlees implica que as curvas de indiferença de agentes de tipos distintos se cruzam, duas a duas, em um único ponto. Na verdade é essa propriedade que nos permitirá segmentar o mercado pela qualidade. 2 U (q; ) No caso contínuo, essa condição seria @ @q@ = 1 > 0, de modo que a utilidade marginal da qualidade é crescente no tipo do agente: um aumento na qualidade do 138


vinho tem um impacto maior na satisfação de um consumidor de tipo alto do que no consumidor de tipo baixo. Há dois valores possíveis para : L < H , o que nos permite identi…car o tipo do consumidor (baixa ou alta qualidade). Esse tipo é de informação privada de cada agente mas a sua distribuição é conhecimento público e de conhecimento comum. Temos então que a distribuição de tipos é dada por ( L ; H ) v ( ; 1 ). O vendedor (principal) O P é um monopolista local no mercado de vinho. Ele pode produzir vinhos de qualquer qualidade q 2 (0; 1) e produzir uma garrafa de 0 0 vinho de qualidade q custa c (q) para ele. Note que c (0) = 0; c (1) = 1, c (q) > 0 e 00 c (q) > 0. Suas preferências são descritas pela função abaixo V =t

c (q)

exatamente a diferença entre sua receita e o seu custo. 6.4.3

First-best: discriminação perfeita

Se o produtor pode observar o tipo (

i

(i = H; L) do agente, o seu problema será

max [ti

c (qi )]

i qi

0; i = L; H

qi ;ti

st

ti

Como todo poder de barganha é do principal, então max [ i qi

i qi

ti = 0, de modo que o P

c (qi )]

qi

As condições de primeira ordem do problema acima nos mostram que no …rst-best i

ti

0

= c (qi ) =

i qi

7 ! ti =

0

ic

1

( i)

Segue então que ti =

i qi

0

e qi = c

1

( i)

i=L;H

é o contrato ótimo ofertado para um consunidor de tipo i , que por construção leva a um resultado e…ciente: o P extrai todo o excedente e o consumidor A …ca com sua utilidade de reserva, 0 no caso. …gura 6 (aqui)

139


Na …gura acima …ca claro que (qL ; qH ) são as qualidades e…cientes. Note então que 00 0 como qi = c 1 ( i ) e c > 0, então o fato de que H > L implica que53 qH > qL , de modo que tH > tL . Esse tipo de discriminação, chamada de discriminação de preços de primeiro grau (ou discriminação perfeita), geralmente não é permitida por lei - a venda dever ser anônima e não se pode negar a um indivíduo qualquer um contrato que está sendo ofertado para outro. Entretanto nós vamos abordar o caso em que o vendedor não pode observar diretamente o tipo do agente, de modo que torna-se impossível praticar discriminação perfeita, independente do arcabouço legal. 6.4.4

Informação imperfeita: discriminação de segundo grau (preços nãolineares)

Suponha gora que nós estamos em uma situação de second-best no qual a informação é assimétrica: o tipo do A não é observável e o P sabe apenas a distribuição ( L ; H ) v ( ;1 ) dos tipos dos agentes. Proposição 80 se o P oferta o contrato de …rst-best (tL ; qL ), (tH ; qH ), mesmo escolhe (tL ; qL ), caracterizando seleção adversa. ( U ( H ; t L ; q L ) = H q L tL , então podemos ver que Prova. Como U ( H ; t H ; q H ) = H q H tH H qL H qH

tL =

H qL

L qL

tH

H qH

H qH

=

=(

L ) qL

H

H

>0

=0

de maneira que U ( H ; tL ; qL ) > U ( H ; tH ; qH ). Segue que o agente de tipo alto, H , prefere mentir e não se auto-seleciona. Concluímos portanto que o contrato (ti ; qi )i=L;H não é implementável54 para i desconhecido. Nesse caso há um equilíbrio com pooling, com ambos os tipos selecionando o mesmo contrato. Segue que o P pode aumentar seus lucros dando os incentivos corretos aos agentes para que estes revelem os seus tipos. Nesse sentido o programa do principal passa a ser max [ (tL qi ;ti

c (qL )) + (1 st

L qL H qH

L qL

53

54

tL tH

tL tH

H qH

) (tH

c (qH ))]

0 0

L qH H qL

tH tL 0

00

0

Isso é verdade na medida em que, como c > 0, o fato de que c (qH ) > c (qL ) implica que qH > qL . | {z } | {z } H

L

Para a nossa compreensão, vamos dizer que um contrato é implementável se ele satisfaz as restrições de compatibilidade de incentivos subjacente ao relacionamento.

140


de modo a garantir a implementalção do contrato ótimo sobre (IR) e (IC). as duas primeiras restrições acima são restrições de participação (ou restrição de racionalidade individual, IR) dos agentes e garantem que cada tipo de consumidor aceita o contrato desenhado para ele. as duas últimas restrições são as restrições de compatibilidade de incentivos, (IC), e nos mostram que cada consumidor, cada tipo, prefere o seu contrato do que o contrato de algum outro tipo qualquer. Vamos resolver o problema acima a partir de algumas digressões sobre as restrições especi…cadas. Proposição 81 tL = L q L .

L qL

tL

0 está ativa e

H qH

tH

0 não está, de modo que

Prova. Sabemos que H qH tH tL tL 0. Logo L qL tL H qL L qL 0 implica que H qH tH 0 de modo que H qH tH 0 é redundante. Como tL 0 está ativa no ótimo e todo poder de barganha é do principal, então L qL q t = 0 tal que L L L tL = L q L

Proposição 82 H qH tH Segue que tH tL = H (qH

H qL

tL está ativa e

L qL

tL

L qH

tH não está.

qL ).

Prova. Por contradição, suponha que não, que H qH tH tL não está H qL ativa. Segue então que H qH tH tL tL = 0 de maneira que seria H qL L qL possível aumentar tH sem violar H qH tH 0 ou qualquer restrição de incentivos. No ótimo tH

Proposição 83 qH

tH

tL =

H

tH

L qL

=

(qH +

qL ) H

(qH

qL )

qL

Prova. Como L qL tL qL ) L q H t H e H q H tH H qL tL , então H (qH tL qL ). Como H > L , então temos que qH qL . L (qH Dessa análise segue que o problema do principal pode ser posto como o problema

de 141


max [ (tL

c (qL )) + (1

qi ;ti

st

L qL

tL

q

H

) (tH

tH

c (qH ))]

0 tL

ou melhor55 , max [ ( qi

L qL

c (qL )) + (1

)(

H qH

qL

c (qH ))]

de modo que as condições de primeira ordem implicam que tal que (1 ) 0 L = c (qL ) + e (1

)

H

0

c (qL ) = (1

L

)

0

c (qH ) = 0 e daí H

0

= c (qH ) 7 ! qH = qH .

Como tL = L qL e tH = tL + H q, então o contrato ótimo (em second best) será tal que 8 > qH = qH > > > < tH = L qL + H (q q ) < tH , pois H qH (1 L L ) qL < tH H 0

> > > > :

qL = c

1

(1

L

tL =

L qL

)

< qL

< tL

Observação 84 Substituindo o resultado na função objetivo do principal, temos que max [ (

L qL

c (qL )) + (1

)(

max [ ( qi 2

L qL

c (qL ))

) qL

qi

6 max 6 4 ( qi

L qL

(1

H qH

qL

+ (1 (1

c (qL ))

c (qH ))]

|

)( )

{z

qL

H qH

c (qH ))]

+ }

custo informacional, ponderado por ( ;1

(1

)

(

H qH

)

3

7 c (qH ))7 5

Considerações …nais Da análise feita acima, os principais resultados são que o agente de tipo mais alto …ca com a alocação e…ciente, de …rst-best, qH = qH , 0 H = c (qH ). todo tipo de agente - exceto o de tipo mais baixo - é indiferente entre o seu contrato e o contrato do tipo imediatamente inferior. 55

Tome

q = qH qL . Fazemos então tH =

L qL + H

142

(qH

qL ) =

H qH

qL

, onde

=

H

L.


todo tipo de agente - exceto o de tipo mais baixo - tem um excedente (quase-renda informacional) que é crescente no tipo do agente: Ff (( )) ( i ) q ( ). todo tipo de agente - exceto o de tipo mais alto - tem alocação sube…ciente. Daí qi = qi 8i 6= H. 0 1 o agente de tipo mais baixo tem excedente zero:

6.5

Sinalização

essa parte (Salanié e notas do Felli).

143

F( ) f( )

B @|{z} i

C A q ( ) = 0.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.