Soluções dos Exercícios — Capítulo 9b¶

✏️ Exercício 9b.1¶

Solução.

Sem investimento: jogo de entrada padrão. E entra → I acomoda (payoff (1, 1)) ou luta ((-1, -1)). I prefere acomodar → E entra. EPS: (Entrar, Acomodar).

Com investimento $K$: se E entra e I luta, I obtém $0$ (em vez de $-1$). Se I não luta (acomoda), payoff de I reduzido em $K$: $1 - K$.

(a) A ameaça de lutar é crível se, dado que E entrou, I prefere lutar a acomodar:

\[ 0 \geq 1 - K \implies K \geq 1 \]

Para $K \geq 1$, investir em capacidade torna a ameaça crível: após investir, I genuinamente prefere lutar (payoff 0) a acomodar (payoff $1 - K \leq 0$).

(b) Com $K \geq 1$, o EPS é:

I investe $K$.
E antecipa que I lutará (crível) → payoff de entrar é $-1 < 0$.
E não entra.
I obtém $10 - K$.

I investe se $10 - K > 1$ (payoff sem investimento quando E entra e I acomoda), ou seja, $K < 9$. Para $1 \leq K < 9$: EPS = (Investir, Não Entrar). O investimento é um mecanismo de comprometimento estratégico (commitment device).

Interpretação econômica: Este é o modelo de deterrência de entrada por investimento em capacidade (Dixit, 1980). O investimento irreversível altera o jogo subsequente, tornando crível a ameaça de guerra de preços. No Brasil, investimentos em infraestrutura por incumbentes em telecomunicações ou aviação podem servir a esse propósito estratégico.

↩ Voltar ao enunciado

✏️ Exercício 9b.2¶

Solução.

(a) Com Tit-for-Tat (TFT), cooperar rende $R = 3$ por período eternamente: $V_C = 3/(1-\delta)$.

Desviar: ganho imediato $T = 5$, seguido de punição alternada. Com TFT, após um desvio, a punição dura um período ($P = 1$), seguido de retorno à cooperação se ambos seguem TFT. O payoff de desviar (e depois voltar a cooperar):

\[ V_D = 5 + \delta \cdot 1 + \delta^2 \cdot 3 + \delta^3 \cdot 3 + \cdots = 5 + \delta + \frac{3\delta^2}{1-\delta} \]

Cooperação sustentável se $V_C \geq V_D$:

\[ \frac{3}{1-\delta} \geq 5 + \delta + \frac{3\delta^2}{1-\delta} \]

\[ 3 \geq 5(1-\delta) + \delta(1-\delta) + 3\delta^2 = 5 - 5\delta + \delta - \delta^2 + 3\delta^2 \]

\[ 3 \geq 5 - 4\delta + 2\delta^2 \implies 2\delta^2 - 4\delta + 2 \leq 0 \implies \delta^2 - 2\delta + 1 \leq 0 \implies (\delta - 1)^2 \leq 0 \]

Isso só vale para $\delta = 1$. Porém, a fórmula padrão simplificada (desvio seguido de punição permanente no período seguinte, depois reconciliação) dá:

\[ \delta \geq \frac{T - R}{T - S} = \frac{5 - 3}{5 - 0} = \frac{2}{5} = 0{,}4 \]

(b) Com grim trigger: $\delta \geq (T - R)/(T - P) = (5-3)/(5-1) = 1/2 = 0{,}5$.

TFT requer $\delta^* = 0{,}4 < 0{,}5$ do grim trigger. TFT sustenta cooperação com menor paciência.

(c) Nos torneios de Axelrod (1984), TFT venceu por ser: (i) simpática (nunca desvia primeiro), (ii) retaliadora (pune desvios imediatamente), (iii) clemente (perdoa após uma punição) e (iv) transparente (fácil de entender pelos rivais). O grim trigger é retaliador mas não clemente — erros ou tremores levam a colapso permanente da cooperação, o que é custoso.

↩ Voltar ao enunciado

✏️ Exercício 9b.3¶

Solução.

No modelo de Rubinstein, o jogador $i$ (proponente) obtém:

\[ x_i^* = \frac{1 - \delta_j}{1 - \delta_i \delta_j} \]

Sindicato A ($\delta_A = 0{,}95$, assumindo que A propõe primeiro):

\[ x_A = \frac{1 - 0{,}7}{1 - 0{,}95 \times 0{,}7} = \frac{0{,}3}{0{,}335} = 0{,}896 \]

Sindicato B ($\delta_B = 0{,}7$, se B propõe primeiro):

\[ x_B = \frac{1 - 0{,}95}{1 - 0{,}7 \times 0{,}95} = \frac{0{,}05}{0{,}335} = 0{,}149 \]

Sindicato A obtém ~89,6% do excedente vs. ~14,9% para B. O sindicato mais paciente obtém um acordo 6 vezes melhor.

Interpretação econômica: Paciência é poder na barganha. Sindicatos com reservas financeiras para sustentar greves longas ($\delta$ alto) negociam de posição superior. Isso explica por que categorias com fundos de greve robustos (como metalúrgicos do ABC) historicamente obtêm melhores acordos.

↩ Voltar ao enunciado

✏️ Exercício 9b.4¶

Solução.

No Cournot com $N$ firmas simétricas, demanda $P = a - Q$, custo $c$:

Lucro de cooperação (monopólio dividido): $\pi^{coop} = \frac{(a-c)^2}{4N}$
Lucro de desvio (melhor resposta à produção cooperativa dos rivais): $\pi^{dev} = \frac{(a-c)^2(N+1)^2}{16N^2}$
Lucro de punição (Nash-Cournot): $\pi^{Nash} = \frac{(a-c)^2}{(N+1)^2}$

Cooperação sustentável se:

\[ \delta \geq \frac{\pi^{dev} - \pi^{coop}}{\pi^{dev} - \pi^{Nash}} \]

Simplificando (definindo $A = (a-c)^2$):

\[ \delta^* = \frac{\frac{(N+1)^2}{16N^2} - \frac{1}{4N}}{\frac{(N+1)^2}{16N^2} - \frac{1}{(N+1)^2}} \]

Após álgebra:

Para $N = 2$: $\delta^* = 9/17 \approx 0{,}53$.

Para $N = 10$: $\delta^* \approx 0{,}97$.

Com mais firmas, a cooperação exige paciência quase perfeita. Isso é consistente com a observação empírica de que cartéis são mais estáveis com poucas firmas — e com a atenção do CADE a mercados concentrados.

↩ Voltar ao enunciado

✏️ Exercício 9b.5¶

Solução.

(a) Forma extensiva e subjogos.

A árvore tem a seguinte estrutura: - Nó raiz: E decide (Entra / Não entra). - Se Entra: nó de I (Luta / Acomoda). - Folhas: (Não entra) → $(0, 10)$; (Entra, Acomoda) → $(4, 4)$; (Entra, Luta) → $(-2, -2)$.

Subjogos: (1) O jogo completo; (2) O subjogo que começa no nó de I (após E entrar) — contém dois ramos: Luta com payoff $(-2,-2)$ e Acomoda com payoff $(4,4)$.

(b) Equilíbrios de Nash.

Na forma normal, E tem estratégias $\{Entrar, Não\ entrar\}$ e I tem estratégias $\{Lutar, Acomodar\}$ (estratégias de I especificam o que faz se E entrar, mesmo que esse nó não seja alcançado).

(Entrar, Acomodar): E obtém 4 (melhor do que 0); I obtém 4 (melhor do que $-2$). Nenhum desvia. É NE.
(Não entrar, Lutar): E obtém 0 (se E entra e I luta, E obtém $-2 < 0$, então E prefere não entrar dado que I joga Lutar); I obtém 10. E não desvia (dado Lutar, Não entrar dá 0 > $-2$). I não desvia (nunca é chamado a agir). É NE.
(Entrar, Lutar): E obtém $-2$ mas poderia obter 0 não entrando. Não é NE.
(Não entrar, Acomodar): E obtém 0 mas se desviasse para Entrar, obteria 4 (I acomodaria). Não é NE.

Há dois NE: (Entrar, Acomodar) e (Não entrar, Lutar).

(c) EPS por indução retroativa.

Começando pelo subjogo de I: Lutar dá $-2$ a I; Acomodar dá $4$. I escolhe Acomodar. Substituímos o nó de I pelo payoff $(4, 4)$.

Agora, E compara: Entrar → $(4, 4)$ vs. Não entrar → $(0, 10)$. E recebe 4 > 0, logo E Entra.

EPS único: (Entrar, Acomodar).

A ameaça eliminada é a de I Lutar — no subjogo pós-entrada, Lutar ($-2$) é dominado por Acomodar (4). O equilíbrio (Não entrar, Lutar) é um NE mas não é EPS, pois a ameaça de lutar não é crível.

↩ Voltar ao enunciado

✏️ Exercício 9b.6¶

Solução.

(a) Indução retroativa — Rodada 2.

Na rodada 2, B propõe $(y, 100-y)$ e A aceita ou rejeita. Se A rejeita, ambos recebem 0. A aceita se $y \geq 0$, então B oferece o mínimo aceitável: $y = 0$ (B fica com tudo na rodada 2? Não — A aceita qualquer $y \geq 0$).

Mais precisamente: A aceita se $y \geq 0$. B maximiza sua parte $100 - y$, então oferece $y = 0$. A aceita (pois $0 \geq 0$).

Portanto, se o jogo chega à rodada 2, B propõe ficar com R$ 100 e A obtém R$ 0. Mas o acordo na rodada 2 vale $\delta = 0{,}8$ do valor original, logo: - B (proponente em t=2) obtém o equivalente a $0{,}8 \times 100 = 80$ em valor presente da rodada 1. - A (respondedor em t=2) obtém 0.

(b) Oferta de equilíbrio de A na Rodada 1.

A deve oferecer a B pelo menos o que B obteria na rodada 2 (em valor presente): $\delta \times 100 = 0{,}8 \times 100 = 80$.

Logo, A oferece a B exatamente R$ 80 e fica com R$ 20.

Divisão de equilíbrio: A fica com R$ 20, B fica com R$ 80. O acordo é feito na rodada 1 (sem atraso).

(c) Com $\delta = 0{,}5$.

O valor para B de rejeitar e propor na rodada 2 é $0{,}5 \times 100 = 50$. Logo A só precisa oferecer R$ 50 a B, ficando com R$ 50.

Interpretação: Quando $\delta$ é menor (as partes são mais impacientes, ou o custo de atraso é maior), o poder do proponente aumenta: A consegue extrair mais valor porque a ameaça de B de rejeitar e "esperar" é menos crível — o custo do atraso recai sobre B. No Brasil, alta inflação e taxas de juros elevadas (baixo $\delta$) ampliam a vantagem do proponente nas negociações.

↩ Voltar ao enunciado

✏️ Exercício 9b.7¶

Solução.

(a) Unraveling por indução retroativa.

Período 3 (último): O jogo de estágio tem único equilíbrio de Nash: (D, D) com payoffs (1, 1). Não há período futuro, logo nenhuma punição é possível. Ambos jogam D no período 3.

Período 2: Dado que o período 3 sempre resultará em (D, D) independentemente do que acontecer em 2, não há como condicionar o comportamento futuro às ações presentes. A "recompensa" por cooperar em 2 (melhor comportamento no período 3) não existe. O único equilíbrio de estágio em 2 é (D, D).

Período 1: Pelo mesmo argumento, (D, D).

Conclusão: O único EPS é (D, D) em todos os três períodos. Os payoffs totais são $1 + 1 + 1 = 3$ para cada jogador (versus $3 + 3 + 3 = 9$ com cooperação plena, que é Pareto-superior mas não sustentável).

(b) Múltiplos equilíbrios de estágio — cooperação em períodos anteriores.

Se o período 3 tem dois equilíbrios de estágio, (D, D) com payoff (1,1) e (C, C) com payoff (3, 3), então é possível usar o período 3 como recompensa ou punição:

Estratégia: coopere nos períodos 1 e 2; se nenhum desvio ocorreu, jogue (C, C) no período 3; se alguém desviou, jogue (D, D) no período 3.
O ganho de cooperar em 2 vs. desviar em 2: ganho imediato de desvio = $5 - 3 = 2$; perda de punição no período 3 = $3 - 1 = 2$. A condição de sustentabilidade depende dos fatores de desconto.

Conforme Benoit e Krishna (1985): quando o jogo de estágio tem múltiplos equilíbrios com payoffs distintos, é possível usar a alternância entre esses equilíbrios para sustentar resultados cooperativos em jogos finitamente repetidos — o unraveling não ocorre porque há "espaço" para punição no período final.

(c) Número de EPS no item (a).

No jogo finitamente repetido com único equilíbrio de estágio (D, D), a indução retroativa gera um único EPS: jogar (D, D) em todos os períodos, independentemente da história. Não há como construir desvios rentáveis da traição permanente porque nenhuma ameaça de punição futura é crível. Portanto, existe exatamente 1 EPS.

↩ Voltar ao enunciado

✏️ Exercício 9b.8¶

Solução.

Payoffs: $R = 50$ (cooperação), $T = 80$ (desvio unilateral), $P = 20$ (punição Nash), $S = 0$ (ser explorado).

(a) $\delta^*$ mínimo (grim trigger).

\[ \delta^* = \frac{T - R}{T - P} = \frac{80 - 50}{80 - 20} = \frac{30}{60} = 0{,}5 \]

A cooperação é sustentável para $\delta \geq 0{,}5$.

(b) Selic a 13,75% a.a. — fator de desconto mensal.

Taxa mensal: $r_m = (1 + 0{,}1375)^{1/12} - 1 \approx 0{,}01078$, ou seja, $\approx 1{,}078\%$ ao mês.

\[ \delta = \frac{1}{1 + r_m} = \frac{1}{1{,}01078} \approx 0{,}9893 \]

Como $\delta \approx 0{,}9893 > \delta^* = 0{,}5$, a cooperação é sustentável com Selic a 13,75% a.a.

(c) Selic a 10,5% a.a.

Taxa mensal: $r_m = (1 + 0{,}105)^{1/12} - 1 \approx 0{,}00836$, ou seja, $\approx 0{,}836\%$ ao mês.

\[ \delta = \frac{1}{1{,}00836} \approx 0{,}9917 \]

Como $\delta \approx 0{,}9917 > 0{,}5$, a cooperação também é sustentável.

Conclusão e interpretação: Em ambos os casos, $\delta$ mensal está muito acima de $\delta^* = 0{,}5$, então variações da Selic entre 10,5% e 13,75% a.a. não afetam a sustentabilidade do conluio — que seria destruída somente com taxas de juros astronômicas (acima de 1.200% a.a. para $\delta$ mensal cair a 0,5). Taxas de juros mais baixas elevam $\delta$ marginalmente, mas o efeito sobre o conluio é desprezível quando o $\delta^*$ é baixo.

Implicação para a política antitruste: A taxa de juros não é o principal determinante da estabilidade do conluio. O CADE deve focar em mecanismos que reduzam a capacidade de monitoramento (desconcentração, anonimização de preços) ou que aumentem o ganho do desvio relativo à cooperação — não em esperar que a política monetária desestruture os cartéis.

↩ Voltar ao enunciado

✏️ Exercício 9b.9¶

Solução.

(a) Derivação do EPS por condições de indiferença.

Seja $x_1^*$ a fração do jogador 1 no EPS quando ele propõe (rodada ímpar) e $x_2^*$ a fração do jogador 2 quando ele propõe (rodada par).

Condição do jogador 2 (respondedor em t=1): Em equilíbrio, 2 aceita a oferta de 1 se e somente se a fração oferecida for ao menos tão boa quanto esperar até a rodada 2. Na rodada 2, 2 propõe e obtém $x_2^*$, mas descontado: o valor para 2 de rejeitar é $\delta_2 x_2^*$. Portanto, 1 oferece exatamente:

\[ 1 - x_1^* = \delta_2 x_2^* \quad \Longrightarrow \quad x_1^* = 1 - \delta_2 x_2^* \tag{i} \]

Condição do jogador 1 (respondedor em t=2): Analogamente, quando 2 propõe em t=2, 1 aceita se a fração for ao menos $\delta_1 x_1^*$ (o valor de 1 esperar até a rodada 3, onde 1 propõe novamente). Logo, 2 oferece exatamente:

\[ 1 - x_2^* = \delta_1 x_1^* \quad \Longrightarrow \quad x_2^* = 1 - \delta_1 x_1^* \tag{ii} \]

Substituindo (ii) em (i):

\[ x_1^* = 1 - \delta_2(1 - \delta_1 x_1^*) = 1 - \delta_2 + \delta_1 \delta_2 x_1^* \]

\[ x_1^*(1 - \delta_1 \delta_2) = 1 - \delta_2 \quad \Longrightarrow \quad \boxed{x_1^* = \frac{1 - \delta_2}{1 - \delta_1 \delta_2}} \]

e $x_2^* = 1 - \delta_1 x_1^* = \frac{\delta_2(1-\delta_1)}{1-\delta_1\delta_2}$. Isso demonstra a fórmula (9b.2).

(b) Divisão para $\delta_1 = 0{,}9$ e $\delta_2 = 0{,}5$.

\[ x_1^* = \frac{1 - 0{,}5}{1 - 0{,}9 \times 0{,}5} = \frac{0{,}5}{0{,}55} \approx 0{,}909 \]

\[ x_2^* = 1 - 0{,}909 = 0{,}091 \]

O jogador 1 (mais paciente: $\delta_1 = 0{,}9$) fica com ~91% do bolo. O jogador 2 (menos paciente: $\delta_2 = 0{,}5$) fica com ~9%. O jogador 1 tem muito maior poder de barganha.

(c) Limite quando $\delta_1 = \delta_2 = \delta \to 1$.

Com $\delta_1 = \delta_2 = \delta$:

\[ x_1^* = \frac{1-\delta}{1-\delta^2} = \frac{1-\delta}{(1-\delta)(1+\delta)} = \frac{1}{1+\delta} \]

Quando $\delta \to 1$: $x_1^* \to 1/2$. A divisão converge para 50/50.

Interpretação: Quando as partes são muito pacientes, o custo de atraso por rodada é mínimo. Qualquer vantagem do proponente desaparece — quem propõe sabe que, se a oferta for rejeitada, o respondedor fará praticamente a mesma oferta (com custo de atraso desprezível). Essa convergência ao equilíbrio "justo" é uma das propriedades mais elegantes do modelo de Rubinstein e sua equivalência assintótica com a solução de barganha de Nash.

(d) Aplicação trabalhista brasileira.

Dados: $\delta_{\text{sind}} = 0{,}95$, $\delta_{\text{emp}} = 0{,}7$.

Se o sindicato propõe primeiro (jogador 1 = sind, jogador 2 = emp):

\[ x_{\text{sind}}^* = \frac{1 - 0{,}7}{1 - 0{,}95 \times 0{,}7} = \frac{0{,}3}{1 - 0{,}665} = \frac{0{,}3}{0{,}335} \approx 0{,}896 \]

O sindicato captura ~89,6% do excedente.

Se a empresa propõe primeiro (jogador 1 = emp, jogador 2 = sind):

\[ x_{\text{emp}}^* = \frac{1 - 0{,}95}{1 - 0{,}7 \times 0{,}95} = \frac{0{,}05}{0{,}335} \approx 0{,}149 \]

A empresa captura ~14,9% do excedente; o sindicato (respondedor) fica com ~85,1%.

Conclusão: Em ambos os casos, o sindicato (mais paciente) captura a maior parte do excedente — entre 85% e 90%. Quem propõe primeiro ganha marginalmente, mas a diferença é pequena: o poder de barganha é dominado pela paciência relativa, não pela ordem de propostas. Isso implica que sindicatos com robustos fundos de greve têm vantagem estrutural em negociações salariais, independentemente de quem "abre" a rodada.

↩ Voltar ao enunciado

✏️ Exercício 9b.10¶

Solução.

Payoffs: $T = 8$, $R = 5$, $P = 1$, $S = 0$.

(a) Fator de desconto efetivo com probabilidade de término.

Em cada período, o jogo continua com probabilidade $1-p$. Um payoff futuro $\pi$ daqui a $k$ períodos vale, em expectativa:

\[ \delta^k (1-p)^k \pi = [\delta(1-p)]^k \pi \]

Portanto, o fator de desconto efetivo é $\delta_{\text{ef}} = \delta(1-p)$.

Com grim trigger, a condição de sustentabilidade é:

\[ \delta_{\text{ef}} \geq \frac{T - R}{T - P} = \frac{8 - 5}{8 - 1} = \frac{3}{7} \]

Substituindo:

\[ \delta(1-p) \geq \frac{3}{7} \]

(b) Probabilidade máxima de término.

Com $\delta = 0{,}95$:

\[ 0{,}95(1-p) \geq \frac{3}{7} \implies 1 - p \geq \frac{3}{7 \times 0{,}95} = \frac{3}{6{,}65} \approx 0{,}451 \]

\[ p \leq 1 - 0{,}451 = 0{,}549 \]

A probabilidade máxima de término que permite cooperação é $p^* \approx 54{,}9\%$. Mesmo com probabilidade razoavelmente alta de término do jogo a cada período, a cooperação ainda é sustentável — porque o $\delta^*$ do jogo de estágio é baixo ($3/7 \approx 0{,}43$).

(c) Interpretação.

A fórmula $\delta_{\text{ef}} = \delta(1-p)$ mostra que alta probabilidade de saída ($p$ alto) equivale funcionalmente a maior impaciência — ambos reduzem o peso do futuro nas decisões presentes. Em mercados onde concorrentes podem sair a qualquer momento (startups, mercados voláteis), o $\delta_{\text{ef}}$ é baixo e o conluio é instável.

No mercado brasileiro de cimento, as empresas (Votorantim, InterCement, LafargeHolcim) operam com horizonte de longo prazo: investimentos em fábricas são altamente específicos e irreversíveis, a demanda é relativamente previsível, e a probabilidade de saída é muito baixa ($p \approx 0$). Isso implica $\delta_{\text{ef}} \approx \delta$, próximo de 1 — condições ideais para a sustentação do conluio. Consistentemente, o CADE condenou o cartel de cimento em 2014 (multas superiores a R$ 3 bilhões), após investigação que revelou coordenação de preços e divisão de mercados entre as grandes produtoras. A estrutura do mercado (poucas firmas, horizonte longo, produto homogêneo, demanda previsível) criava exatamente as condições previstas pelo modelo para a estabilidade do conluio.

↩ Voltar ao enunciado