Exercícios e ANPEC

Dados para exercícios empíricos

SIDRA/IBGE (microdados de censos e pesquisas): sidra.ibge.gov.br
IPEADATA (séries macroeconômicas e sociais): ipeadata.gov.br
BCB/SGS (séries financeiras e monetárias): bcb.gov.br/estatisticas

Revisão Rápida¶

Teste seu entendimento dos conceitos centrais deste capítulo.

1. O problema fundamental que motiva a economia experimental é:

(a) A falta de dados econômicos no mundo real
(b) A endogeneidade: em dados observacionais, correlação não implica causalidade
(c) A impossibilidade de medir variáveis econômicas com precisão
(d) A complexidade dos modelos teóricos

Resposta

(b) Em dados observacionais, a variável de interesse (e.g., salário mínimo) é correlacionada com fatores não observados (e.g., condições econômicas locais) que também afetam o resultado (emprego). A randomização — seja em laboratório, campo ou por acidente histórico — resolve esse problema ao tornar o tratamento ortogonal aos fatores confundidores. As alternativas (a), (c) e (d) são problemas reais mas não são o problema fundamental que a economia experimental resolve.

2. A teoria do valor induzido de Vernon Smith funciona porque:

(a) O pesquisador descobre as preferências verdadeiras dos participantes
(b) O pesquisador controla as preferências dos participantes via pagamentos monetários reais
(c) Os participantes sempre se comportam racionalmente em laboratório
(d) Os resultados de laboratório sempre se generalizam para o mundo real

Resposta

(b) A teoria do valor induzido não tenta descobrir preferências "verdadeiras" — ela as cria por meio de incentivos monetários. Se o pesquisador define que o comprador recebe $v_i - p$ ao comprar, então o comprador se comporta como se tivesse valor $v_i$, independentemente de suas preferências "reais" pelo bem. Isso permite construir curvas de oferta e demanda conhecidas e testar se o mecanismo de mercado as iguala. A alternativa (c) é falsa — muitos experimentos mostram desvios da racionalidade.

3. No experimento de Gneezy e Rustichini (2000) sobre multas em creches, os atrasos aumentaram após a introdução da multa porque:

(a) A multa era muito alta e os pais ficaram revoltados
(b) A multa transformou uma obrigação moral em transação de mercado, destruindo a norma social
(c) Os funcionários da creche passaram a liberar as crianças mais cedo
(d) Os pais não foram informados sobre a multa

Resposta

(b) Antes da multa, o atraso era uma violação de norma social ("não é correto incomodar os funcionários"). A introdução da multa reframou o atraso como uma transação comercial ("estou pagando pelo direito de atrasar"). Como o incentivo financeiro era menor que o custo da inconveniência de chegar no horário, os atrasos aumentaram. Quando a multa foi removida, a norma social não retornou — o efeito foi irreversível.

4. A principal diferença entre um RCT e um experimento natural é:

(a) O RCT usa dados reais e o experimento natural usa dados simulados
(b) No RCT, o pesquisador controla a aleatorização; no experimento natural, a variação exógena é fornecida pela história ou pela política
(c) O RCT é sempre mais confiável que o experimento natural
(d) Experimentos naturais só existem em ciências naturais

Resposta

(b) Em um RCT, o pesquisador decide quem recebe o tratamento (por sorteio). Em um experimento natural, a variação é fornecida por eventos exógenos — como a mudança do salário mínimo em New Jersey mas não na Pensilvânia (Card e Krueger, 1994) ou o trimestre de nascimento que afeta anos de escolaridade (Angrist e Krueger, 1991). A alternativa (c) é incorreta: um RCT mal desenhado pode ser menos confiável que um experimento natural bem explorado.

5. A crise de replicação em economia experimental refere-se ao fato de que:

(a) Nenhum experimento econômico foi replicado com sucesso
(b) Cerca de 39% dos estudos testados por Camerer et al. (2016) não replicaram, levantando preocupações sobre viés de publicação e práticas questionáveis de pesquisa
(c) Os economistas se recusam a compartilhar seus dados
(d) Experimentos em economia são mais caros que em outras ciências

Resposta

(b) Camerer et al. (2016) tentaram replicar 18 experimentos de laboratório publicados em periódicos top e obtiveram sucesso em apenas 11 (61%). As causas incluem viés de publicação (periódicos preferem resultados significativos), p-hacking (testar múltiplas especificações), e amostras pequenas. A profissão respondeu com pré-registro de hipóteses, relatórios registrados e compartilhamento obrigatório de dados e código.

Resumo do Capítulo¶

A economia experimental nasceu da necessidade de superar o problema da endogeneidade em dados observacionais — a impossibilidade de distinguir correlação de causalidade sem aleatorização. Em pouco mais de meio século, passou de curiosidade marginal a pilar da pesquisa econômica, reconhecida com três Prêmios Nobel (2002, 2019, 2021).
Experimentos de laboratório trazem participantes a ambientes controlados com incentivos monetários reais. A teoria do valor induzido de Vernon Smith permite ao pesquisador construir mercados com oferta e demanda conhecidas. Resultados clássicos: o leilão de dupla converge ao equilíbrio competitivo (confirmando a teoria); os jogos do ultimato e do ditador revelam preferências sociais (desafiando a hipótese de egoísmo); o jogo de bens públicos mostra cooperação parcial e eficácia da punição altruísta.
Experimentos de campo (taxonomia de Harrison e List, 2004) combinam controle experimental com contexto natural, aumentando a validade externa. O experimento de Gneezy e Rustichini (2000) sobre multas em creches mostrou que incentivos monetários podem destruir normas sociais — com efeitos irreversíveis.
Ensaios controlados randomizados (RCTs) aplicam a lógica experimental à avaliação de políticas públicas em larga escala. A randomização garante que o grupo de controle fornece o contrafactual correto. O Nobel de 2019 (Banerjee, Duflo, Kremer) reconheceu a transformação que os RCTs trouxeram para a economia do desenvolvimento — incluindo descobertas contraintuitivas sobre educação, saúde e microcrédito.
Experimentos naturais e quase-experimentos exploram variações exógenas fornecidas pela história ou pela política. Os métodos incluem diferenças-em-diferenças (Card e Krueger, 1994: salário mínimo), regressão descontínua (limiares de elegibilidade) e variáveis instrumentais (Angrist e Krueger, 1991: trimestre de nascimento). O Nobel de 2021 reconheceu a "revolução da credibilidade" na econometria aplicada.
Desenho de mecanismos experimentais testa a teoria de leilões em laboratório (overbidding, maldição do vencedor) e aplica matching theory a problemas reais como a troca de rins (Roth, Nobel 2012).
Limites e controvérsias incluem a crise de replicação (Camerer et al., 2016: 61% de replicação), a crítica de Deaton aos RCTs (validade externa, equilíbrio geral, ateoricismo), e questões éticas (consentimento, negação de tratamento, assimetrias de poder).

Conceitos-Chave¶

Conceito	Definição
Endogeneidade	Correlação entre a variável explicativa e o termo de erro, impedindo identificação causal
Valor induzido	Técnica que permite ao experimentador criar preferências controladas via pagamentos monetários
Jogo do ultimato	Jogo em que um propositor divide uma quantia e o respondente aceita ou rejeita; testa preferências sociais
Jogo de bens públicos	Jogo de contribuição voluntária que testa o problema do carona e a cooperação
Leilão de dupla	Mecanismo em que compradores e vendedores submetem lances/ofertas simultaneamente; converge ao equilíbrio competitivo
Experimento de campo	Experimento conduzido no contexto natural dos participantes, com aleatorização controlada pelo pesquisador
RCT	Ensaio controlado randomizado — atribuição aleatória de tratamento para identificar efeitos causais
ATE	Efeito médio do tratamento — diferença esperada nos resultados entre tratados e não tratados
ITT	Intenção de tratar — estimativa baseada na atribuição aleatória original, independentemente da adesão
Diferenças em diferenças	Método que compara mudanças antes/depois entre grupos tratado e controle
Regressão descontínua	Método que explora descontinuidades em limiares de elegibilidade para identificar efeitos causais
Variáveis instrumentais	Método que usa uma variável exógena (instrumento) para resolver endogeneidade
Crise de replicação	Fenômeno em que estudos publicados não são reprodutíveis, causado por viés de publicação e práticas questionáveis
Validade interna	Capacidade do desenho experimental de atribuir o efeito observado ao tratamento
Validade externa	Capacidade de generalizar os resultados para outros contextos e populações

Tabela 22.1 — Conceitos-chave.

Exercícios¶

Exercício 22.1. Em um experimento de valor induzido, 5 compradores têm valores de resgate $v_B = \{20, 16, 12, 8, 4\}$ e 5 vendedores têm custos $c_S = \{2, 6, 10, 14, 18\}$.

(a) Construa as curvas de oferta e demanda e determine o preço e a quantidade de equilíbrio competitivo. (b) Calcule o excedente total no equilíbrio. (c) Se o preço observado no experimento for $p = 13$, calcule o excedente total realizado e a eficiência de mercado (razão excedente realizado / excedente máximo). (d) Discuta o que Vernon Smith observou sobre a convergência de preços ao longo de múltiplas rodadas.

Ver solução

Exercício 22.2. No jogo do ultimato, o propositor tem R$ 100 para dividir. A função utilidade do respondente é $u_R(x) = x - \alpha \cdot \max\{50 - x, 0\}$, onde $x$ é a oferta recebida e $\alpha > 0$ mede a aversão à desigualdade.

(a) Para qual valor de $\alpha$ o respondente é indiferente entre aceitar e rejeitar uma oferta de R$ 20? (b) Se $\alpha = 2$, qual é a menor oferta que o respondente aceita? (c) Sabendo disso, o que o propositor racional oferece? (d) Compare com a previsão do modelo padrão (sem aversão à desigualdade) e com os dados experimentais.

Ver solução

Exercício 22.3. Em um jogo de bens públicos com $N = 5$ jogadores, dotação $w = 10$ e fator de multiplicação $\alpha = 2{,}5$. O payoff é $\pi_i = (10 - g_i) + \frac{2{,}5}{5}\sum_{j=1}^{5} g_j$.

(a) Mostre que o equilíbrio de Nash é $g_i = 0$ para todo $i$. (b) Mostre que o ótimo social é $g_i = 10$ para todo $i$. (c) Suponha que os jogadores possam, a um custo de R$ 1, punir um jogador específico em R$ 3. Mostre que, em um jogo de uma rodada, a punição não é usada no equilíbrio de Nash. Discuta por que, experimentalmente, a punição é amplamente observada. (d) Em um jogo repetido infinitamente com fator de desconto $\delta$, encontre o $\delta$ mínimo para sustentar $g_i = 10$ com estratégia de gatilho (trigger strategy).

Ver solução

Exercício 22.4. Um pesquisador quer avaliar o efeito de um programa de treinamento sobre a renda de trabalhadores. A renda média dos participantes após o treinamento é R$ 2.800; a renda média dos não participantes é R$ 2.200.

(a) Podemos concluir que o efeito do treinamento é de R$ 600? Explique por que esse estimador é enviesado. (b) Se o pesquisador randomiza a participação (RCT), sob quais condições a diferença de médias identifica o ATE? (c) Suponha que 20% dos atribuídos ao tratamento não participem (non-compliance). Se a diferença de médias observada (ITT) é R$ 480, estime o TOT. (d) Discuta um cenário em que o ITT seria preferível ao TOT para formulação de política pública.

Ver solução

Exercício 22.5. No estudo de Card e Krueger (1994), os dados de emprego em restaurantes fast food são:

	NJ (tratamento)	PA (controle)
Antes	20,44	23,33
Depois	21,03	21,17

(a) Calcule o estimador de diferenças-em-diferenças. (b) Interprete o resultado economicamente. (c) Qual hipótese-chave é necessária para que o estimador DD identifique o efeito causal? (d) Apresente um argumento contra e um a favor da plausibilidade dessa hipótese neste contexto.

Ver solução

Exercício 22.6. Um programa social concede benefício a famílias com renda per capita abaixo de R$ 600. O pesquisador observa os seguintes resultados médios para frequência escolar:

Renda per capita	Frequência escolar (%)
R$ 550–R$ 600 (beneficiários)	92
R$ 600–R$ 650 (não beneficiários)	87

(a) Estime o efeito do programa por regressão descontínua. (b) Qual hipótese de identificação é necessária? (c) Por que famílias com renda de R$ 590 e R$ 610 são comparáveis (mas famílias com R$ 300 e R$ 900 não)? (d) Discuta uma ameaça à validade: e se famílias manipularem sua renda declarada para ficar abaixo do limiar?

Ver solução

Exercício 22.7. Um pesquisador quer estimar o efeito da educação sobre salários, mas educação é endógena (pessoas mais habilidosas estudam mais e ganham mais). Ele propõe usar a distância até a universidade mais próxima como variável instrumental.

(a) Argumente por que a distância satisfaz a condição de relevância. (b) Argumente por que a distância pode (ou não) satisfazer a condição de exclusão. (c) Se a regressão do primeiro estágio mostra que cada 100 km de distância reduz a escolaridade em 0,5 anos, e a forma reduzida mostra que cada 100 km de distância reduz o salário em 4%, estime o retorno à educação por IV. (d) Compare com a estimativa por MQO e discuta a direção do viés.

Ver solução

Exercício 22.8. Em um leilão de primeiro preço com 3 participantes, os valores são sorteados independentemente de $U[0, 100]$.

(a) Derive a função de lance de equilíbrio simétrico (neutro ao risco): $b(v) = \frac{N-1}{N} v$. (b) Calcule o lance de equilíbrio para um participante com $v = 60$ e $N = 3$. (c) Se os participantes experimentais dão lance médio de $b = 45$ quando $v = 60$ (em vez dos $40$ previstos), isso é consistente com aversão ao risco ou propensão ao risco? Explique. (d) Discuta a implicação para o teorema de equivalência de receita.

Ver solução

Exercício 22.9. Um hospital tem 4 pares doador-receptor incompatíveis para transplante renal:

Par	Doador tipo sanguíneo	Receptor tipo sanguíneo
A	O	B
B	B	A
C	A	O
D	AB	A

(Compatibilidade simplificada: O doa para todos; A doa para A e AB; B doa para B e AB; AB doa só para AB.)

(a) Quais trocas diretas (ciclos de 2) são possíveis? (b) Encontre a alocação que maximiza o número de transplantes (pode incluir ciclos de 3 ou mais). (c) Se um doador altruísta de tipo O inicia uma cadeia, quantos transplantes adicionais são possíveis? (d) Relacione com o conceito de eficiência de Pareto (Capítulo 14) e discuta por que o mecanismo de preços é proibido.

Ver solução

Exercício 22.10 — DiD com dados brasileiros: o Programa Mais Médicos. Em 2013, o governo federal lançou o Programa Mais Médicos, enviando médicos (majoritariamente cubanos) para municípios com escassez de profissionais de saúde. Considere os seguintes dados hipotéticos (inspirados em Carrillo & Feres, 2019) sobre a taxa de internação por condições sensíveis à atenção primária (ICSAP) por 10.000 habitantes:

	Municípios atendidos (tratamento)	Municípios não atendidos (controle)
2012 (antes)	182	145
2015 (depois)	158	139

(a) Calcule o estimador de diferenças-em-diferenças e interprete o resultado.

(b) A hipótese de tendências paralelas é plausível neste caso? Que variáveis você controlaria para torná-la mais defensável?

(c) Suponha que municípios que mais precisavam de médicos foram priorizados pelo programa (o que é verdade). Isso viola a exogeneidade do tratamento? Discuta como o DiD lida com esse tipo de seleção, em contraste com uma simples comparação cross-section.

(d) Se o efeito encontrado é uma redução de 18 internações por 10.000 habitantes, e cada internação evitada economiza em média R$ 3.200 (dados do SIH/SUS), calcule a economia anual para um município com 50.000 habitantes. Compare com o custo anual do programa para esse município (suponha 3 médicos × R$ 120.000/ano cada).

(e) Discuta uma limitação importante: os municípios tratados diferem dos não tratados em nível (182 vs 145 antes do programa). Isso invalida o DiD? Por quê?

Ver solução

Exercício 22.11. Um pesquisador conduz um RCT com 500 participantes (250 tratados, 250 controles) e encontra efeito de $\hat{\tau} = 3{,}2$ com erro padrão $SE = 1{,}5$.

(a) Calcule a estatística $t$ e o p-valor (bilateral) aproximado. O resultado é "significativo" a 5%? (b) Se o pesquisador tivesse testado 20 hipóteses e reportado apenas a significativa, qual é a probabilidade de um falso positivo (com correção de Bonferroni)? (c) Outro pesquisador tenta replicar com amostra de 1.000 e encontra $\hat{\tau} = 1{,}8$ com $SE = 0{,}7$. Compare os resultados. (d) Discuta como o pré-registro de hipóteses ajudaria a resolver a preocupação do item (b).

Ver solução

Questões Estilo ANPEC¶

Questão 1. Classifique as afirmações como Verdadeiro (V) ou Falso (F):

(0) A teoria do valor induzido de Vernon Smith permite ao experimentador controlar as preferências dos participantes via pagamentos monetários reais, eliminando a necessidade de observar preferências "verdadeiras".

(1) No equilíbrio de Nash do jogo de bens públicos com retorno marginal per capita do fundo público menor que 1 (mas retorno total maior que 1), todos os jogadores contribuem sua dotação integral.

(2) A randomização em um RCT garante tanto a validade interna quanto a validade externa dos resultados.

(3) O estimador de diferenças-em-diferenças requer a hipótese de tendências paralelas: na ausência do tratamento, os grupos tratado e controle teriam seguido trajetórias semelhantes.

(4) A regressão descontínua identifica o efeito causal do tratamento para toda a população estudada, não apenas para indivíduos próximos ao limiar de elegibilidade.

Gabarito

(0) V — Essa é precisamente a contribuição central da teoria do valor induzido.

(1) F — O equilíbrio de Nash é $g_i = 0$ (ninguém contribui), pois o retorno marginal per capita é menor que 1, tornando a contribuição individualmente irracional apesar de socialmente eficiente.

(2) F — A randomização garante validade interna (ausência de viés de seleção), mas não garante validade externa (generalização para outros contextos). Essa é uma das críticas centrais de Deaton.

(3) V — A hipótese de tendências paralelas é essencial para que a "segunda diferença" (entre grupos) elimine corretamente os fatores confundidores.

(4) F — A RDD identifica um efeito local, válido apenas na vizinhança do limiar. A extrapolação para pontos distantes do limiar requer hipóteses adicionais.

Questão 2. Classifique as afirmações como Verdadeiro (V) ou Falso (F):

(0) O experimento de Gneezy e Rustichini (2000) demonstrou que a introdução de multas monetárias em creches reduziu os atrasos dos pais, confirmando a previsão do modelo econômico padrão.

(1) Uma variável instrumental válida deve satisfazer duas condições: relevância (correlação com a variável endógena) e exclusão (ausência de correlação com o termo de erro).

(2) O estimador TOT (Treatment on the Treated) pode ser obtido dividindo o estimador ITT (Intention-to-Treat) pela taxa de adesão ao tratamento, usando a atribuição aleatória como instrumento.

(3) A maldição do vencedor em leilões de valor comum é um fenômeno puramente teórico que não se observa em experimentos de laboratório.

(4) O pré-registro de hipóteses antes da coleta de dados é uma das soluções propostas pela profissão para mitigar o problema do p-hacking e da crise de replicação.

Gabarito

(0) F — O resultado foi o oposto: os atrasos aumentaram após a multa, porque o incentivo monetário destruiu a norma social preexistente.

(1) V — Relevância e exclusão são as duas condições fundamentais para um instrumento válido.

(2) V — Esse é o estimador de Wald, que conecta RCTs com a econometria de variáveis instrumentais.

(3) F — A maldição do vencedor é amplamente documentada em experimentos de laboratório, especialmente em leilões com muitos competidores.

(4) V — O pré-registro obriga o pesquisador a definir as hipóteses e o plano de análise antes de ver os dados, impedindo a seleção ex post de resultados significativos.

Questão 3. Classifique as afirmações como Verdadeiro (V) ou Falso (F):

(0) O ATE (Average Treatment Effect) e o ATT (Average Treatment Effect on the Treated) são numericamente idênticos quando o tratamento é atribuído de forma completamente aleatória a toda a população elegível.

(1) Em um desenho de regressão descontínua (RDD), a validade da estimativa causal depende da hipótese de que os agentes não manipulam a variável de atribuição (running variable) para se posicionarem estrategicamente em relação ao limiar.

(2) O estimador de variáveis instrumentais (IV) converge para o ATE quando o instrumento afeta todos os indivíduos de forma homogênea. No caso de efeitos heterogêneos, o IV estima o LATE (Local Average Treatment Effect), válido apenas para os compliers.

(3) Em jogos de ultimato, a previsão do equilíbrio de Nash por indução retroativa é que o propositor oferece a menor unidade monetária possível e o respondente aceita — previsão confirmada sistematicamente pela evidência experimental.

(4) O viés de publicação (publication bias) ocorre quando periódicos acadêmicos publicam preferencialmente resultados estatisticamente significativos, distorcendo a literatura em favor de efeitos positivos e inflando as estimativas publicadas.

Gabarito

(0) V — Com randomização completa, o grupo de controle é representativo de toda a população, portanto $E[Y(0)|D=1] = E[Y(0)]$ e ATE = ATT.

(1) V — A condição de não-manipulação é essencial para RDD. Se os agentes podem manipular a running variable (e.g., declarar renda abaixo do limiar), a comparação na vizinhança do corte é contaminada por seleção. O teste de McCrary verifica descontinuidades na densidade da running variable.

(2) V — Resultado central de Imbens e Angrist (1994). O LATE é o efeito causal para os compliers — indivíduos cuja decisão de tratamento muda em resposta ao instrumento. Para always-takers e never-takers, o instrumento não fornece informação.

(3) F — A previsão teórica é correta (equilíbrio de subjogo perfeito), mas a evidência experimental a rejeita sistematicamente. Em média, propostas abaixo de 20-30% são rejeitadas, e ofertas modais ficam em torno de 40-50% — evidência de preferências sociais (aversão à desigualdade, reciprocidade).

(4) V — O viés de publicação é uma das causas centrais da crise de replicação. Soluções incluem pré-registro, relatórios registrados (registered reports) e meta-análises que corrigem pelo viés (funnel plots, trim-and-fill).

Questão 4. Classifique as afirmações como Verdadeiro (V) ou Falso (F):

(0) A validade externa de um RCT conduzido em vilas rurais do Quênia é automaticamente assegurada para o Brasil urbano, desde que o desenho experimental tenha validade interna comprovada.

(1) No método de diferenças-em-diferenças, um teste de falsificação (placebo test) comum consiste em estimar o efeito do tratamento em períodos anteriores à intervenção: se for estatisticamente diferente de zero, a hipótese de tendências paralelas é questionável.

(2) A maldição do vencedor em leilões de valor comum decorre do fato de que o vencedor é sistematicamente o licitante que mais superestimou o valor do objeto — um caso de viés de seleção condicional à vitória.

(3) Em um jogo de bens públicos repetido com punição entre pares (peer punishment), as contribuições tipicamente convergem para zero ao longo das rodadas, exatamente como prevê o equilíbrio de Nash do jogo estático.

(4) A "revolução da credibilidade" em econometria aplicada (Nobel 2021, Angrist-Imbens-Card) priorizou a identificação causal via variação exógena sobre a estimação de modelos estruturais completos — substituindo a pergunta "qual é o modelo correto?" por "qual é a fonte de variação exógena?".

Gabarito

(0) F — Validade interna e validade externa são dimensões independentes. Um RCT pode ter excelente validade interna (identificação causal limpa) mas validade externa limitada (resultados não generalizáveis para outros contextos culturais, institucionais ou econômicos). Essa é uma das críticas centrais de Deaton (2010).

(1) V — Se o "efeito" aparece antes do tratamento, é evidência de que as tendências pré-tratamento já divergiam — violando a hipótese identificadora do DD.

(2) V — Em leilões de valor comum, todos os licitantes estimam o mesmo valor desconhecido. Condicional à vitória, o lance vencedor é o mais otimista — gerando viés para cima na estimativa do valor.

(3) F — Com punição entre pares, as contribuições tipicamente aumentam ao longo das rodadas, não convergem para zero. A punição altruísta sustenta a cooperação ao tornar o free-riding custoso (Fehr & Gächter, 2000).

(4) V — Descrição precisa da revolução da credibilidade. A mudança metodológica enfatizou desenhos de pesquisa que exploram variações quasi-experimentais (experimentos naturais, RDD, IV) em vez de depender de hipóteses de identificação derivadas de modelos teóricos.