Por que pesquisas eleitorais erram (e por que isso é esperado)
Toda eleição importante chega acompanhada da mesma desconfiança: "as pesquisas erraram de novo". A frase costuma vir junto de listas de previsões frustradas, comparações entre institutos e teorias sobre vieses ideológicos. Boa parte dessa indignação se dissolve quando entendemos uma coisa simples: a pesquisa eleitoral nunca prometeu acertar o resultado. Ela prometeu uma estimativa com uma margem de erro declarada, dentro de um nível de confiança, sob um conjunto explícito de pressupostos. Se a estimativa cair dentro da margem prometida, a pesquisa cumpriu seu papel — mesmo que o vencedor não seja o que aparecia na liderança.
Para entender por que isso é assim, é útil olhar para o número que mais aparece nos rodapés: "margem de erro de 2 pontos percentuais, 95% de confiança". Esses dois pontos não saíram do nada. Eles são consequência direta de quantas entrevistas o instituto decidiu fazer, do tipo de amostragem que ele desenhou e da matemática das proporções. Entender essa engrenagem ajuda a separar o que é falha real do método do que é, na prática, comportamento normal de uma estimativa estatística.
O ponto de partida é reconhecer que estamos lidando com uma proporção em uma população enorme. Em vez de perguntar a cada eleitor (o que seria uma eleição, não uma pesquisa), o instituto extrai uma amostra. A pergunta técnica é: quantas pessoas preciso ouvir para que a proporção observada esteja, com alta probabilidade, próxima da proporção verdadeira? A resposta começa com uma fórmula clássica, e termina com vários ajustes que poucos rodapés explicam.
A fórmula clássica de tamanho amostral para proporções
O cálculo do tamanho de amostra para estimar uma proporção é um dos resultados mais conhecidos da estatística. Ele aparece em Cochran (1977) e em todo manual brasileiro sério — Bussab e Morettin (2017), Magalhães (2015), entre outros. A fórmula é:
A intuição é direta. Quando você entrevista n pessoas e calcula a proporção que respondeu "voto no candidato A", essa proporção observada é uma estimativa que oscila ao redor da proporção verdadeira na população. A teoria mostra que, para amostras razoáveis, essa oscilação tem aproximadamente uma distribuição normal de desvio padrão √(p·(1−p)/n). O termo p·(1−p)/n é a variância da estimativa — quanto mais entrevistas, menor a variância, e portanto mais perto a estimativa tende a ficar do valor verdadeiro.
A margem de erro E é o "raio" do intervalo de confiança simétrico que queremos. Com nível de confiança de 95%, o multiplicador z vale aproximadamente 1,96 — o ponto onde a normal padrão acumula 97,5% à esquerda. Isolando n na expressão E = z · √(p·(1−p)/n), chegamos exatamente à fórmula acima.
Há um detalhe estratégico: a fórmula depende de p, que é o que estamos tentando estimar. Como o produto p·(1−p) tem máximo em p = 0,5, valendo 0,25 nesse ponto, os institutos costumam adotar p = 0,5 como pior caso. Assim, garantem que a margem prometida valerá para qualquer proporção observada, inclusive a próxima de 50%. Se você quiser planejar sua própria pesquisa com flexibilidade para ajustar esses parâmetros, a calculadora de tamanho de amostra faz todo o cálculo automaticamente.
Exemplo: 2.500 entrevistas e margem de 2 pp
Vamos rodar a conta com os parâmetros típicos de uma pesquisa nacional. Suponha que o instituto quer:
- margem de erro absoluta E = 0,02 (dois pontos percentuais);
- nível de confiança de 95%, portanto z ≈ 1,96;
- e adota o pior caso p = 0,5, com p·(1−p) = 0,25.
Aplicando a fórmula:
O número canônico de ~2.400 entrevistas nasce daí. Na prática, os institutos arredondam para cima — 2.500, 2.520, 2.640 — para acomodar quotas regionais e pequenas perdas amostrais. Quando a margem desejada cai para 1 ponto percentual, o n quadruplica para perto de 9.600 entrevistas. Quando sobe para 3 pontos, cai para cerca de 1.067. Essa não-linearidade — duas vezes menos erro custa quatro vezes mais entrevistas — explica por que 2 pontos virou o ponto de equilíbrio prático entre custo e precisão. A curva abaixo mostra essa relação para p = 0,5 e z = 1,96:
O gráfico deixa visível o "joelho" da curva: até cerca de 1.000 entrevistas, cada novo lote derruba bastante a margem; a partir de 3.000, o ganho fica modesto. Esse é o argumento econômico clássico para parar perto das 2.500: dobrar para 5.000 entrevistas reduziria a margem de 2 para apenas cerca de 1,4 ponto — pouca melhora para o dobro de custo de campo.
Por que 95% de confiança? E quando usar 99%?
O nível de confiança não é uma propriedade física do mundo — é uma escolha. Dizer "95% de confiança" significa que, se repetíssemos o procedimento de amostragem muitas vezes, em 95% das vezes o intervalo construído conteria a proporção verdadeira. O multiplicador 1,96 está atrelado a esse 95%; para 99% de confiança, ele pula para cerca de 2,576, e para 90% cai para 1,645.
Por que 95% virou padrão? É uma convenção histórica, datada do início do século XX e popularizada por Fisher como um ponto razoável entre dois custos: ser permissivo demais (e tirar conclusões frágeis) ou ser severo demais (e nunca chegar a conclusão alguma). Em pesquisa eleitoral, 95% se ajusta bem ao prazo apertado, ao custo de campo e ao público leitor que precisa entender o intervalo no jornal da noite.
O 99% costuma aparecer quando o custo de errar é alto demais para se contentar com um em vinte. Em estudos clínicos confirmatórios, em decisões judiciais quantitativas, em controle de qualidade para itens críticos, faz sentido pagar mais entrevistas para reduzir a chance de uma janela "azarada". Em troca, o intervalo de confiança fica maior — uma compensação direta entre certeza e precisão, que pode ser visualizada na calculadora de intervalo de confiança.
Pesquisa estratificada e o "design effect"
A fórmula clássica assume amostragem aleatória simples: cada eleitor da população tem a mesma probabilidade de ser sorteado, e os sorteios são independentes. Na prática, isso não existe em pesquisa eleitoral nacional. Os institutos brasileiros usam, há décadas, amostragem estratificada por quotas: dividem o Brasil em regiões, em portes de município, em estratos demográficos (sexo, faixa etária, escolaridade, classe), e definem quantas entrevistas em cada estrato proporcionalmente à população. A coleta é feita por entrevistadores que cumprem essas quotas — em pontos de fluxo, em residências sorteadas, por telefone ou por amostragem mista.
Estratificar bem reduz a variância de estimativas como o voto regional, porque garante que nenhum estrato fique sub-representado por sorte. Mas a forma como as quotas são preenchidas, e o uso de conglomerados (sortear domicílios em vez de pessoas), aumenta a variância em relação à amostragem aleatória simples. O efeito líquido depende do desenho. Para capturar isso, a literatura usa o design effect (DE):
Um DE de 1,5 significa que o desenho efetivamente "vale" 1/1,5 ≈ 67% de uma amostra aleatória simples do mesmo tamanho. O instituto sério já incorpora esse fator: se a fórmula pede 2.400 entrevistas para 2 pp de margem em aleatória simples, com DE = 1,5 ele entrevista 3.600 para chegar na mesma margem efetiva, ou aceita uma margem efetiva maior se mantiver 2.400. Por isso o tamanho amostral nominal nem sempre conversa diretamente com a margem declarada — depende de como o erro padrão foi calculado.
Quando você lê uma pesquisa que entrevistou "2.000 pessoas" e declara margem de "2 pontos", uma das três coisas é verdade: o desenho está bem próximo do aleatório simples; o instituto usou um DE pequeno na conta; ou a margem foi declarada como se fosse aleatório simples, e o erro real é um pouco maior. O rodapé técnico não costuma resolver essa ambiguidade — vale procurar a ficha técnica completa para entender.
O problema dos indecisos e o erro não-amostral
A fórmula só conhece um tipo de erro: o erro amostral, fruto de ter ouvido n pessoas em vez da população inteira. Esse erro é simétrico, decai com √n e é exatamente o que a margem captura. Acontece que, em pesquisa eleitoral real, esse é frequentemente o menor dos erros.
O erro não-amostral tem várias origens. A primeira é o indeciso: o eleitor que diz "ainda não sei" ou "voto em branco" pode acabar votando em qualquer candidato — e nem todos os institutos tratam essa massa da mesma forma. Excluir indecisos da base aumenta artificialmente a proporção dos candidatos declarados; manter os indecisos como categoria separada exige decidir como distribuí-los na projeção do resultado. Pesquisas perto da eleição costumam mostrar indecisos caindo rapidamente, e esse "fechamento" pode mover proporções em mais pontos do que a margem amostral.
A segunda é a não-resposta: se quem se recusa a responder tende a ter opinião sistematicamente diferente de quem responde, a estimativa fica viesada — e esse viés não aparece na margem. A terceira é o viés de declaração: o eleitor que esconde a intenção de voto por receio social. A quarta é a mudança de opinião entre a coleta e o dia do voto. A quinta é a cobertura amostral: pesquisas por telefone fixo subestimam o eleitor jovem; pesquisas online sub-representam quem tem pouco acesso digital; pesquisas em ponto de fluxo capturam quem circula nas ruas comerciais.
Nenhum desses erros está na fórmula. Eles precisam ser controlados pelo desenho da pesquisa, pelos pesos pós-coleta e pelo treinamento dos entrevistadores. Quando a pesquisa "erra mais do que a margem", quase sempre o culpado é um desses, não a matemática da margem.
Quando p está próximo de 50% × próximo de 5%
O termo p·(1−p) na fórmula é a chave de uma propriedade importante. Ele é uma parábola voltada para baixo, com máximo em p = 0,5 e zeros nas pontas. A figura abaixo mostra essa curva:
A consequência é prática: a margem de erro do candidato em 50% é a maior possível para aquele n; a margem do candidato em 5% (ou 95%) é bem menor. Se a fórmula entregou 2 pontos com p = 0,5, ela entregaria cerca de 1,7 ponto para p = 0,3, 1,3 ponto para p = 0,1 e apenas 0,9 ponto para p = 0,05. A margem declarada na pesquisa é o pior caso — ela vale como teto para qualquer candidato.
Isso também muda a interpretação do "empate técnico". Dois candidatos perto de 50%, com diferença observada menor que 2 pontos, estão tecnicamente empatados. Mas um candidato em 35% e outro em 30%, com a mesma diferença de 5 pontos, têm margens individuais menores — a diferença pode já ser significativa. O teste apropriado para comparar duas proporções é o teste de proporção, que considera os dois erros padrão e dá um valor-p adequado. Quando a comparação é em formato A/B clássico (com uma decisão binária por trás), o tamanho amostral para teste A/B ajuda a planejar o experimento.
Vinheta histórica: pesquisas brasileiras famosas que erraram
O Brasil tem episódios marcantes de "surpresa eleitoral" em que as pesquisas previam um cenário e a urna entregou outro. Vale revisitar três, focando na metodologia.
1989, Collor × Lula no 1º turno. Naquela eleição, em meio à campanha mais longa e fragmentada da redemocratização, várias pesquisas ao longo do ano captaram quedas e subidas bruscas da intenção de voto. Parte do erro veio do fato de o eleitorado ter se decidido tarde — a fatia de indecisos era grande até semanas antes da votação. Outra parte veio da volatilidade de candidatos que cresciam ou afundavam em janelas curtas, dentro das quais qualquer pesquisa fica desatualizada. Foi um caso clássico de erro de momento: as pesquisas refletiam, em geral, o que estava acontecendo na data de campo; a tendência mudou rápido demais.
2018, 2º turno presidencial. Algumas pesquisas finais subestimaram a magnitude da vantagem do candidato vencedor, mesmo apontando-o como favorito. As discussões posteriores apontaram para uma combinação de fatores: viés de cobertura (telefone × presencial), pesos demográficos defasados em relação ao perfil real de quem foi votar, e o efeito do voto "envergonhado" — eleitores menos propensos a declarar a intenção real em pesquisa presencial. Nada disso é falha da margem; é o erro não-amostral falando mais alto.
2022, eleições estaduais. Em vários estados, governadores se elegeram em 1º turno em cenários que as últimas pesquisas mostravam como apertados ou favoráveis ao adversário. Em alguns casos, a fatia regional da amostra era pequena demais — uma pesquisa nacional com 2.500 entrevistas tem talvez 200 a 300 entrevistados em um estado intermediário, e a margem amostral nesse recorte é de 6 a 7 pontos, não 2. Confundir a margem nacional com a margem estadual é um dos vieses de leitura mais comuns.
Nos três casos, a lição é semelhante: a pesquisa cumpre o que a fórmula promete quando a metodologia é boa e quando o leitor entende exatamente o que está sendo estimado. Quando o resultado destoa, a investigação produtiva começa nos dados de campo, nos pesos e na composição da amostra, não em conspirações.
Boas práticas ao ler ou encomendar pesquisa eleitoral
Uma pesquisa eleitoral merece atenção quando traz, com clareza, o seu próprio manual. Algumas perguntas valem para qualquer leitor:
- Quem encomendou? Pesquisa contratada por partido tem incentivos diferentes de pesquisa de mídia. Conhecer o financiador não invalida a pesquisa, mas ajuda a calibrar a leitura.
- Qual o instituto e a sua trajetória? Históricos de erro, padrões metodológicos e registro junto ao TSE são informações públicas. Institutos com tradição costumam publicar fichas técnicas detalhadas.
- Quando foi a data de campo? Uma pesquisa de 20 dias atrás, em uma corrida volátil, pode estar tão desatualizada que a margem amostral é irrelevante diante da mudança de cenário.
- Qual o desenho amostral? Estratificação por região e demografia, amostra por quotas, telefônica, presencial, online ou mista. Cada desenho tem trade-offs específicos.
- Qual o tamanho da amostra e o nível de confiança declarado? Sem o nível de confiança, a margem perde sentido.
- Como foram tratados os indecisos? Excluídos, mantidos como categoria, ou redistribuídos por algum critério.
- Há cruzamentos divulgados? Recorte por sexo, idade, escolaridade e região ajuda a entender de onde vêm as estimativas — e tem margens de erro maiores que a margem global.
Para quem encomenda pesquisa — seja institucional, acadêmica ou comercial — vale registrar três disciplinas. Primeiro, definir antes da coleta qual é a margem alvo e o nível de confiança aceitável, e dimensionar o n a partir disso usando a calculadora de tamanho de amostra. Segundo, escolher um desenho amostral compatível com o objetivo: para estimativas regionais precisas, planejar o n dentro de cada estrato, não confiar no rateio proporcional. Terceiro, separar orçamento para reduzir erro não-amostral: pré-teste do questionário, treinamento de entrevistadores, controle de qualidade pós-campo e métodos de imputação ou redistribuição de indecisos pensados antes do trabalho começar.
A ABEP (Associação Brasileira de Empresas de Pesquisa) publica protocolos e códigos que padronizam vários desses passos, e o TSE exige registro prévio para qualquer pesquisa de intenção de voto divulgada — com obrigação de declarar amostra, metodologia, financiador e período de campo. Conhecer esses documentos vacina contra leituras ingênuas. Quando você quer apenas estimar a faixa provável de uma proporção sem entrar na engenharia eleitoral completa, a calculadora de intervalo de confiança resolve o problema imediato.
Pesquisas nacionais entrevistam ~2.500 pessoas porque a fórmula clássica entrega margem de 2 pontos com 95% de confiança no pior caso (p = 0,5). Ajustes de design effect, indecisos e erro não-amostral movem o número real para cima — quase nunca para baixo. Trate a margem como o piso técnico, não como o teto da incerteza.
Perguntas frequentes
Por que a margem de erro é simétrica?
Porque a fórmula clássica usa uma aproximação normal centrada na proporção observada. O intervalo é construído como p ± E, com o mesmo E para cima e para baixo. Em proporções muito próximas de 0 ou 1, a simetria deixa de valer e métodos como o intervalo de Wilson são mais precisos — e é justamente o método que a nossa calculadora de intervalo de confiança usa por padrão para proporções.
Qual a diferença entre erro amostral e erro não-amostral?
O erro amostral é a incerteza aleatória de se entrevistar uma amostra em vez da população inteira — é o que a margem de erro captura. O erro não-amostral vem de problemas de pesquisa: recusa de resposta, viés de cobertura, redação enviesada de perguntas e mudança de opinião entre a coleta e o dia da eleição. Esse erro não aparece na margem e, em pesquisa eleitoral real, costuma ser maior que o erro amostral.
Posso usar a mesma amostra para vários candidatos?
Sim. Os institutos coletam uma amostra única e estimam a proporção de cada candidato a partir dela. A margem de erro divulgada é a maior margem possível (com p próximo de 50%) e vale para cada proporção individualmente. Para comparar dois candidatos, é preciso considerar a covariância entre as duas estimativas — o que o teste de proporção faz automaticamente.
Pesquisas online (boca de urna) seguem a mesma fórmula?
A fórmula é a mesma, mas a amostragem é diferente. Pesquisas online com painel auto-recrutado e bocas de urna por conveniência têm risco maior de viés de seleção. Nesses casos o erro não-amostral pesa mais que o erro amostral, e a margem teórica subestima a incerteza real. Vale tratar essas pesquisas como indicativas, não como estimativas pontuais com a precisão da margem declarada.
Como instituto sério escolhe quantas entrevistas fazer?
O instituto define a margem de erro alvo (em geral 2 pontos percentuais), o nível de confiança (95%), assume o pior caso p = 0,5, aplica a fórmula n = z²·p(1−p)/E² e multiplica pelo design effect estimado para a amostragem estratificada. Daí saem os ~2.000 a 2.500 entrevistas nacionais típicas. Para planejar a sua própria, a calculadora de tamanho de amostra faz o cálculo completo.
Se a diferença é menor que a margem, sempre dá empate técnico?
Quase sempre, mas com nuance. Quando a diferença entre dois candidatos é menor que a soma das duas margens de erro individuais, costuma-se declarar empate técnico. O cálculo mais rigoroso usa um teste de proporção que considera a correlação entre as duas estimativas — e pode dar significância em diferenças um pouco menores, especialmente quando os dois candidatos estão longe de 50%.
Referências
- ABEP — Associação Brasileira de Empresas de Pesquisa. Pesquisa eleitoral: práticas e protocolos. Códigos e padrões metodológicos para pesquisa de intenção de voto.
- Bussab, W. O.; Morettin, P. A. Estatística Básica. 9ª ed. São Paulo: Saraiva, 2017.
- Cochran, W. G. Sampling Techniques. 3rd ed. New York: Wiley, 1977.
- Cox, D. R.; Donnelly, C. A. Principles of Applied Statistics. Cambridge University Press, 2011.
- Magalhães, M. N. Noções de Probabilidade e Estatística. 7ª ed. São Paulo: EDUSP, 2015.