O que é um intervalo de confiança
Quando você mede algo em uma amostra — a altura média de 30 pessoas, a proporção de clientes satisfeitos entre 600 entrevistados — você obtém um número. Mas esse número é só uma estimativa do valor verdadeiro da população, e estimativas trazem incerteza: outra amostra daria um resultado um pouco diferente.
O intervalo de confiança resolve isso. Em vez de entregar um único valor, ele entrega uma faixa de valores plausíveis para o parâmetro que você quer conhecer. No lugar de dizer "a média é 72", ele diz "a média provavelmente está entre 69,0 e 75,0". Essa faixa comunica, de forma honesta, o quanto a sua amostra permite afirmar — e o quanto ainda é dúvida.
Todo intervalo de confiança tem três ingredientes: a estimativa pontual (o valor central, calculado da amostra), a margem de erro (o quanto se soma e se subtrai dela) e o nível de confiança (90%, 95% ou 99%, que define o rigor). O resultado é sempre da forma estimativa ± margem de erro.
Uma observação importante desde já: o intervalo de confiança não é um teste de hipótese. Ele não devolve um veredito de "significativo" ou "não significativo" — apenas estima uma faixa. Para um veredito de decisão, veja o teste t ou o teste de proporção. Os dois conceitos conversam, mas têm propósitos distintos.
O que significa o nível de confiança
O nível de confiança é a parte mais incompreendida da estatística. Ele responde a uma pergunta sobre o método, não sobre um intervalo específico.
Imagine repetir o seu estudo milhares de vezes, sempre com uma nova amostra aleatória, e calcular um intervalo de 95% em cada uma. A interpretação correta é: cerca de 95% desses intervalos conteriam o verdadeiro valor da população, e cerca de 5% não conteriam. O "95%" é a taxa de acerto do procedimento no longo prazo.
Os três níveis usuais representam um equilíbrio entre garantia e precisão:
| Confiança | Significa | Efeito no intervalo |
|---|---|---|
| 90% | Acerta em 9 de cada 10 amostras. | Mais estreito, menos garantia. |
| 95% | Acerta em 19 de cada 20 amostras. | O padrão da maioria das áreas. |
| 99% | Acerta em 99 de cada 100 amostras. | Mais largo, mais garantia. |
Existe um trade-off inevitável: quanto maior a confiança exigida, mais largo fica o intervalo. Um intervalo de 99% é mais cauteloso, mas também mais vago. Para a maioria dos trabalhos, 95% é o ponto de equilíbrio consagrado.
Intervalo de confiança para uma média — t de Student ou normal
Para estimar a média de uma variável quantitativa (peso, nota, tempo, faturamento), o intervalo parte da média da amostra e soma/subtrai a margem de erro:
O erro padrão mede quanto a média da amostra tende a variar de amostra para amostra. Ele encolhe à medida que n cresce — por isso amostras maiores produzem intervalos mais estreitos.
A pergunta-chave é qual distribuição usar para o valor crítico:
- Distribuição t de Student — use quando o desvio padrão é estimado a partir da própria amostra. É o caso quase universal na prática. A distribuição t tem caudas um pouco mais largas que a normal, para compensar a incerteza extra de não conhecer o desvio padrão verdadeiro. O valor crítico depende dos graus de liberdade (df = n − 1).
- Distribuição normal (z) — use somente quando o desvio padrão da população é realmente conhecido, o que é raro fora de exercícios didáticos. Nesta calculadora, é a opção "Populacional".
Na dúvida, escolha "Amostral" (distribuição t): é a opção correta e segura na enorme maioria dos casos. Com amostras grandes (acima de ~30 observações), a t e a normal praticamente coincidem, e a escolha deixa de fazer diferença prática.
Intervalo de confiança para uma proporção — o método de Wilson
Quando o que você mede é uma proporção — a fração de pessoas que aprovam algo, a taxa de sucesso de um procedimento —, a estimativa pontual é simplesmente os sucessos divididos pelo total (p̂ = x ÷ n). A questão é como construir a faixa ao redor dela.
O método clássico de livro-texto é o intervalo de Wald: p̂ ± z × √[p̂(1−p̂)/n]. Ele é simples, mas tem um defeito sério: funciona mal quando a proporção está perto de 0% ou de 100%, ou quando a amostra é pequena. Nesses casos, ele pode até produzir limites impossíveis, abaixo de 0% ou acima de 100%, e sua taxa de acerto real fica bem abaixo do nível anunciado.
Por isso esta calculadora usa o intervalo de Wilson (também chamado de intervalo score). Ele é um pouco mais elaborado, mas bem mais preciso: mantém a taxa de cobertura próxima do nível nominal mesmo com amostras pequenas ou proporções extremas, e nunca ultrapassa os limites de 0% e 100%.
Na prática, você não precisa decorar a fórmula: informe os sucessos e o tamanho da amostra, e a calculadora aplica o método de Wilson automaticamente.
A margem de erro
A margem de erro é a metade da largura do intervalo — o "±" da estimativa. Quando uma pesquisa eleitoral diz "40%, com margem de erro de 2 pontos", ela está descrevendo um intervalo de confiança de [38%; 42%].
Três fatores controlam o tamanho da margem de erro:
- O tamanho da amostra (n). É o fator mais poderoso. A margem encolhe com a raiz quadrada de n: para reduzi-la pela metade, é preciso quadruplicar a amostra. Dobrar n não dobra a precisão.
- O nível de confiança. Exigir 99% em vez de 95% alarga a margem; aceitar 90% a estreita.
- A variabilidade dos dados. Quanto maior o desvio padrão (no caso da média), maior a margem. Dados muito dispersos exigem amostras maiores para a mesma precisão.
Se você ainda está planejando a coleta e quer atingir uma margem de erro alvo, calcule o número de observações necessário antes de começar com a calculadora de tamanho de amostra.
A interpretação correta — e a errada
Esta é a seção mais importante da página. O intervalo de confiança é cercado de mal-entendidos, e usá-lo bem depende de interpretá-lo com exatidão.
Suponha que você calculou um intervalo de 95% para a média igual a [69,0; 75,0]. A leitura correta é:
- "O método que usei acerta o verdadeiro valor em 95% das amostras possíveis; com base nesta amostra, a faixa plausível para a média da população vai de 69,0 a 75,0."
É incorreto dizer "há 95% de probabilidade de a média estar entre 69,0 e 75,0". O verdadeiro valor da população é um número fixo: ele já está dentro deste intervalo específico ou já está fora — não há sorteio. A probabilidade de 95% descreve o procedimento de longo prazo, não este intervalo isolado depois de calculado.
Outros equívocos frequentes que vale evitar:
- "95% dos dados estão dentro do intervalo." Falso. O intervalo é sobre o parâmetro da população (a média ou a proporção), não sobre os valores individuais da amostra.
- "Valores fora do intervalo são impossíveis." Falso. Eles são apenas menos compatíveis com os seus dados; o intervalo marca a faixa plausível, não uma fronteira absoluta.
- "Um intervalo mais estreito é sempre melhor." Nem sempre. Um intervalo estreito obtido com confiança baixa pode acertar menos. Precisão e garantia precisam ser lidas juntas.
A maneira mais sólida de comunicar um resultado é descrever a faixa e o nível: "com 95% de confiança, estimamos a média entre 69,0 e 75,0". Simples, preciso e sem armadilhas.
Exemplo resolvido
Uma escola quer estimar a nota média dos alunos em uma avaliação. Foi sorteada uma amostra de 30 provas, com média de 72 pontos e desvio padrão (amostral) de 8 pontos. Qual o intervalo de 95% de confiança para a nota média de toda a escola?
- Erro padrão: EP = 8 ÷ √30 ≈ 1,461.
- Distribuição: o desvio padrão veio da amostra, então usamos a t de Student, com df = 30 − 1 = 29.
- Valor crítico: para 95% de confiança e 29 graus de liberdade, t ≈ 2,045.
- Margem de erro: ME = 2,045 × 1,461 ≈ 2,99.
- Intervalo: 72 ± 2,99, ou seja, aproximadamente [69,0; 75,0].
Conclusão: com 95% de confiança, a nota média de toda a escola está, provavelmente, entre 69,0 e 75,0 pontos. Use o botão "Preencher com exemplo" acima para ver esse cálculo na calculadora.
Perguntas frequentes
O que é um intervalo de confiança?
É uma faixa de valores, calculada a partir de uma amostra, que provavelmente contém o verdadeiro valor de um parâmetro da população — como uma média ou uma proporção. Em vez de um único número, ele mostra a incerteza da estimativa.
O que significa 95% de confiança?
Significa que o método usado acerta o verdadeiro valor em 95% das amostras possíveis. Não significa que há 95% de probabilidade de o valor real estar dentro deste intervalo específico: ele já contém ou já não contém o valor verdadeiro.
Intervalo de confiança é um teste de hipótese?
Não. O intervalo apenas estima a faixa provável de um parâmetro; ele não devolve um veredito de "significativo" ou "não significativo". Para isso, use um teste de hipótese, como o teste t ou o teste de proporção.
Devo usar a distribuição t ou a normal?
Para a média, use a t de Student quando o desvio padrão vem da própria amostra (o caso mais comum). Use a normal (z) somente quando o desvio padrão da população é realmente conhecido. Com amostras grandes, as duas praticamente coincidem.
Como deixar o intervalo de confiança mais estreito?
Aumente o tamanho da amostra: a margem de erro cai com a raiz quadrada de n. Reduzir o nível de confiança (de 99% para 95%, por exemplo) também estreita o intervalo, mas à custa de uma garantia menor.
Por que a calculadora usa o método de Wilson para proporções?
Porque o método clássico de Wald perde precisão com amostras pequenas ou proporções perto de 0% e 100%, podendo até gerar limites impossíveis. O intervalo de Wilson mantém a cobertura próxima do nível anunciado nesses casos e nunca ultrapassa 0% ou 100%.