Calculadora de Teste Z

Compare a média de uma amostra com um valor de referência quando o desvio padrão da população é conhecido — e descubra se a diferença é estatisticamente significativa.

Calcular o teste Z

Informe a média e o tamanho da amostra, o desvio padrão da população e o valor de comparação.

Sua amostra
Parâmetros da população
Configuração

O que é o teste Z

O teste z é um teste de hipótese que compara a média de uma amostra com um valor de referência conhecido. Ele responde a uma pergunta direta: a diferença entre a média que você observou e o valor esperado é grande o bastante para ser real, ou pode ser apenas variação aleatória de quem entrou na amostra?

A marca registrada do teste z é um pré-requisito: você precisa conhecer o desvio padrão da população (representado pela letra grega σ, sigma). Não o desvio padrão da sua amostra — o da população inteira de onde a amostra veio. Esse conhecimento é o que permite usar a distribuição normal padrão diretamente, sem nenhuma correção, para calcular as probabilidades.

Por trás do nome está o escore z: a ideia, central em toda a estatística, de medir uma distância em "número de desvios padrão". O teste z aplica esse mesmo conceito à média da amostra. Quando o resultado se afasta muito do valor de referência — medido em erros padrão —, fica improvável que essa distância tenha surgido por acaso.

Quando usar o teste Z

O teste z para uma média é o procedimento certo quando duas condições se combinam:

  • O desvio padrão populacional é conhecido. Isso é mais comum do que parece: testes psicométricos padronizados (QI, provas de larga escala), instrumentos de medição calibrados e processos industriais bem documentados costumam ter um σ estabelecido por anos de dados históricos.
  • A amostra vem de uma população aproximadamente normal — ou é grande. Com uma amostra grande (em geral n acima de ~30), o Teorema Central do Limite garante que a média amostral segue aproximadamente uma distribuição normal, mesmo que os dados originais não sejam normais.
A pergunta de partida

Antes de escolher o teste z, faça uma pergunta honesta: o desvio padrão que você vai usar veio da população (de uma norma, de um manual técnico, de anos de histórico) ou foi calculado a partir desta amostra? Se foi calculado da amostra, o teste correto é o t.

Teste Z ou teste t?

Essa é a dúvida mais comum — e a resposta é simples. Os dois testes comparam médias e seguem a mesma lógica; a diferença está em de onde vem o desvio padrão:

  • Teste z — usa o desvio padrão da população (σ), tratado como um número fixo e conhecido. As probabilidades vêm da distribuição normal padrão.
  • Teste t — usa o desvio padrão estimado da amostra (s). Como essa estimativa carrega incerteza, o teste t emprega a distribuição t, parecida com a normal, mas com caudas um pouco mais largas — mais conservadora.

Na prática, o desvio padrão da população quase nunca é conhecido, e por isso o teste t de Student é o mais usado no dia a dia da pesquisa. O teste z fica reservado para os casos em que σ realmente é conhecido. Há ainda um ponto tranquilizador: conforme a amostra cresce, a distribuição t se aproxima cada vez mais da normal. Com amostras grandes, teste z e teste t produzem resultados praticamente idênticos.

O erro mais frequente

Usar o teste z com o desvio padrão calculado a partir da própria amostra subestima a incerteza e deixa o valor-p artificialmente pequeno. Em amostras pequenas, isso pode transformar um resultado não significativo em "significativo". Na dúvida, use o teste t.

Como o cálculo funciona

O teste z para uma média tem três passos. O primeiro é o erro padrão da média — quanta variação aleatória é esperada de uma amostra para outra. Ele é o desvio padrão da população dividido pela raiz do tamanho da amostra:

EP = σ ÷ √n Quanto maior a amostra, menor o erro padrão — médias de amostras grandes são mais estáveis.

O segundo passo é a estatística z: a distância entre a média da amostra (x̄) e o valor de comparação (μ₀), medida em número de erros padrão.

z = (x̄ − μ₀) ÷ (σ ÷ √n) Quanto maior o |z|, mais distante você está da hipótese de "nenhuma diferença".

O terceiro passo é traduzir o z em valor-p. Aqui entra a distribuição normal padrão e a sua função de distribuição acumulada, representada por Φ (a letra grega fi). Φ(z) dá a probabilidade de a normal padrão ficar abaixo de z. O valor-p combina isso com o tipo de teste:

valor-p (bicaudal) = 2 · [ 1 − Φ(|z|) ]

No teste bicaudal, você pergunta se a média é simplesmente diferente do valor de referência. No teste unicaudal, pergunta se ela é maior (ou menor) — e o valor-p é a metade do bicaudal. A calculadora ainda devolve o z crítico, o corte da distribuição normal para o nível de confiança: para 95% bicaudal, ele vale aproximadamente 1,96.

Como interpretar o resultado

A calculadora devolve seis indicadores. Veja o que cada um significa:

  • Estatística z — a diferença entre a média e o valor de comparação, em número de erros padrão.
  • Valor-p — a probabilidade de observar uma diferença tão grande por acaso. Se for menor que o nível de significância (α, em geral 0,05), o resultado é significativo.
  • Erro padrão — a variação aleatória esperada na estimativa da média.
  • Média da amostra — a estimativa pontual: o melhor palpite, a partir dos seus dados, para a média verdadeira.
  • z crítico — o valor de corte da normal para o nível de confiança. Se o |z| calculado o ultrapassa, o resultado é significativo.
  • Intervalo de confiança — a faixa provável da média verdadeira da população. Se o valor de comparação μ₀ ficar fora desse intervalo, a diferença é significativa.

Valor-p e intervalo de confiança contam a mesma história por dois caminhos. O valor-p compara uma probabilidade com α; o intervalo mostra a faixa de valores plausíveis. Quando o μ₀ cai fora do intervalo, o valor-p fica abaixo de α — os dois sempre concordam.

Exemplo resolvido

Uma escola aplica um teste de QI padronizado em uma turma de 60 alunos. O QI médio observado foi 104. O teste é padronizado para ter, na população, média 100 e desvio padrão 15 — ou seja, σ é conhecido. A turma tem um desempenho médio diferente da referência populacional?

  1. Erro padrão: EP = 15 ÷ √60 ≈ 1,936.
  2. Estatística z: z = (104 − 100) ÷ 1,936 ≈ 2,07.
  3. Valor-p bicaudal para z = 2,07: ≈ 0,039.
  4. Intervalo de confiança de 95% para a média: 104 ± 1,96 · 1,936, ou seja, de ≈ 100,2 a ≈ 107,8.

Como 0,039 < 0,05, a diferença é estatisticamente significativa a 95% de confiança: a turma tem, de fato, um QI médio acima da referência populacional. Repare que o valor 100 fica fora do intervalo de confiança — os dois critérios concordam. Use o botão "Preencher com exemplo" para ver esse cálculo na calculadora.

Perguntas frequentes

Quando devo usar o teste z?

Use o teste z para comparar uma média com um valor de referência quando o desvio padrão da população é conhecido — por exemplo, com testes padronizados, instrumentos calibrados ou processos com longo histórico de dados. Para comparar proporções, use o teste A/B ou o teste de proporção.

Qual a diferença entre teste z e teste t?

O teste z usa o desvio padrão da população e a distribuição normal padrão. O teste t usa o desvio padrão estimado da amostra e a distribuição t, com caudas mais largas para compensar a incerteza dessa estimativa. Quando σ é desconhecido — o caso mais comum —, o correto é o teste t. Com amostras grandes, os dois praticamente coincidem.

O que é a estatística z?

É a distância entre a média da amostra e o valor de comparação, medida em número de erros padrão. Um z de 2, por exemplo, indica que a média observada está a dois erros padrão do valor de referência. Quanto maior o valor absoluto de z, mais forte a evidência contra a hipótese de nenhuma diferença.

O que é o valor-p no teste z?

É a probabilidade de observar uma diferença tão grande quanto a medida, ou maior, supondo que a média verdadeira seja igual ao valor de comparação. Se o valor-p for menor que o nível de significância (em geral 0,05), o resultado é estatisticamente significativo.

O que significa z crítico?

É o valor de corte da distribuição normal padrão para o nível de confiança escolhido. Em um teste bicaudal a 95%, o z crítico vale cerca de 1,96; a 99%, cerca de 2,576. Se o |z| calculado ultrapassar o z crítico, o resultado é significativo naquele nível.

O teste z bicaudal e o unicaudal dão o mesmo valor-p?

Não. O valor-p unicaudal é a metade do bicaudal. O teste bicaudal verifica se a média é apenas diferente do valor de referência; o unicaudal verifica uma direção específica (maior ou menor) e só é válido se essa direção foi definida antes de coletar os dados.

Precisa de estatística para a sua área?

Veja os guias práticos de estatística para enfermagem, psicologia e marketing.

Ver os guias por área