Calculadora de Teste t de Student

Compare médias e descubra se a diferença é estatisticamente significativa — para uma amostra, duas amostras independentes ou dados pareados.

Calcular o teste t

Escolha o tipo de teste e informe a média, o desvio padrão e o tamanho de cada amostra.

Tipo de teste t
Sua amostra
Configuração

O que é o teste t de Student

O teste t de Student é o procedimento estatístico mais usado para comparar médias. Ele responde a uma pergunta direta: a diferença entre duas médias — ou entre uma média e um valor de referência — é grande o bastante para ser considerada real, ou pode ser apenas variação aleatória da amostra?

O nome vem de William Sealy Gosset, que publicou o método em 1908 sob o pseudônimo "Student", enquanto trabalhava na cervejaria Guinness. O problema dele era prático: tirar conclusões a partir de amostras pequenas, sem conhecer o desvio padrão verdadeiro da população. É exatamente para isso que o teste t serve — e é por isso que ele é tão comum em pesquisa de saúde, psicologia, educação e qualidade.

A diferença em relação ao teste z está aí: o teste z exige que você conheça o desvio padrão da população; o teste t trabalha com o desvio padrão estimado a partir da própria amostra. Para compensar essa incerteza extra, ele usa a distribuição t, parecida com a curva normal, mas com caudas um pouco mais largas — mais conservadora.

Os três tipos de teste t

Escolher o tipo certo é o passo mais importante. Esta calculadora oferece os três:

1. Teste t para uma amostra

Compara a média de um único grupo com um valor de referência conhecido (μ₀). Exemplo: o peso médio dos pacotes que saem de uma linha de produção é mesmo 500 g? A nota média de uma turma difere da média histórica da escola?

2. Teste t para duas amostras independentes

Compara as médias de dois grupos diferentes e independentes. Exemplo: o tempo de recuperação difere entre quem recebeu o tratamento A e quem recebeu o B? Esta calculadora usa o teste de Welch, que não exige que os dois grupos tenham a mesma variância — a recomendação moderna como padrão.

3. Teste t pareado

Compara duas medidas feitas nos mesmos indivíduos, normalmente antes e depois de uma intervenção. Como cada pessoa é seu próprio controle, ele analisa a média das diferenças individuais. Exemplo: a pressão arterial dos mesmos pacientes caiu após oito semanas de medicação?

Pareado ou independente?

Se os mesmos sujeitos foram medidos duas vezes, o teste é pareado — usá-lo como independente desperdiça informação e poder estatístico. Se são dois grupos distintos de pessoas, é independente.

Como o cálculo funciona

Apesar dos três tipos, a ideia é sempre a mesma: dividir a diferença observada pelo erro padrão — uma medida de quanta variação aleatória é esperada. O resultado é a estatística t:

t = (diferença observada) ÷ (erro padrão) Quanto maior o |t|, mais distante você está da hipótese de "nenhuma diferença".

Para o teste de uma amostra, por exemplo, a diferença observada é (média − μ₀) e o erro padrão é o desvio padrão dividido pela raiz de n:

t = (x̄ − μ₀) ÷ (s ÷ √n)

Em seguida, a calculadora precisa dos graus de liberdade (df) — em uma amostra, df = n − 1. Eles definem o formato exato da distribuição t. Por fim, o valor-p traduz o t e os df em probabilidade, usando a função de distribuição da t (calculada aqui pela função beta incompleta, de alta precisão).

Pressupostos do teste t

O teste t é robusto, mas tem condições para funcionar bem:

  • Dados quantitativos: a variável medida é numérica (peso, tempo, nota, pressão).
  • Amostra aleatória: os dados representam a população de interesse.
  • Normalidade aproximada: os dados (ou as diferenças, no caso pareado) seguem aproximadamente uma distribuição normal. Com amostras maiores que ~30, pequenos desvios deixam de ser problema.
  • Independência: no teste de duas amostras, os dois grupos não se influenciam.

Quando esses pressupostos falham de forma grave — dados muito assimétricos ou amostras minúsculas —, testes não paramétricos (como Mann-Whitney ou Wilcoxon) são alternativas.

Como interpretar o resultado

A calculadora devolve seis indicadores:

  • Estatística t — a diferença em número de erros padrão.
  • Graus de liberdade — definem a distribuição usada para o valor-p.
  • Valor-p — a probabilidade de observar uma diferença tão grande por acaso. Se for menor que o nível de significância (em geral 0,05), o resultado é significativo.
  • Erro padrão — a variação aleatória esperada na estimativa.
  • Estimativa pontual — a média (uma amostra) ou a diferença das médias (duas amostras e pareado).
  • Intervalo de confiança — a faixa provável do valor real. Se um intervalo para a diferença incluir o zero, a diferença não é significativa.

Exemplo resolvido

Uma equipe de saúde mede a pressão sistólica de 40 pacientes de um posto. A média foi 138 mmHg, com desvio padrão de 16 mmHg. O valor de referência considerado saudável é 130 mmHg. A pressão média desse grupo difere do valor de referência?

  1. Erro padrão: EP = 16 ÷ √40 ≈ 2,53.
  2. Estatística t: t = (138 − 130) ÷ 2,53 ≈ 3,16.
  3. Graus de liberdade: df = 40 − 1 = 39.
  4. Valor-p bicaudal para t = 3,16 e df = 39: ≈ 0,003.

Como 0,003 < 0,05, a diferença é estatisticamente significativa: a pressão média desse grupo é, de fato, mais alta que o valor de referência. Use o botão "Preencher com exemplo" para ver o cálculo na calculadora.

Perguntas frequentes

Quando devo usar o teste t?

Sempre que quiser comparar médias e o desvio padrão da população for desconhecido — o que é quase sempre o caso na prática. Para comparar proporções ou taxas, use o teste A/B ou o teste de proporção.

Qual a diferença entre teste t e teste z?

O teste z exige conhecer o desvio padrão da população e usa a distribuição normal. O teste t usa o desvio padrão estimado da amostra e a distribuição t, com caudas mais largas para compensar essa incerteza. Com amostras grandes, os dois praticamente coincidem.

O que são graus de liberdade?

São o número de valores livres para variar ao estimar uma estatística. Em uma amostra, são n − 1. Eles determinam o formato da distribuição t: quanto maiores, mais a t se aproxima da curva normal.

Posso usar o teste t com amostras pequenas?

Pode — ele foi criado justamente para isso. Mas, com amostras muito pequenas, a suposição de normalidade fica mais importante e o teste perde poder para detectar diferenças reais.

Precisa de estatística para a sua área?

Veja os guias práticos de estatística para enfermagem, psicologia e marketing.

Ver os guias por área