O que é o teste t de Student
O teste t de Student é o procedimento estatístico mais usado para comparar médias. Ele responde a uma pergunta direta: a diferença entre duas médias — ou entre uma média e um valor de referência — é grande o bastante para ser considerada real, ou pode ser apenas variação aleatória da amostra?
O nome vem de William Sealy Gosset, que publicou o método em 1908 sob o pseudônimo "Student", enquanto trabalhava na cervejaria Guinness. O problema dele era prático: tirar conclusões a partir de amostras pequenas, sem conhecer o desvio padrão verdadeiro da população. É exatamente para isso que o teste t serve — e é por isso que ele é tão comum em pesquisa de saúde, psicologia, educação e qualidade.
A diferença em relação ao teste z está aí: o teste z exige que você conheça o desvio padrão da população; o teste t trabalha com o desvio padrão estimado a partir da própria amostra. Para compensar essa incerteza extra, ele usa a distribuição t, parecida com a curva normal, mas com caudas um pouco mais largas — mais conservadora.
Os três tipos de teste t
Escolher o tipo certo é o passo mais importante. Esta calculadora oferece os três:
1. Teste t para uma amostra
Compara a média de um único grupo com um valor de referência conhecido (μ₀). Exemplo: o peso médio dos pacotes que saem de uma linha de produção é mesmo 500 g? A nota média de uma turma difere da média histórica da escola?
2. Teste t para duas amostras independentes
Compara as médias de dois grupos diferentes e independentes. Exemplo: o tempo de recuperação difere entre quem recebeu o tratamento A e quem recebeu o B? Esta calculadora usa o teste de Welch, que não exige que os dois grupos tenham a mesma variância — a recomendação moderna como padrão.
3. Teste t pareado
Compara duas medidas feitas nos mesmos indivíduos, normalmente antes e depois de uma intervenção. Como cada pessoa é seu próprio controle, ele analisa a média das diferenças individuais. Exemplo: a pressão arterial dos mesmos pacientes caiu após oito semanas de medicação?
Se os mesmos sujeitos foram medidos duas vezes, o teste é pareado — usá-lo como independente desperdiça informação e poder estatístico. Se são dois grupos distintos de pessoas, é independente.
Como o cálculo funciona
Apesar dos três tipos, a ideia é sempre a mesma: dividir a diferença observada pelo erro padrão — uma medida de quanta variação aleatória é esperada. O resultado é a estatística t:
Para o teste de uma amostra, por exemplo, a diferença observada é (média − μ₀) e o erro padrão é o desvio padrão dividido pela raiz de n:
Em seguida, a calculadora precisa dos graus de liberdade (df) — em uma amostra, df = n − 1. Eles definem o formato exato da distribuição t. Por fim, o valor-p traduz o t e os df em probabilidade, usando a função de distribuição da t (calculada aqui pela função beta incompleta, de alta precisão).
Pressupostos do teste t
O teste t é robusto, mas tem condições para funcionar bem:
- Dados quantitativos: a variável medida é numérica (peso, tempo, nota, pressão).
- Amostra aleatória: os dados representam a população de interesse.
- Normalidade aproximada: os dados (ou as diferenças, no caso pareado) seguem aproximadamente uma distribuição normal. Com amostras maiores que ~30, pequenos desvios deixam de ser problema.
- Independência: no teste de duas amostras, os dois grupos não se influenciam.
Quando esses pressupostos falham de forma grave — dados muito assimétricos ou amostras minúsculas —, testes não paramétricos (como Mann-Whitney ou Wilcoxon) são alternativas.
Como interpretar o resultado
A calculadora devolve seis indicadores:
- Estatística t — a diferença em número de erros padrão.
- Graus de liberdade — definem a distribuição usada para o valor-p.
- Valor-p — a probabilidade de observar uma diferença tão grande por acaso. Se for menor que o nível de significância (em geral 0,05), o resultado é significativo.
- Erro padrão — a variação aleatória esperada na estimativa.
- Estimativa pontual — a média (uma amostra) ou a diferença das médias (duas amostras e pareado).
- Intervalo de confiança — a faixa provável do valor real. Se um intervalo para a diferença incluir o zero, a diferença não é significativa.
Exemplo resolvido
Uma equipe de saúde mede a pressão sistólica de 40 pacientes de um posto. A média foi 138 mmHg, com desvio padrão de 16 mmHg. O valor de referência considerado saudável é 130 mmHg. A pressão média desse grupo difere do valor de referência?
- Erro padrão: EP = 16 ÷ √40 ≈ 2,53.
- Estatística t: t = (138 − 130) ÷ 2,53 ≈ 3,16.
- Graus de liberdade: df = 40 − 1 = 39.
- Valor-p bicaudal para t = 3,16 e df = 39: ≈ 0,003.
Como 0,003 < 0,05, a diferença é estatisticamente significativa: a pressão média desse grupo é, de fato, mais alta que o valor de referência. Use o botão "Preencher com exemplo" para ver o cálculo na calculadora.
Perguntas frequentes
Quando devo usar o teste t?
Sempre que quiser comparar médias e o desvio padrão da população for desconhecido — o que é quase sempre o caso na prática. Para comparar proporções ou taxas, use o teste A/B ou o teste de proporção.
Qual a diferença entre teste t e teste z?
O teste z exige conhecer o desvio padrão da população e usa a distribuição normal. O teste t usa o desvio padrão estimado da amostra e a distribuição t, com caudas mais largas para compensar essa incerteza. Com amostras grandes, os dois praticamente coincidem.
O que são graus de liberdade?
São o número de valores livres para variar ao estimar uma estatística. Em uma amostra, são n − 1. Eles determinam o formato da distribuição t: quanto maiores, mais a t se aproxima da curva normal.
Posso usar o teste t com amostras pequenas?
Pode — ele foi criado justamente para isso. Mas, com amostras muito pequenas, a suposição de normalidade fica mais importante e o teste perde poder para detectar diferenças reais.