O que é o coeficiente de correlação de Pearson (r)?

É uma medida que vai de -1 a +1 da força e direção da associação linear entre duas variáveis numéricas. Valores próximos de 0 indicam ausência de relação linear; próximos de +1 ou -1 indicam relação linear forte.

Correlação significa causa?

Não. Uma correlação forte e estatisticamente significativa só indica que as duas variáveis variam juntas — pode haver uma terceira variável causando ambas, pode ser coincidência (correlação espúria), ou a relação pode ser invertida.

O que é o R² (coeficiente de determinação)?

É r elevado ao quadrado e representa a proporção da variância de uma variável explicada pela outra. Um R² de 0,64 significa que 64% da variação de Y pode ser explicada por uma relação linear com X.

Como interpretar o valor-p da correlação?

O valor-p testa a hipótese nula de que a correlação verdadeira na população é zero. Um valor-p baixo (geralmente < 0,05) sugere que a correlação observada dificilmente surgiu por puro acaso, dado o tamanho da amostra.

Calculadora de Correlação de Pearson

O que é a correlação de Pearson

A correlação de Pearson (r) é uma medida que sintetiza, em um único número entre −1 e +1, a força e a direção da relação linear entre duas variáveis numéricas. É talvez a estatística descritiva mais conhecida fora do mundo acadêmico — e, justamente por isso, uma das mais mal interpretadas. Entender o que ela mede de verdade muda a forma como você lê tabelas de dashboards, papers e reportagens.

A intuição é direta: quando r é próximo de +1, as duas variáveis sobem juntas em um padrão quase retilíneo; quando é próximo de −1, uma sobe enquanto a outra cai, também em linha; quando é próximo de 0, não existe relação linear aparente entre elas. O termo "linear" é a parte importante — e a parte mais traída na prática. Pode existir uma relação fortíssima entre X e Y, em forma de U ou exponencial, e mesmo assim o r ficar perto de zero porque a reta de melhor ajuste é horizontal.

Em termos práticos, o que o r mede é o quanto os pares (x, y) se alinham ao longo de uma reta inclinada. Ele não mede: relações não lineares (parabólicas, sinusoidais, em patamares), relações monotônicas mas curvas (para isso use Spearman), associação entre variáveis categóricas (use qui-quadrado) e, sobretudo, causalidade. Que duas séries andem juntas não diz nada sobre o que faz uma mexer a outra — e é exatamente aí que muita análise descarrila.

Quando usar Pearson, Spearman ou Kendall

Existem três coeficientes de correlação que aparecem na prática, e a escolha depende da natureza dos dados e do tipo de relação que se quer captar. A tabela abaixo resume as diferenças:

Coeficiente	O que mede	Tipo de variável	Quando usar
Pearson (r)	Associação linear	Intervalar ou de razão	Dados numéricos contínuos, sem outliers fortes, relação razoavelmente linear.
Spearman (ρ)	Associação monotônica (pela ordem)	Ordinal, intervalar ou de razão	Dados ordinais (Likert, postos), distribuição assimétrica ou presença de outliers.
Kendall (τ)	Concordância entre pares (par a par)	Ordinal, intervalar ou de razão	Amostras pequenas, muitos empates ou quando se quer uma medida mais robusta que Spearman.

Na regra de bolso: se as duas variáveis são quantitativas, a relação parece uma "nuvem alongada" e não há valores extremos absurdos, Pearson é a escolha natural. Se a relação é monotônica mas curva — por exemplo, quanto mais experiência, mais salário, mas em ritmo decrescente —, ou se os dados são ranks/escalas Likert, prefira Spearman. Kendall é uma opção mais conservadora e robusta, especialmente útil em amostras pequenas com muitos empates, embora seja menos popular fora da estatística aplicada.

Como o cálculo funciona

O coeficiente de Pearson tem uma fórmula compacta que, lida com calma, revela toda a sua mecânica:

r = Σ(xᵢ − x̄)(yᵢ − ȳ) ÷ √[Σ(xᵢ − x̄)² · Σ(yᵢ − ȳ)²] x̄ e ȳ são as médias de X e Y; o somatório vai de i = 1 até n.

O numerador é a soma dos produtos dos desvios em relação à média. Quando, para a maioria dos pontos, x está acima da média de X e y também está acima da média de Y (ou ambos abaixo), os produtos são positivos e o numerador cresce — sinal de que as variáveis "andam juntas". Quando um está acima e o outro abaixo, o produto é negativo e o numerador cai. Esse numerador, dividido por n − 1, é a covariância amostral: ela já diz a direção da relação, mas tem o defeito de depender das unidades (m, kg, R$).

O denominador é o produto dos desvios padrão de X e Y (somas dos quadrados, com a raiz). Ele padroniza a covariância, "limpando" as unidades. É essa divisão que garante a propriedade matemática mais elegante do coeficiente: pela desigualdade de Cauchy-Schwarz, o numerador nunca pode ser maior, em valor absoluto, do que o denominador. Por isso r fica preso ao intervalo [−1, +1], e o sinal vem direto do numerador.

Para testar se r é diferente de zero na população, usamos a estatística t com n − 2 graus de liberdade:

t = r · √(n − 2) ÷ √(1 − r²)

Esse t é comparado com a distribuição t de Student para obter o valor-p — exatamente a mesma lógica do teste t. Para o intervalo de confiança, a calculadora aplica a transformação z de Fisher (z = atanh(r)), que aproxima a distribuição amostral de r de uma normal, calcula o intervalo nessa escala e depois converte de volta com tanh. É um truque clássico que produz intervalos confiáveis para qualquer n ≥ 4.

Pressupostos

O coeficiente de Pearson pode ser calculado sobre praticamente qualquer par de variáveis numéricas, mas para que o número resultante e o valor-p sejam válidos como inferência, alguns pressupostos precisam estar minimamente atendidos.

Variáveis intervalares ou de razão. As duas variáveis devem ser quantitativas e ter unidades comparáveis ao longo da escala — a diferença entre 10 e 20 precisa significar o mesmo que entre 80 e 90. Notas, alturas, preços e tempos cumprem isso. Postos, classificações e escalas Likert curtas, não. Como verificar: pergunte se faz sentido dizer "X é o dobro de Y" ou somar duas observações. Se não fizer, considere Spearman.

Relação linear. Pearson mede só a parte linear da associação. Se a relação for em forma de U, em patamares ou claramente curva, r vai subestimar a força real. Como verificar: sempre olhe o gráfico de dispersão antes de confiar no r. Se a nuvem de pontos tem um arco visível, transforme uma das variáveis (log, raiz quadrada) ou troque para outro coeficiente.

Ausência de outliers extremos. Por usar quadrados e produtos, Pearson é muito sensível a valores afastados. Um único ponto longe do resto pode inverter o sinal ou inflar artificialmente o r. Como verificar: use boxplots para cada variável e, no gráfico de dispersão, identifique pontos que dominam visualmente o ajuste. Recalcule r sem eles para avaliar o impacto.

Normalidade bivariada aproximada (para inferência). Para que o valor-p e o intervalo de confiança sejam precisos, idealmente os dados deveriam seguir uma distribuição normal bivariada. Em amostras maiores (n ≥ 30) o teorema central do limite resgata o procedimento mesmo com desvios moderados de normalidade. Como verificar: histogramas, gráficos Q-Q e, em caso de dúvida grave, testes como Shapiro-Wilk em cada variável.

Independência das observações. Cada par (xᵢ, yᵢ) deve representar uma observação independente. Dados de séries temporais, medidas repetidas no mesmo sujeito ou amostras com agrupamento (alunos de uma mesma escola) violam isso e inflam o risco de falsos positivos. Como verificar: pergunte como os dados foram coletados — se há repetição, hierarquia ou ordem temporal, será necessário um modelo que reconheça essa estrutura.

Como interpretar o resultado

A calculadora devolve uma série de números — r, r², n, t, valor-p e intervalo de confiança — e cada um conta uma parte da história. Vale entender o papel de cada um.

Magnitude do r. O critério clássico para classificar a força da correlação vem de Cohen (1988), e é o ponto de referência dominante em ciências sociais e da saúde:

\|r\|	Interpretação de Cohen	Leitura prática
≈ 0,10	Pequeno	Efeito tênue, perceptível só em amostras grandes.
≈ 0,30	Moderado	Relação claramente visível em um gráfico de dispersão.
≈ 0,50	Forte	Padrão evidente, com tendência linear nítida.
≥ 0,70	Muito forte	Pontos quase alinhados; r alto exige conferir outliers e linearidade.

Esses cortes são guias, não regras. Em física experimental, um r de 0,5 pode ser sinal de algo errado. Em pesquisa comportamental, um r de 0,3 já é uma descoberta relevante.

R² como variância explicada. O coeficiente de determinação (R² = r²) é talvez a métrica mais útil para comunicar o achado: ele representa a fração da variação de Y que pode ser explicada por uma reta em função de X. Um r = 0,5 produz R² = 0,25 — ou seja, 25% da variação de Y é compatível com uma relação linear com X, e os outros 75% vêm de outras fontes. R² é mais honesto que r para falar de "quanto X explica de Y", porque rebaixa visualmente correlações moderadas que tendem a impressionar mais do que merecem.

Valor-p. O valor-p testa a hipótese nula de que a correlação verdadeira na população é zero. Um valor-p abaixo de 0,05 (limiar convencional) indica que, se a correlação real fosse zero, seria pouco provável observar um r tão extremo quanto este apenas pelo acaso, dada a amostra. Significância estatística não é a mesma coisa que tamanho do efeito: com amostras enormes, correlações minúsculas viram "significativas"; com amostras pequenas, correlações fortes podem não ser. Sempre olhe r, R² e p-valor juntos.

Intervalo de confiança para r. O IC, calculado pela transformação z de Fisher, dá a faixa em que a correlação verdadeira da população provavelmente se encontra. Um IC 95% de [0,12; 0,68] diz que o efeito plausível vai de "pequeno" a "forte" — sinal de que a amostra é insuficiente para precisão. Um IC de [0,42; 0,52] dá uma estimativa apertada e confiável.

Exemplo resolvido

Uma escola de Recife quer saber se há relação entre horas semanais de estudo e nota no simulado do ENEM (escala de 0 a 1000) entre 8 alunos do terceiro ano. Os dados coletados foram:

Aluno	Horas (X)	Nota (Y)	x − x̄	y − ȳ	(x − x̄)(y − ȳ)
A	5	520	−7,5	−87,5	+656,25
B	8	560	−4,5	−47,5	+213,75
C	10	580	−2,5	−27,5	+68,75
D	12	600	−0,5	−7,5	+3,75
E	14	620	+1,5	+12,5	+18,75
F	15	650	+2,5	+42,5	+106,25
G	17	660	+4,5	+52,5	+236,25
H	19	670	+6,5	+62,5	+406,25

Médias: x̄ = 12,5 horas e ȳ = 607,5 pontos.

Numerador (soma dos produtos dos desvios): Σ(xᵢ − x̄)(yᵢ − ȳ) = 1.710.
Soma dos quadrados de X: Σ(xᵢ − x̄)² = 56,25 + 20,25 + 6,25 + 0,25 + 2,25 + 6,25 + 20,25 + 42,25 = 154.
Soma dos quadrados de Y: Σ(yᵢ − ȳ)² = 7.656,25 + 2.256,25 + 756,25 + 56,25 + 156,25 + 1.806,25 + 2.756,25 + 3.906,25 = 19.350.
Denominador: √(154 · 19.350) = √2.979.900 ≈ 1.726,2.
r = 1.710 ÷ 1.726,2 ≈ 0,991.
R² ≈ 0,981 — cerca de 98% da variação das notas é compatível com uma relação linear com horas de estudo, neste grupo.
Teste de significância: t = 0,991 · √6 ÷ √(1 − 0,981) ≈ 17,6, com df = 6 → valor-p < 0,0001.

A correlação é fortíssima e estatisticamente significativa. Mas atenção: o resultado vale para esta amostra. Antes de concluir que "estudar mais aumenta a nota", lembre que pode haver um confundidor óbvio — alunos mais motivados estudam mais e tiram notas maiores por outras razões (apoio familiar, escola particular, professor de cursinho). A correlação aponta a pista; a explicação causal exige outros desenhos.

Erros comuns

Mesmo analistas experientes tropeçam nas mesmas armadilhas ao trabalhar com Pearson. Vale conhecê-las antes de publicar qualquer número.

Confundir correlação com causa. O erro mais antigo e o mais frequente. Que duas variáveis andem juntas não diz qual causa qual, nem se alguma causa a outra. Pode existir um terceiro fator (confundidor) puxando as duas.
Outliers inflando r. Um único valor extremo no canto certo do gráfico pode levar um r de 0 para 0,8. Sempre olhe o gráfico de dispersão e recalcule r removendo pontos suspeitos para medir o impacto.
Restrição de range. Quando você seleciona apenas uma faixa estreita de X (só alunos com notas altas, só salários acima de R$ 10 mil), o r entre X e Y cai artificialmente, mesmo que a relação populacional seja forte. A solução é coletar dados em toda a amplitude relevante.
Paradoxo de Simpson. Uma correlação positiva no agregado pode virar negativa dentro de cada subgrupo (ou vice-versa). Se há subpopulações relevantes (sexo, estado, escola), calcule a correlação dentro de cada uma antes de reportar a média.
Agregar dados de níveis diferentes. Calcular correlação entre médias municipais e tratar como se fosse correlação entre pessoas é a falácia ecológica. O r entre PIB médio e expectativa de vida por país não diz quase nada sobre indivíduos.

Correlação não é causa

Uma correlação forte só diz que as duas variáveis variam juntas — não diz por quê. Pode haver uma terceira variável causando as duas, a relação pode estar invertida, ou pode ser pura coincidência. Quanto mais séries temporais você compara, mais fácil é encontrar correlações fortes completamente espúrias.

Perguntas frequentes

Qual é a diferença entre r de Pearson e r² (R²)?

O r mede a força e a direção da relação linear e vai de −1 a +1. O r² é o quadrado desse valor, sempre entre 0 e 1, e representa a proporção da variância de Y explicada por X em uma reta de regressão. Um r de −0,8 e um r de +0,8 produzem o mesmo r² de 0,64, ou seja, 64% de variância compartilhada.

Posso usar Pearson com dados ordinais?

Não é recomendado. Pearson exige variáveis numéricas com intervalos comparáveis (escala intervalar ou de razão). Para dados ordinais — postos, notas em escala Likert, classificações —, use a correlação de Spearman ou o tau de Kendall, que trabalham com a ordem dos valores em vez dos valores brutos.

Quantas observações eu preciso para calcular Pearson?

Tecnicamente o cálculo funciona com 3 pares, mas o resultado é instável. Para uma estimativa confiável e um valor-p informativo, considere pelo menos 30 pares. Para detectar correlações pequenas (r ≈ 0,1) com poder estatístico de 80%, é comum precisar de mais de 700 observações — use a calculadora de tamanho de amostra para planejar.

Um r de 0,3 é significativo?

Depende do tamanho da amostra. Com n = 20, um r de 0,3 não chega a ser estatisticamente significativo (p ≈ 0,2). Com n = 100, o mesmo r de 0,3 já fica significativo (p < 0,005). Significância estatística e tamanho do efeito são duas coisas diferentes — sempre olhe os dois, junto com o intervalo de confiança.

Correlação alta implica causalidade?

Não. Mesmo um r próximo de 1 só diz que as duas variáveis variam juntas. A causa pode estar invertida, pode haver uma terceira variável explicando as duas (confundidor) ou pode ser pura coincidência. Para inferir causa, é preciso desenho experimental — randomização, controle, séries temporais com defasagem — ou ferramentas de estatística causal.

Como interpretar correlação negativa?

Uma correlação negativa significa que, quando uma variável aumenta, a outra tende a diminuir — e vice-versa. A força é dada pelo valor absoluto: um r de −0,8 é tão forte quanto um r de +0,8, só que com direção oposta. Exemplos comuns: preço × quantidade demandada, horas de exercício × percentual de gordura corporal.

Correlações espúrias para rir

O caso clássico: o consumo de queijo per capita nos EUA e o número de pessoas que morreram enroladas em lençóis têm correlação de 0,95 entre 2000 e 2009. Em breve uma versão brasileira no projeto Data Folia.

Referências

Cohen J. Statistical Power Analysis for the Behavioral Sciences. 2ª ed. Hillsdale: Lawrence Erlbaum; 1988.
Field A. Discovering Statistics Using IBM SPSS Statistics. 5ª ed. London: SAGE; 2018.
Fisher RA. On the "probable error" of a coefficient of correlation deduced from a small sample. Metron. 1921;1:3–32.
Bussab WO, Morettin PA. Estatística Básica. 9ª ed. São Paulo: Saraiva; 2017.