1001Ferramentas
🔗Calculadoras

Correlação Linear (Pearson r)

Calcula r de Pearson entre dois conjuntos de mesmo tamanho.

r

Coeficiente de correlação de Pearson (r)

O r de Pearson quantifica a força e o sentido da relação linear entre duas variáveis: r = Σ((xᵢ−x̄)(yᵢ−ȳ)) / √(Σ(xᵢ−x̄)²·Σ(yᵢ−ȳ)²). Os valores estão em [−1, 1]; o quadrado é a fração da variância de Y explicada por X. Exemplo: X=[1,2,3,4,5], Y=[2,4,5,4,6] resulta em r ≈ 0,83, ou seja, ≈ 69% da variância de Y é explicada linearmente por X. Pearson é sensível a outliers — um único ponto extremo pode inverter o sinal (quarteto de Anscombe, 1973). Para dados monotônicos não lineares ou escalas ordinais, use o ρ de Spearman.

Aplicações

Diagnóstico de regressão linear, finanças (índice de Sharpe, diversificação de carteira de Markowitz via matriz de correlação entre ativos), epidemiologia (estudos dose-resposta), ciências sociais (confiabilidade teste-reteste), seleção de features em machine learning e controle de qualidade.

Perguntas frequentes

r = 0 significa independência? Não — apenas ausência de relação linear. Y = X² em um intervalo simétrico dá r ≈ 0 apesar da relação determinística perfeita.

Tamanho mínimo de amostra? Matematicamente n ≥ 3, mas para inferência confiável geralmente n ≥ 30. Abaixo disso, r é muito instável.

Pearson ou Spearman? Pearson pressupõe linearidade e dados contínuos aproximadamente normais. Spearman é não-paramétrico — preferível com outliers, ranks ou padrões monotônicos não lineares.

Ferramentas Relacionadas