Correlação e regressão são ferramentas estatísticas que lidam com duas ou mais variáveis. Embora ambos estejam relacionados ao mesmo assunto, existem diferenças entre os dois. As diferenças entre os dois são explicadas abaixo.
O termo correlação com referência a duas ou mais variáveis significa que as variáveis estão relacionadas de alguma forma. A análise de correlação determina se existe um relacionamento entre duas variáveis e a força do relacionamento. Se duas variáveis x (independentes) e y (dependentes) estão tão relacionadas que a variação na magnitude da variável independente é acompanhada, pela variação na magnitude da variável dependente, diz-se que as duas variáveis estão correlacionadas.
A correlação pode ser linear ou não linear. Uma correlação linear é aquela em que as variáveis estão tão relacionadas que a alteração no valor de uma variável causaria uma alteração no valor de outra variável de forma consistente. Em uma correlação linear, os pontos dispersos relacionados aos respectivos valores de variáveis dependentes e independentes se agrupariam em torno de uma linha reta não horizontal, embora uma linha reta horizontal também indique uma relação linear entre as variáveis se uma linha reta pudesse conectar os pontos que representam as variáveis.
A análise de regressão, por outro lado, usa os dados existentes para determinar um relacionamento matemático entre as variáveis que podem ser usadas para determinar o valor da variável dependente em relação a qualquer valor da variável independente.
A correlação preocupa-se com a medição da força de associação ou intensidade do relacionamento, onde, como regressão, preocupa-se com a previsão do valor da variável dependente em relação a um valor conhecido da variável independente. Isso pode ser explicado com as seguintes fórmulas.
O coeficiente de correlação ou correlação do coeficiente (r) entre x e y é encontrado com a seguinte fórmula;
r = covariância (x, y) /σx.σy, cov (x, y) = xy / n - (Σx / n) (Σy / n), σx e σy são desvios padrão de x e y, respectivamente, e, - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
O coeficiente de correlação r é um número puro e independente da unidade de medida. Assim, se x é a altura (polegadas) e y é o peso (libras) de pessoas de uma determinada região, então r não é em polegadas nem em libras, mas apenas um número.
A equação de regressão é encontrada com a seguinte fórmula;
A equação de regressão de y em x (para descobrir a estimativa de y) é y - y '= byx (x-x‾), byx é chamado coeficiente de regressão de y em x. A equação de regressão de x em y (para descobrir a estimativa de x) é x - x '= bxy (y-y‾), bxy é chamado coeficiente de regressão de x em y.
A análise de correlação não assume dependência de nenhuma variável em relação a outra variável, nem tenta descobrir o relacionamento entre as duas. Simplesmente estima o grau de associação entre variáveis. Em outras palavras, a análise de correlação testa a interdependência das variáveis. A análise de regressão, por outro lado, descreve a dependência da variável dependente ou variável de resposta nas variáveis independentes ou explicativas. A análise de regressão pressupõe que exista uma relação causal unidirecional entre variáveis explicativas e de resposta, e não leva em consideração se essa relação causal é positiva ou negativa. Para correlação, os valores das variáveis dependentes e independentes são aleatórios, mas para os valores de regressão das variáveis independentes não é necessário ser aleatório..
1. A análise de correlação é um teste de interdependência entre duas variáveis. A análise de regressão fornece uma fórmula matemática para determinar o valor da variável dependente em relação a um valor de variável independente / s.
2. O coeficiente de correlação é independente da escolha de origem e escala, mas o coeficiente de regressão não é tão.
Para correlação, os valores de ambas as variáveis devem ser aleatórios, mas isso não é verdade para o coeficiente de regressão..
1. Das, N. G., (1998), Statistical Methods, Calcutta
2. Correlação e Regressão, disponível em www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Regressão e correlação, disponível em www.abyss.uoregon.edu