Variance vs Covariance
Variância e covariância são duas medidas usadas em estatística. Variância é uma medida da dispersão dos dados e covariância indica o grau de alteração de duas variáveis aleatórias juntas. A variação é um conceito bastante intuitivo, mas a covariância é definida matematicamente, não tão intuitivamente.
Mais sobre Variance
Variância é uma medida de dispersão dos dados a partir do valor médio da distribuição. Indica a que distância os pontos de dados estão da média da distribuição. É um dos descritores principais da distribuição de probabilidade e um dos momentos da distribuição. Além disso, a variação é um parâmetro da população, e a variação de uma amostra da população atua como um estimador para a variação da população. De uma perspectiva, é definido como o quadrado do desvio padrão.
Em linguagem simples, pode ser descrita como a média dos quadrados da distância entre cada ponto de dados e a média da distribuição. A fórmula a seguir é usada para calcular a variação.
Var (X) = E [(X-µ)2 ] para uma população e
Var (X) = E [(X-‾x)2 ] para uma amostra
Pode ainda ser simplificado para obter Var (X) = E [X2 ]-(EX])2.
A variação possui algumas propriedades de assinatura e é frequentemente usada em estatísticas para simplificar o uso. A variação não é negativa porque é o quadrado das distâncias. No entanto, o intervalo da variação não é limitado e depende da distribuição específica. A variação de uma variável aleatória constante é zero e a variação não muda em relação a um parâmetro de localização.
Mais sobre Covariância
Na teoria estatística, covariância é uma medida de quanto duas variáveis aleatórias mudam juntas. Em outras palavras, covariância é uma medida da força da correlação entre duas variáveis aleatórias. Além disso, pode ser considerada uma generalização do conceito de variância de duas variáveis aleatórias.
A covariância de duas variáveis aleatórias X e Y, que são distribuídas em conjunto com o segundo momento finito, é conhecida como σXY= E [(X-E [X]) (Y-E [Y])]. A partir disso, a variância pode ser vista como um caso especial de covariância, onde duas variáveis são iguais. Cov (X, X) = Var (X)
Ao normalizar a covariância, é possível obter o coeficiente de correlação linear ou o coeficiente de correlação de Pearson, definido como ρ = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Graficamente, a covariância entre um par de pontos de dados pode ser vista como a área do retângulo com os pontos de dados nos vértices opostos. Pode ser interpretado como uma medida da magnitude da separação entre os dois pontos de dados. Considerando os retângulos para toda a população, a sobreposição dos retângulos correspondentes a todos os pontos de dados pode ser considerada como a força da separação; variação das duas variáveis. A covariância está em duas dimensões, devido a duas variáveis, mas simplificá-la para uma variável fornece a variação de uma única como a separação em uma dimensão.
Qual é a diferença entre Variance e Covariância?
• Variância é a medida de espalhamento / dispersão em uma população, enquanto covariância é considerada como uma medida de variação de duas variáveis aleatórias ou a força da correlação..
• A variação pode ser considerada como um caso especial de covariância.
• Variância e covariância dependem da magnitude dos valores dos dados e não podem ser comparadas; portanto, eles são normalizados. A covariância é normalizada no coeficiente de correlação (dividindo pelo produto dos desvios padrão das duas variáveis aleatórias) e a variação é normalizada no desvio padrão (tomando a raiz quadrada)