Diferença entre variação da amostra e variação da população

Explicação

Em Estatística, o termo amostragem refere-se à seleção de uma parte dos dados estatísticos agregados com o objetivo de obter informações relevantes sobre o todo. O agregado ou a totalidade das informações estatísticas sobre um caráter específico de todos os membros cobertos pela investigação é chamado de 'população' ou 'universo'. (Das, N. G., 2010). A parte selecionada da população que é usada para obter as características da população ou do universo é denominada 'amostra'. Considera-se que a população é composta por unidades ou membros individuais e algumas das unidades estão incluídas na amostra. O número total de unidades da população é chamado tamanho da população e o da amostra é chamado tamanho da amostra. A população e a amostra podem ser finitas ou infinitas e, da mesma forma, podem ser existentes ou hipotéticas.

Variação: Variação é um valor numérico que mostra a extensão com que as figuras individuais em um conjunto de dados se distribuem sobre a média. É assim que distância cada número está da média e, portanto, um do outro. Uma variação do valor zero significa que todos os dados são idênticos. Mais a variância, mais são os valores espalhados sobre a média, portanto, um do outro. Menos a variância, menos os valores espalhados sobre a média, portanto, um do outro, e a variância não pode ser negativa.

Diferença entre variação populacional e variação amostral

A principal diferença entre a variação populacional e a variação da amostra refere-se ao cálculo da variação. A variação é calculada em cinco etapas. A primeira média é calculada, depois calculamos os desvios da média e, em terceiro lugar, os desvios são quadrados, em quarto lugar os desvios quadrados são somados e, finalmente, essa soma é dividida pelo número de itens para os quais a variação está sendo calculada. Assim variância = Σ (xi-x -) / n. Onde xi = i. Número, x- = média e n = número de itens…

Agora, quando a variação deve ser calculada a partir dos dados da população, n é igual ao número de itens. Portanto, se a variação na pressão sanguínea de todas as 1000 pessoas deve ser calculada a partir de dados sobre a pressão arterial de todas as 1000 pessoas, então n = 1000. No entanto, quando a variação é calculada a partir dos dados da amostra 1 deve ser deduzida de n antes de dividir a soma dos desvios ao quadrado. Assim, no exemplo acima, se os dados da amostra tiver 100 itens, o denominador seria 100 - 1 = 99.

Por esse motivo, o valor da variação calculado a partir dos dados da amostra é superior ao valor que poderia ter sido descoberto usando dados da população. A lógica de fazer isso é compensar nossa falta de informações sobre os dados da população. É impossível descobrir a variação de alturas nos seres humanos, por nossa absoluta falta de informações sobre as alturas de todos os seres humanos vivos, sem falar no futuro. Mesmo se dermos um exemplo moderado, como dados populacionais sobre as alturas de todos os homens vivos nos EUA, isso é fisicamente possível, mas o custo e o tempo envolvidos nisso derrotariam o objetivo de seu cálculo. Esse é o motivo pelo qual os dados de amostra são coletados para a maioria dos propósitos estatísticos e isso é acompanhado pela falta de informações sobre a maioria dos dados. Para compensar isso, o valor da variância e o desvio padrão, que é a raiz quadrada da variância, são mais altos no caso de dados amostrais do que a variação nos dados populacionais.

Isso funciona como um escudo automático para analistas e tomadores de decisão. A lógica se aplica a decisões sobre orçamento de capital, finanças pessoais e comerciais, construção, gerenciamento de tráfego e muitos campos aplicáveis. Isso ajuda o interessado a estar do lado seguro ao tomar uma decisão ou fazer outras inferências.

Resumo: A variação populacional refere-se ao valor da variação calculada a partir dos dados da população e a variação da amostra é a variação calculada a partir dos dados da amostra. Devido a esse valor do denominador na fórmula de variação no caso de dados de amostra, é 'n-1' e 'n' para dados de população. Como resultado, a variação e o desvio padrão derivados dos dados da amostra são mais do que os encontrados nos dados da população.