População vs Desvio Padrão da Amostra
Nas estatísticas, vários índices são usados para descrever um conjunto de dados correspondente à sua tendência central, dispersão e assimetria. O desvio padrão é uma das medidas mais comuns de dispersão de dados do centro do conjunto de dados.
Devido a dificuldades práticas, não será possível utilizar dados de toda a população quando uma hipótese for testada. Portanto, empregamos valores de dados de amostras para fazer inferências sobre a população. Em tal situação, eles são chamados de estimadores, pois estimam os valores dos parâmetros da população.
É extremamente importante usar estimadores imparciais na inferência. Um estimador é considerado imparcial se o valor esperado desse estimador for igual ao parâmetro da população. Por exemplo, usamos a média da amostra como um estimador imparcial para a média da população. (Matematicamente, pode-se mostrar que o valor esperado da média da amostra é igual à média da população). No caso de estimar o desvio padrão da população, o desvio padrão da amostra também é um estimador imparcial.
O que é desvio padrão da população?
Quando os dados de toda a população podem ser levados em consideração (por exemplo, no caso de um censo), é possível calcular o desvio padrão da população. Para calcular o desvio padrão da população, primeiro são calculados os desvios dos valores dos dados da média da população. O quadrado médio da raiz (média quadrática) dos desvios é chamado desvio padrão da população.
Em uma classe de 10 alunos, os dados sobre os alunos podem ser facilmente coletados. Se uma hipótese for testada nessa população de estudantes, não será necessário o uso de valores amostrais. Por exemplo, os pesos dos 10 alunos (em quilogramas) são medidos em 70, 62, 65, 72, 80, 70, 63, 72, 77 e 79. Em seguida, o peso médio das dez pessoas (em quilogramas) é (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, que é 71 (em quilogramas). Esta é a média da população.
Agora, para calcular o desvio padrão da população, calculamos os desvios da média. Os respectivos desvios da média são (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 e (79 - 71) = 8. A soma dos quadrados do desvio é ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. O desvio padrão da população é √ (366/10) = 6,05 (em quilogramas). 71 é o peso médio exato dos alunos da turma e 6,05 é o desvio padrão exato do peso de 71.
Qual é o desvio padrão da amostra?
Quando dados de uma amostra (de tamanho n) são usados para estimar parâmetros da população, o desvio padrão da amostra é calculado. Primeiro, os desvios dos valores dos dados da média da amostra são calculados. Como a média da amostra é usada no lugar da média da população (que é desconhecida), a média quadrática não é apropriada. Para compensar o uso da média amostral, a soma dos quadrados dos desvios é dividida por (n-1) em vez de n. O desvio padrão da amostra é a raiz quadrada disso. Em símbolos matemáticos, S = √ ∑ (xEu-ẍ)2 / (n-1), onde S é o desvio padrão da amostra, ẍ é a média da amostra exEusão os pontos de dados.
Agora suponha que, no exemplo anterior, a população seja os alunos de toda a escola. Então, a turma será apenas uma amostra. Se esta amostra for usada na estimativa, o desvio padrão da amostra será √ (366/9) = 6,38 (em quilogramas), uma vez que 366 foi dividido por 9 em vez de 10 (o tamanho da amostra). O fato a observar é que não é garantido que esse seja o valor exato do desvio padrão da população. É apenas uma estimativa para isso.
Qual é a diferença entre o desvio padrão da população e o desvio padrão da amostra? • O desvio padrão da população é o valor exato do parâmetro usado para medir a dispersão do centro, enquanto o desvio padrão da amostra é um estimador imparcial para ele.. • O desvio padrão da população é calculado quando todos os dados sobre cada indivíduo da população são conhecidos. Senão, o desvio padrão da amostra é calculado. • O desvio padrão da população é dado por σ = √ ∑ (xi-µ)2/ n onde µ é a média da população en é o tamanho da população, mas o desvio padrão da amostra é dado por S = √ ∑ (xi-ẍ)2 / (n-1) onde ẍ é a média da amostra en é o tamanho da amostra.
|