Diferença entre desvio padrão e erro padrão

Introdução

Padrão Deviação (DP) e Spadrão Error (SE) são terminologias aparentemente semelhantes; no entanto, eles são conceitualmente tão variados que são usados ​​quase de forma intercambiável na literatura estatística. Ambos os termos são geralmente precedidos por um símbolo de mais-menos (+/-), o que é indicativo do fato de que eles definem um valor simétrico ou representam um intervalo de valores. Invariavelmente, ambos os termos aparecem com uma média (média) de um conjunto de valores medidos.

Curiosamente, um SE não tem nada a ver com padrões, com erros ou com a comunicação de dados científicos.

Uma análise detalhada da origem e da explicação do SD e SE revelará por que os estatísticos profissionais e aqueles que o usam com curiosidade tendem a errar.

Desvio Padrão (DP)

Um SD é um descritivo estatística que descreve a propagação de uma distribuição. Como métrica, é útil quando os dados são normalmente distribuídos. No entanto, é menos útil quando os dados são altamente inclinados ou bimodais, porque não descrevem muito bem o formato da distribuição. Normalmente, usamos SD ao relatar as características da amostra, porque pretendemos descrever quanto os dados variam em torno da média. Outras estatísticas úteis para descrever a dispersão dos dados são o intervalo interquartil, os percentis 25 e 75 e o intervalo dos dados.

Figura 1. SD é uma medida da propagação dos dados. Quando os dados são uma amostra de uma distribuição normalmente distribuída, espera-se que dois terços dos dados estejam dentro de 1 desvio padrão da média.

A variação é uma descritivo estatística também, e é definido como o quadrado do desvio padrão. Geralmente não é relatado ao descrever resultados, mas é uma fórmula mais matematicamente tratável (também conhecida como a soma dos desvios quadrados) e desempenha um papel na computação das estatísticas..

Por exemplo, se tivermos duas estatísticas P & Q com variações conhecidas var(P) & var(Q), então a variação da soma P + Q é igual à soma das variações: var(P) +var(Q). Agora é evidente por que os estatísticos gostam de falar sobre variações.

Mas os desvios padrão têm um significado importante para a propagação, principalmente quando os dados são normalmente distribuídos: o intervalo médio +/ - 1 SD pode-se capturar 2/3 da amostra, e a média do intervalo +- 2 SD Espera-se que capture 95% da amostra.

O SD fornece uma indicação de quão longe as respostas individuais a uma pergunta variam ou "se desviam" da média. A SD diz ao pesquisador como as respostas estão espalhadas - elas estão concentradas em torno da média ou espalhadas por toda parte? Todos os seus entrevistados classificaram seu produto no meio da sua escala ou alguns o aprovaram e outros o reprovaram?

Considere um experimento em que os entrevistados devem avaliar um produto em uma série de atributos em uma escala de 5 pontos. A média para um grupo de dez entrevistados (rotulados de 'A' a 'J' abaixo) para “bom valor ao dinheiro” foi 3,2 com um SD de 0,4 e a média para “confiabilidade do produto” foi 3,4 com um SD de 2,1.

À primeira vista (olhando apenas os meios), parece que a confiabilidade foi avaliada acima do valor. Porém, o SD mais alto para confiabilidade pode indicar (como mostrado na distribuição abaixo) que as respostas foram muito polarizadas, onde a maioria dos entrevistados não teve problemas de confiabilidade (classificou o atributo como “5”), mas um segmento menor, mas importante, de respostas. um problema de confiabilidade e classificou o atributo "1". Observar a média por si só conta apenas parte da história; no entanto, mais frequentemente do que não, é nisso que os pesquisadores se concentram. A distribuição das respostas é importante a considerar e o DS fornece uma medida descritiva valiosa dessa.

Respondente Bom valor ao dinheiro Confiabilidade do produto
UMA 3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
Eu 3 5
J 3 5
Significar 3.2. 3.4.
Std. Dev. 0,4 2.1

Primeira pesquisa: entrevistados classificando um produto em uma escala de 5 pontos

Duas distribuições muito diferentes de respostas para uma escala de classificação de 5 pontos podem produzir a mesma média. Considere o exemplo a seguir, mostrando valores de resposta para duas classificações diferentes.

No primeiro exemplo (Classificação “A”), DP é zero porque TODAS as respostas foram exatamente o valor médio. As respostas individuais não se desviaram da média.

No Rating “B”, mesmo que a média do grupo seja a mesma (3.0) da primeira distribuição, o Desvio Padrão é maior. O desvio padrão de 1,15 mostra que as respostas individuais, em média *, estavam um pouco acima de 1 ponto da média.

Respondente Classificação "A" Classificação "B"
UMA 3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
H 3 4
Eu 3 4
J 3 5
Significar 3.0 3.0
Std. Dev. 0,00 1,15

Segunda pesquisa: entrevistados classificando um produto em uma escala de 5 pontos

Outra maneira de olhar para o SD é plotando a distribuição como um histograma de respostas. Uma distribuição com um SD baixo seria exibida como uma forma estreita e alta, enquanto um SD grande seria indicado por uma forma mais ampla.

O SD geralmente não indica “certo ou errado” ou “melhor ou pior” - um SD mais baixo não é necessariamente mais desejável. É usado apenas como uma estatística descritiva. Descreve a distribuição em relação à média.

Tisenção de responsabilidade técnica relacionada a SD

Pensar no DS como um “desvio médio” é uma excelente maneira de entender conceitualmente seu significado. No entanto, na verdade, não é calculado como uma média (se fosse, chamaríamos de "desvio médio"). Em vez disso, é "padronizado", um método um tanto complexo de calcular o valor usando a soma dos quadrados.

Para fins práticos, o cálculo não é importante. A maioria dos programas de tabulação, planilhas ou outras ferramentas de gerenciamento de dados calculará o SD para você. Mais importante é entender o que as estatísticas transmitem.

Erro padrão

Um erro padrão é um inferencial estatística usada na comparação de médias amostrais (médias) entre populações. É uma medida de precisão da média da amostra. A média da amostra é uma estatística derivada de dados que têm uma distribuição subjacente. Não podemos visualizá-lo da mesma maneira que os dados, pois realizamos um único experimento e temos apenas um único valor. A teoria estatística nos diz que a média da amostra (para uma amostra grande o suficiente e sob algumas condições de regularidade) é distribuída aproximadamente normalmente. O desvio padrão dessa distribuição normal é o que chamamos de erro padrão.

Figura 2. A distribuição na parte inferior representaenvia a distribuição dos dados, enquanto a distribuição no topo é a distribuição teórica da média da amostra. O DP de 20 é uma medida da dispersão dos dados, enquanto o SE de 5 é uma medida de incerteza em torno da média da amostra..

Quando queremos comparar os meios de resultados de um experimento de duas amostras do Tratamento A vs. Tratamento B, precisamos estimar com que precisão medimos os meios.

Na verdade, estamos interessados ​​em medir com precisão a diferença entre os dois meios. Chamamos essa medida de erro padrão da diferença. Você não ficará surpreso ao saber que o erro padrão da diferença nos meios de amostra é uma função dos erros padrão dos meios:

Agora que você entendeu que o erro padrão da média (SE) e o desvio padrão da distribuição (SD) são dois animais diferentes, você pode estar se perguntando como eles se confundiram em primeiro lugar. Embora eles diferem conceitualmente, eles têm um relacionamento simples matematicamente:

,onde n é o número de pontos de dados.

Observe que o erro padrão depende de dois componentes: o desvio padrão da amostra e o tamanho da amostra n. Isso faz sentido intuitivo: quanto maior o desvio padrão da amostra, menos preciso podemos ser sobre nossa estimativa da verdadeira média.

Além disso, quanto maior o tamanho da amostra, mais informações temos sobre a população e mais precisamente podemos estimar a verdadeira média.

SE é uma indicação da confiabilidade da média. Um pequeno EF é uma indicação de que a média da amostra é um reflexo mais preciso da média real da população. Um tamanho de amostra maior normalmente resultará em um SE menor (enquanto o SD não é diretamente afetado pelo tamanho da amostra).

A maioria das pesquisas envolve a coleta de uma amostra de uma população. Em seguida, fazemos inferências sobre a população a partir dos resultados obtidos nessa amostra. Se uma segunda amostra foi desenhada, os resultados provavelmente não corresponderão exatamente à primeira amostra. Se o valor médio para um atributo de classificação for 3,2 para uma amostra, poderá ser 3,4 para uma segunda amostra do mesmo tamanho. Se formos tirar um número infinito de amostras (de tamanho igual) de nossa população, poderemos exibir as médias observadas como uma distribuição. Poderíamos então calcular uma média de todas as nossas médias amostrais. Essa média seria igual à verdadeira média da população. Também podemos calcular o DP da distribuição das médias amostrais. O DP desta distribuição das médias amostrais é o SE de cada média amostral individual.

Temos, portanto, nossa observação mais significativa: SE é o DP da média da população.

Amostra Significar
3.2.
3.4.
3.3.
3.2.
5 ª 3.1.
... . ... .
... . ... .
... . ... .
... . ... .
... . ... .
Significar 3.3.
Std. Dev. 0,13

Tabela que ilustra a relação entre SD e SE

Agora está claro que, se o DP dessa distribuição nos ajudar a entender a distância entre a média amostral e a média populacional real, podemos usar isso para entender a precisão de qualquer média amostral individual em relação à média verdadeira. Essa é a essência do SE.

Na realidade, apenas extraímos uma amostra da nossa população, mas podemos usar esse resultado para fornecer uma estimativa da confiabilidade da média da amostra observada..

De fato, o SE nos diz que podemos ter 95% de confiança de que nossa média amostral observada é mais ou menos aproximadamente 2 (na verdade, 1,96). Erros padrão da média da população.

A tabela abaixo mostra a distribuição das respostas da nossa primeira (e única) amostra usada para nossa pesquisa. O SE de 0,13, sendo relativamente pequeno, nos dá uma indicação de que nossa média é relativamente próxima da média real de nossa população geral. A margem de erro (com 95% de confiança) para nossa média é (aproximadamente) o dobro desse valor (+/- 0,26), indicando que a média verdadeira é mais provável entre 2,94 e 3,46.

Respondente Avaliação
UMA 3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
Eu 3
J 3
Significar 3.2.
Std. Errar 0,13

Sumário

Muitos pesquisadores não conseguem entender a distinção entre desvio padrão e erro padrão, mesmo que eles sejam geralmente incluídos na análise de dados. Embora os cálculos reais de desvio padrão e erro padrão pareçam muito semelhantes, eles representam duas medidas muito diferentes, mas complementares. O SD nos fala sobre o formato de nossa distribuição, quão próximos os valores de dados individuais estão do valor médio. O SE nos diz o quão perto nossa média amostral está da média real da população em geral. Juntos, eles ajudam a fornecer uma imagem mais completa do que a média por si só pode nos dizer.