Média vs Mediana vs Modo
Média, mediana e modo são os principais medidas de tendência central usado em estatística descritiva. Eles são completamente diferentes entre si e os casos em que são usados para resumir os dados também são diferentes.
Significar
A média aritmética é a soma dos valores dos dados divididos pelo número de valores dos dados, ou seja.
Se os dados são de um espaço de amostra, isso é chamado de média da amostra (), que é uma estatística descritiva da amostra. Embora seja a medida descritiva mais comumente usada para uma amostra, não é uma estatística robusta. É muito sensível aos valores extremos e oscilações.
Por exemplo, considere a renda média dos cidadãos de uma cidade específica. Como todos os valores dos dados são somados e depois divididos, a renda de uma pessoa extremamente rica afeta a média significativamente. Portanto, os valores médios não são uma boa representação dos dados sempre.
Além disso, no caso de um sinal alternado, a corrente que passa através de um elemento varia periodicamente da direção positiva para a direção negativa e vice-versa. Se tomarmos a corrente média que passa pelo elemento em um único período, ela dará um 0, o que significa que nenhuma corrente passou pelo elemento, o que obviamente não é verdade. Portanto, também neste caso, a média aritmética não é uma boa medida.
A média aritmética é um bom indicador quando os dados são distribuídos uniformemente. Para uma distribuição normal, a média é igual ao modo e mediana. Ele também apresenta os menores resíduos ao considerar o erro quadrático médio da raiz; portanto, a melhor medida descritiva quando é necessário representar um conjunto de dados por um único número.
Mediana
Os valores do ponto de dados do meio após organizar todos os valores em ordem crescente são definidos como a mediana do conjunto de dados. A mediana é o 2º quartil, 5º decil e 50º percentil.
• Se o número de observações (pontos de dados) for ímpar, a mediana será a observação exatamente no meio da lista ordenada.
• Se o número de observações (pontos de dados) for par, a mediana será a média das duas observações do meio na lista ordenada.
A mediana divide a observação em dois grupos; isto é, um grupo (50%) de valores mais altos e um grupo (50%) de valores mais baixos que a mediana. As medianas são usadas especificamente em distribuições inclinadas e representam dados razoavelmente melhores que a média aritmética.
Modo
Modo é o número mais ocorrente em um conjunto de observações. O modo de um conjunto de dados é calculado localizando a frequência de cada elemento dentro do conjunto.
• Se nenhum valor ocorrer mais de uma vez, o conjunto de dados não terá modo..
• Caso contrário, qualquer valor que ocorra com a maior frequência é um modo do conjunto de dados.
Pode existir mais de um modo em um conjunto; portanto, mode não é uma estatística exclusiva de um conjunto de dados. Em uma distribuição uniforme, há um modo. O modo de uma distribuição de probabilidade discreta é o ponto em que a função de massa de probabilidade atinge seu ponto mais alto. Rendendo interpretações acima, podemos dizer que máximos globais são modos.
Considere a aplicação de todas as três medidas ao seguinte conjunto de dados.
DADOS: 1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15
Média = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15+ 15+ ) / 25 = 8,12
Mediana = 9 (13º elemento)
Modo = 9 (frequência de 9 = 5)
Qual é a diferença entre Média, Mediana e Modo?
• Média aritmética é a soma dos valores (observações) divididos pelo número de observações. Não é uma estatística robusta e depende fortemente da natureza da distribuição normal na distribuição considerada. Um único outlier pode causar uma mudança significativa na média, fornecendo valores relativamente enganosos. O conceito pode ser estendido para média geométrica, média harmônica, média ponderada e assim por diante.
• Mediana são os valores médios do conjunto de observações e é relativamente menos afetada pelos valores discrepantes. Pode dar uma boa estimativa, pois a estatística resumida em casos altamente distorcidos.
• Modo são os valores de observação mais comuns no conjunto de dados. Se a distribuição for inclinada positiva, o modo fica à esquerda para a mediana e, se inclinado negativamente, o modo fica à direita para a mediana.
• Se inclinado positivamente, a média está correta na mediana; se a média inclinada negativamente estiver à esquerda da mediana.
• Na distribuição normal, todos os três, média, modo e mediana são iguais.