Diferença entre T-TEST e ANOVA

T-TEST vs. ANOVA

Reunir e calcular dados estatísticos para obter a média é geralmente um processo longo e tedioso. O teste t e a análise de variância unidirecional (ANOVA) são os dois testes mais comuns usados ​​para essa finalidade.

O teste t é um teste de hipótese estatística em que a estatística de teste segue a distribuição t de Student se a hipótese nula for suportada. Este teste é aplicado quando a estatística do teste segue uma distribuição normal e o valor de um termo de escala na estatística do teste é conhecido. Se o termo de dimensionamento for desconhecido, ele será substituído por uma estimativa com base nos dados disponíveis. A estatística do teste seguirá a distribuição t de um aluno.

William Sealy Gosset introduziu a estatística t em 1908. Gosset era químico da cervejaria Guinness em Dublin, Irlanda. A cervejaria Guinness tinha a política de recrutar os melhores graduados de Oxford e Cambridge, selecionando aqueles que poderiam fornecer aplicações de bioquímica e estatística aos processos industriais estabelecidos pela empresa. William Sealy Gosset era um desses graduados. No processo, William Sealy Gosset criou o teste t, que foi originalmente concebido como uma maneira de monitorar a qualidade da cerveja preta (a cerveja escura que a cervejaria produz) de uma maneira econômica. Gosset publicou o teste sob o pseudônimo 'Student' em Biometrika, por volta de 1908. O motivo do pseudônimo foi a insistência de Guinness, pois a empresa queria manter sua política de utilização de estatísticas como parte de seus 'segredos comerciais'..

As estatísticas do teste T geralmente seguem o formato T = Z / s, em que Z e s são funções dos dados. A variável Z é projetada para ser sensível à hipótese alternativa; efetivamente, a magnitude da variável Z é maior quando a hipótese alternativa é verdadeira. Enquanto isso, 's' é um parâmetro de escala, permitindo que a distribuição de T seja determinada. As suposições subjacentes a um teste t são que a) Z segue uma distribuição normal padrão sob a hipótese nula; b) ps2 segue uma distribuição Ï ‡ 2 com p graus de liberdade sob a hipótese nula (onde p é uma constante positiva); e c) o valor de Z e o valor de s são independentes. Em um tipo específico de teste t, essas condições são consequências da população estudada, bem como a maneira pela qual os dados são amostrados.

Por outro lado, a análise de variância (ANOVA) é uma coleção de modelos estatísticos. Embora os princípios da ANOVA tenham sido utilizados por pesquisadores e estatísticos há muito tempo, até 1918, Sir Ronald Fisher fez uma proposta para formalizar a análise de variância em um artigo intitulado 'A correlação entre parentes na suposição de herança mendeliana'. . Desde então, a ANOVA foi ampliada em seu escopo e aplicação. A ANOVA é na verdade um nome impróprio, pois não é derivado das diferenças de variâncias, mas das diferenças entre médias de grupos. Inclui os procedimentos associados nos quais a variação observada em uma variável específica é particionada em componentes atribuíveis a diferentes fontes de variação.

Essencialmente, uma ANOVA fornece um teste estatístico para determinar se as médias de vários grupos são iguais e, como resultado, generaliza o teste t para mais de dois grupos. Uma ANOVA pode ser mais útil que um teste t de duas amostras, pois tem uma menor chance de cometer um erro do tipo I. Por exemplo, ter vários testes t de duas amostras teria uma chance maior de cometer um erro do que uma ANOVA das mesmas variáveis ​​envolvidas para obter a média. O modelo é o mesmo e a estatística do teste é a razão F. Em termos mais simples, os testes t são apenas um caso especial de ANOVA: fazer uma ANOVA terá o mesmo resultado de vários testes t. Existem três classes de modelos ANOVA: a) Modelos de efeitos fixos que assumem que os dados provêm de populações normais, diferindo apenas em suas médias; b) Modelos de efeitos aleatórios que assumem os dados descrevem uma hierarquia de populações variadas cujas diferenças são limitadas pela hierarquia; e c) Modelos de efeitos mistos, situações em que os efeitos fixo e aleatório estão presentes.

Resumo:

  1.  O teste t é usado para determinar se duas médias ou médias são iguais ou diferentes. A ANOVA é preferida ao comparar três ou mais médias ou médias.
  2.  Um teste t tem mais chances de cometer um erro, mais meios são usados, e é por isso que ANOVA é usado ao comparar dois ou mais meios.