Amostragem estratificada vs Amostragem por cluster
Nas estatísticas, principalmente na realização de pesquisas, é importante obter uma amostra imparcial, para que os resultados e as previsões feitas com relação à população sejam mais precisos. Mas, na amostragem aleatória simples, existe a possibilidade de selecionar os membros da amostra que são tendenciosos; em outras palavras, não representa a população de maneira justa. Portanto, a amostragem estratificada e a amostragem por conglomerados são usadas para superar os problemas de viés e eficiência da amostragem aleatória simples.
Amostragem estratificada
A amostragem aleatória estratificada é um método de amostragem no qual a população é dividida pela primeira vez em estratos (um estrato é um subconjunto homogêneo da população). Em seguida, uma amostra aleatória simples é retirada de cada estrato. Os resultados de cada estrato combinado constituem a amostra. A seguir, exemplos de possíveis estratos em populações
• Para uma população de um estado, estratos masculino e feminino
• Para pessoas que trabalham em uma cidade, estratos residentes e não residentes
• Para alunos de uma faculdade, branco, preto, hispânico e asiático
• Para uma audiência de um debate sobre teologia, estratos protestantes, católicos, judeus, muçulmanos
Nesse processo, em vez de coletar amostras aleatoriamente diretamente da população, a população é separada em grupos usando uma característica inerente aos elementos (grupos homogêneos). Em seguida, amostras aleatórias são coletadas do grupo. A quantidade de amostras aleatórias coletadas de cada grupo depende do número de elementos dentro do grupo.
Isso permite que a amostragem seja feita sem que a amostra de um grupo seja maior que o número de amostras necessárias para esse grupo específico. Se o número de elementos de um determinado grupo for maior que a quantidade necessária, uma distorção na distribuição poderá levar a interpretações errôneas..
A amostragem estratificada permite o uso de diferentes métodos estatísticos para cada estrato, o que ajuda a melhorar a eficiência e a precisão da estimativa.
Amostras agrupadas
A amostragem aleatória por cluster é um método de amostragem no qual a população é primeiro dividida em clusters (um cluster é um subconjunto heterogêneo da população). Em seguida, é coletada uma amostra aleatória simples de clusters. Todos os membros dos clusters selecionados juntos constituem a amostra. Esse método é frequentemente usado quando agrupamentos naturais são óbvios e disponíveis.
Por exemplo, considere uma pesquisa para avaliar o envolvimento de estudantes do ensino médio em atividades extracurriculares. Em vez de selecionar alunos aleatórios da população estudantil, selecionar uma turma como amostras para a pesquisa é amostragem por cluster. Em seguida, todos os membros da classe são entrevistados. Nesse caso, as turmas são agrupamentos da população estudantil.
Na amostragem por cluster, são os clusters que são selecionados aleatoriamente, não os indivíduos. Supõe-se que cada cluster por si só é uma representação imparcial da população, o que implica que cada um dos clusters é heterogêneo.
Qual é a diferença entre amostragem estratificada e amostragem por cluster?
• Na amostragem estratificada, a população é dividida em grupos homogêneos chamados estratos, usando um atributo das amostras. Em seguida, os membros de cada estrato são selecionados e o número de amostras colhidas nesses estratos é proporcional à presença dos estratos na população..
• Na amostragem por agrupamento, a população é agrupada em agrupamentos, predominantemente com base na localização e, em seguida, um agrupamento é selecionado aleatoriamente.
• Na amostragem por agrupamento, um agrupamento é selecionado aleatoriamente, enquanto que na amostra estratificada os membros são selecionados.
• Na amostragem estratificada, cada grupo usado (estratos) inclui membros homogêneos enquanto, na amostragem por cluster, um cluster é heterogêneo.
• A amostragem estratificada é mais lenta, enquanto a amostragem por cluster é relativamente mais rápida.
• Amostras estratificadas têm menos erros devido à fatoração na presença de cada grupo na população e à adaptação dos métodos para obter uma melhor estimativa.
• A amostragem de cluster possui uma porcentagem de erro mais alta inerente.