Visando esclarecer o tema, este post aborda os problemas conceituais referentes à margem de erro do referido
Lembrando que este tema já foi abordado em um post anterior, quando se detectou tal problema, Esta discussão pode ser acessado aqui
O Golpe da margem de erro
A cerca de 20 dias, fui surpreendido com uma impugnação de uma pesquisa em Uberlândia, onde a advogada reclamante fazia duas alegações: A segunda delas dizia: 'Intervalo de confiança (95%) e Margem de erro (3,01%) que somados, são inferiores a 100% - Atecnia – Inobservância do disposto no Artigo 1º, inciso IV da Resolução 23.364/2011'.Um Estatístico, só de ler tal alegação, já se encontra indignado, pois demonstra o baixo conhecimento do assunto por parte do advogado reclamante.
A margem de erro é um conceito complexo de ser entendido inclusive para pessoas que lidam com a área de ciências exatas. A melhor maneira que encontrei para explicar aos magistrados em nossas defesas foi explicar em conjunto o funcionamento do mecanismo “Margem de erro – Intervalo de confiança – Tamanho da amostra", mostrando, em detalhes a fórmula para seu cálculo.
Verificando-se pela página 6 do documento contido aqui, que a relação 'Margem de Erro - Intervalo de Confiança" não é tão simples assim.
Para se obter o número de indivíduos na amostra (n), é preciso ter conhecimento de:
- Valor crítico que corresponde ao grau de confiança desejado
- Proporção populacional de indivíduos que pertence a categoria que estamos interessados em estudar - No caso em tela, a proporção de voto a um dos candidatos ao cargo de prefeito (p).
- Proporção populacional de indivíduos que NÃO pertence à categoria que estamos interessados em estudar (q = 1 – p) – No caso em tela, a proporção dos indivíduos que NÃO VOTA em um dos candidatos ao cargo de prefeito.
- Margem de erro ou ERRO DE ESTIMATIVA. Esta identifica a diferença máxima entre a PROPORÇÃO AMOSTRAL e a verdadeira PROPORÇÃO POPULACIONAL (p).
Ainda no campo das reclamações referentes a margem de erro em regístro de pesquisa eleitoral, encontramos reclamações como:
- “Apresenta um intervalo de confiança muito baixo, no patamar de 80%, visando baixar a quantidade da amostra”
- “Para fins de Estatística confiável, transparente e verdadeira, o padrão correto é 95%”
A presença do Item 2 nos faz compreender a razão das alegações do ilustre magistrado quando afirma que "uma margem de erro de 5% pode representar uma variação muito grande".
Aos 'Não estatísticos', foi sempre ensinado que o padrão seria 95% e todos esperam tal valor para um intervalo de confiança. Também observamos no artigo do jurista em questão que 'Se o candidato “A” estiver com 40% e o candidato “B” com 50% eles estarão tecnicamente empatados. Na prática, se a pesquisa concluir por empate técnico a vitória com 10.000 (mil) votos ainda estará dentro da margem de erro'.
Esta afirmativa seria correta SE não existisse a possibilidade de: Brancos, Nulos, Indecisos, outros candidatos, etc.
Ao se atribuir erro máximo de 5%, este ocorrendo em sua totalidade (Em um intervalo de confiança de 95%, implica que tal erro de 5% ocorrerá no máximo em 5% dos casos), mas ele se diluirá entre as demais opções, o que tornaria, na prática, impossível estes 5% se unirem a um determinado candidato. Além do mais, um intervalo de confiança é centrado na média, errar 'para baixo' teria uma probabilidade de 2,5% em um intervalos de confiança de 95%. Na verdade, no caso demonstrado pelo magistrado, a probabilidade de encontrarmos tal aberração seria no máximo 2,5% (Definição de intervalo de confiança).
Ainda referente a esta afirmativa, acredito que tenha se baseado no 'senso comum de que dada uma margem de erro, ela é a mesma para todos os candidatos. Verificamos na página 7 do referido documento, que quando não conhecemos o valor correto para a proporção, se substitui p*q por 0.25 (O documento não explica o motivo, mas se deve ao fato de que o valor máximo possível para este produto ser este).
Ao se afirmar que em uma amostra de 385 (Este valor seria o tamanho mínimo de amostra para produzir uma margem de erro máxima de 5% em um intervalo de confiança de 95%), estamos testando a hipotese:
H0: p = 0.5 contra H1: p <> 0.5
dado uma estimativa de 0.4 para este p, o que nos leva, após calcular os valores da estatística do teste, a encontrar uma probabilidade desta afirmativa (p=0.5) ser verdadeira próxima a 0.03%, o que nos leva à conclusão, com uma segurança acima de qualquer suspeita, de que esta margem de erro é algo quase impossível de ser observado na prática.
Este erro de interpretação ocorre muito por culpa da imprensa, que não encontrou ainda uma forma melhor de explicar o funcionamento da 'Margem de erro' ao público em geral. Este assunto será tema de um outro post, ainda este ano.
Meu próximo post, a ser publicado ainda hoje, tratará do mito de obedecer aos padrões de proporção
Nenhum comentário:
Postar um comentário