segunda-feira, 15 de outubro de 2012

O Judiciário e as Pesquisas Eleitorais - A margem de erro

Continuando o explicado no post anterior, oqual foi motivado por um artigo no sítio jusnavigandi que, em uma primeira leitura, se vê que foi um artigo bem intencionado, mas cheio de incoerências estatísticas por parte do autor.

Visando esclarecer o tema, este post aborda os problemas conceituais referentes à margem de erro do referido

Lembrando que este tema já foi abordado em um post anterior, quando se detectou tal problema, Esta discussão pode ser acessado aqui

O Golpe da margem de erro

A cerca de 20 dias, fui surpreendido com uma impugnação de uma pesquisa em Uberlândia, onde a advogada reclamante fazia duas alegações: A segunda delas dizia: 'Intervalo de confiança (95%) e Margem de erro (3,01%) que somados, são inferiores a 100% - Atecnia – Inobservância do disposto no Artigo 1º, inciso IV da Resolução 23.364/2011'.

Um Estatístico, só de ler tal alegação, já se encontra indignado, pois demonstra o baixo conhecimento do assunto por parte do advogado reclamante.

A margem de erro é um conceito complexo de ser entendido inclusive para pessoas que lidam com a área de ciências exatas. A melhor maneira que encontrei para explicar aos magistrados em nossas defesas foi explicar em conjunto o funcionamento do mecanismo “Margem de erro – Intervalo de confiança – Tamanho da amostra", mostrando, em detalhes a fórmula para seu cálculo.

Verificando-se pela página 6 do documento contido aqui, que a relação 'Margem de Erro - Intervalo de Confiança" não é tão simples assim.

Para se obter o número de indivíduos na amostra (n), é preciso ter conhecimento de:

  1. Valor crítico que corresponde ao grau de confiança desejado
  2. Proporção populacional de indivíduos que pertence a categoria que estamos interessados em estudar - No caso em tela, a proporção de voto a um dos candidatos ao cargo de prefeito (p).
  3. Proporção populacional de indivíduos que NÃO pertence à categoria que estamos interessados em estudar (q = 1 – p) – No caso em tela, a proporção dos indivíduos que NÃO VOTA em um dos candidatos ao cargo de prefeito.
  4. Margem de erro ou ERRO DE ESTIMATIVA. Esta identifica a diferença máxima entre a PROPORÇÃO AMOSTRAL e a verdadeira PROPORÇÃO POPULACIONAL (p).
Verifica-se já, pelos itens 1 e 4, que intervalo de confiança e margem de erro NÃO SÃO A MESMA COISA. Valores diferentes de ambos acarretam em tamanhos de amostra diferentes.

Ainda no campo das reclamações referentes a margem de erro em regístro de pesquisa eleitoral, encontramos reclamações como:
  1. “Apresenta um intervalo de confiança muito baixo, no patamar de 80%, visando baixar a quantidade da amostra”
  2. “Para fins de Estatística confiável, transparente e verdadeira, o padrão correto é 95%”
Quanto ao item 1, se observa ainda a falta de conhecimento do tema por parte do advogado reclamante, o qual cria uma relação "intervalo de confiança muito baixo" com a "baixa qualidade da amostra". como se observou acima, o tamanho do intervalo de confiança baixo, na verdade implica no contrário do alegado, pois intervalo de confiança baixo é uma garantia de que a empresa está garantindo ter competência suficiente para ter um erro menor com aquele tamanho de amostra proposto.

A presença do Item 2 nos faz compreender a razão das alegações do ilustre magistrado quando afirma que "uma margem de erro de 5% pode representar uma variação muito grande".

Aos 'Não estatísticos', foi sempre ensinado que o padrão seria 95% e todos esperam tal valor para um intervalo de confiança. Também observamos no artigo do jurista em questão que 'Se o candidato “A” estiver com 40% e o candidato “B” com 50% eles estarão tecnicamente empatados. Na prática, se a pesquisa concluir por empate técnico a vitória com 10.000 (mil) votos ainda estará dentro da margem de erro'.

Esta afirmativa seria correta SE não existisse a possibilidade de: Brancos, Nulos, Indecisos, outros candidatos, etc.

Ao se atribuir erro máximo de 5%, este ocorrendo em sua totalidade (Em um intervalo de confiança de 95%, implica que tal erro de 5% ocorrerá no máximo em 5% dos casos), mas ele se diluirá entre as demais opções, o que tornaria, na prática, impossível estes 5% se unirem a um determinado candidato. Além do mais, um intervalo de confiança é centrado na média, errar 'para baixo' teria uma probabilidade de 2,5% em um intervalos de confiança de 95%. Na verdade, no caso demonstrado pelo magistrado, a probabilidade de encontrarmos tal aberração seria no máximo 2,5% (Definição de intervalo de confiança).


Ainda referente a esta afirmativa, acredito que tenha se baseado no 'senso comum de que dada uma margem de erro, ela é a mesma para todos os candidatos. Verificamos na página 7 do referido documento,  que quando não conhecemos o valor correto para a proporção, se substitui p*q por 0.25 (O documento não explica o motivo, mas se deve ao fato de que o valor máximo possível para este produto ser este).

Ao se afirmar que em uma amostra de 385 (Este valor seria o tamanho mínimo de amostra para produzir uma margem de erro máxima de 5% em um intervalo de confiança de 95%), estamos testando a hipotese:

H0: p = 0.5  contra H1: p <> 0.5

dado uma estimativa de 0.4 para este p, o que nos leva, após calcular os valores da estatística do teste, a encontrar uma probabilidade desta afirmativa (p=0.5) ser verdadeira próxima a 0.03%, o que nos leva à conclusão, com uma segurança acima de qualquer suspeita, de que esta margem de erro é algo quase impossível de ser observado na prática.

Este erro de interpretação ocorre muito por culpa da imprensa, que não encontrou ainda uma forma melhor de explicar o funcionamento da 'Margem de erro' ao público em geral. Este assunto será tema de um outro post, ainda este ano.

Meu próximo post, a ser publicado ainda hoje, tratará do mito de obedecer aos padrões de proporção