sábado, 29 de setembro de 2012

Eu desaprendi Estatística (Estão tornando impraticável se fazer pesquisa)

Acredito ser de conhecimento público que este ano eu estou envolvido até o pescoço com o processo eleitoral, planejando e desenhando pesquisas por amostragem em todos os cantos do país.
De um mês pra cá, ao se aproximar o dia da votação, começei a notar um aumento nas pesquisas registradas e um consequênte aumento nos pedidos de impugnação das mesmas.

Inicialmente eu achava normal, chegava a impugnação, a empresa tinha 48 horas para se defender, era elaborada a defesa,o plano amostral ora criticado era corrigido para suprir as 'falhas apontadas' e a vida prosseguia.

Mas, quanto mais aumentavam as impugnações, notou-se que conceder liminar pela suspensão da pesquisa era a regra, bastava escrever uma meia dúzia de argumentos (Válidos ou não) que Juiz concedia suspensão em Liminar. E NUNCA SE VIA PETIÇÃO ACOMPANHADA DE LAUDO DE UM ESTATÍSTICO, para pelo menos corroborar com o pedido.

E os absurdos metodológicos foram sendo expostos.

E vinha um pedido atras de outro, e começaram a utilizar impugnações concedidas anteriormente para obter as novas... E a roda foi alimentando

Até que ... ontem, 28 de setembro, me chega por fax a seguinte petição referente a um regístro de pesquisa em Uberlândia/MG

O fax continha a decisão do Juiz em conceder liminar para suspender a divulgação da referida pesquisa.

Alegava na inicial a ilustre advogada que:

  1. Ao se consultar o banco de dados do TSE para o município de Uberlândia, o mesmo não continha informação referente a Nivel Econômico do eleitorado.
  2. Intervalo de confiança (95%) e Margem de erro (3,01%) que somados, são inferiores a 100% - Atecnia – Inobservância do disposto no Artigo 1º, inciso IV da Resolução 23.364/2011

Recorrendo ao regístro (link para o mesmo já incluído neste post) e verificamos o seguinte texto para o Plano Amostral:

Plano amostral e ponderação quanto a sexo, idade, grau de instrução e nível econômico do entrevistado; intervalo de confiança e margem de erro:

a) Público pesquisado: Eleitores residentes no perímetro urbano do município

b) tipo de amostra: A amostragem será realizada da seguinte forma:

1. Estratificação so município por agrupamento de Setores Censitários obedecendo critério geográfico (Agrupamento de bairros conforme divisão do IBGE para o CENSO 2010)
2. Tamanho de cada estrato foi definido proporcional ao número de domicílios pertencente a cada um destes (Dados obtidos pelos microdados do CENSO Demográfico de 2010, IBGE)
3. Seleção das Residências segundo critério de amostragem sistemática
4. Realização de entrevistas domiciliares com sorteio dentre os moradores presentes na residência selecionada, obedecendo um quadro de Idade/Sexo gerado de maneira aleatória por um software estatístico, levando em consideração as proporções de idade e sexo constantes no sitio do TSE para o município (Maio/2012)

c) Ponderação: a ponderação por gênero, faixa etária, escolaridade e renda familiar, caso seja preciso, se se baseará nas proporções informadas pelo TSE, as quais podem ser consultadas em: http://www.tse.jus.br/eleicoes/estatisticas/estatistica-do-eleitorado-por-sexo-e-faixa-etaria ou em http://agencia.tse.jus.br/estatistica/sead/odsele/perfil_eleitorado/perfil_eleitorado_ATUAL.zip 

FEMININO, 16 A 24 ANOS; 8,1% / MASCULINO, 16 A 24 ANOS; 7,86%
FEMININO, 25 A 34 ANOS; 12,48% / MASCULINO, 25 A 34 ANOS; 11,83%
FEMININO, 35 A 44 ANOS; 10,67% / MASCULINO, 35 A 44 ANOS; 9,92%
FEMININO, 45 A 59 ANOS; 13,19% / MASCULINO, 45 A 59 ANOS; 11,45%
FEMININO, 60 ANOS OU MAIS; 7,97% / MASCULINO, 60 ANOS OU MAIS; 6,54%

As variaáveis Escolaridade e Nível Econômico são também ponderados a posteriori, baseados em dados referentes ao município, igualmente levantados no endereço http://sidra.ibge.gov.br
Quanto aos valores nominais dos pesos, a priori é impossível determiná-los por se tratar de Varáveis Aleatórias. Ao se definir uma quantidade fixa para eles, a pesquisa deixaria de possuir margem de erro (A pesquisa deixaria de ser probabilística).
 
d) Intervalo de Confiança/Margem de Erro: Para este planejamento amostral, considerando-se um intervalo de confiança de 95%, é esperado um erro máximo de 3,01 pontos percentuais na estimação da proporção das intenções de voto dos candidatos.
Ao analisar o plano com a devida atenção, notamos que a ilustre advogada tentou, na primeira alegação, iludir o magistrado, ao apontar para um endereço constante no registro, mas não o correto, o qual foi informado ao lado da explicação das variáveis em questão.

Mas o erro mais grotesco não foi este, Alegou-se atecnia pelo simples fato da soma Margem de erro + intervalo de confiança não fechar em 100%

Em uma busca utilizando o Google, encontramos inúmeras referências a Intervalo de confiança, encontramos bons vídeos que ilustram o que é intervalo de Confiança. Eu destaco o seguinte:


Existem dúzias de referências na internet, mesmo assim, se conseguiu cometer tal atrocidade,o que nos leva novamente ao início do texto, onde foi comentado que o judiciário concedia liminar impedindo divulgação de pesquisa por qualquer motivo. Não precisava de grandes manobras jurídicas, basta pedir.

Aí fica a questão: Será que já não é chegada a hora de se exigir algo mais? de que se exija pelo menos um parecer de um Estatístico para fundamentar as alegações?

Ao continuar desta forma, no próximo período eleitoral, muita empresa séria deixará de atuar neste nicho, deixando o mercado para os aproveitadores de plantão. Outro cenário possível seria um aumento tão grande de liminares que ninguém mais registraria pesquisa para divulgação, o custo jurídico da mesma não compensaria.

Por este e outros motivos os quais explicarei em um outro post, sou a favor do endurecimento das regras do processo eleitoral, para que todas as ações sejam feitas mediante apresentação de laudo de profissional competente para tal.

Amanhã tentarei subir para este Blog o inteiro teor da petição onde foram feitas tais atrocidades, aguardem e acompanhem