sexta-feira, 19 de outubro de 2012

O Judiciário e as Pesquisas Eleitorais - Sobre o plano amostral e ponderação quanto a sexo, idade, grau de instrução e nível econômico do entrevistado

Este artigo é o terceiro de uma série iniciada para discutir a relação confusa entre o judiciário e as pesquisas eleitorais.

Ao contrário dos primeiros textos, os quais se basearam em um artigo de um Juíz eleitoral publicado no sítio JusNavigandi, este se baseia também em uma decisão da Justiça eleitoral do Piauí, a qual impugnou uma pesquisa do IBOPE.

acredito que tal impugnação seja fruto também de outro mito disseminado sobre as pesquisas, o qual foi definido por Djalma Sobreira Dantas como sendo "A terceira prática, igualmente ilegal, consiste em não obedecer a pesquisa a proporcionalidade do eleitorado de cada bairro, vila ou sítio, entrevistando 5% do universo da pesquisa em uma comunidade que representa apenas 0,05% do eleitorado e deixando de pesquisar outra comunidade que tem 6% dos votantes do município."

Para entender melhor o porquê desta afirmativa - E a impugnação ocorrida no Piauí - ser um absurdo explicaremos a partir de agora o que é um plano amostral, analisando o plano amostral do IBOPE, o qual foi impugnado.

O interessante deste caso do Piauí em particular é que muito provavelmente o reclamante atirou no que viu e acertou o que não viu, pois como será demonstrado a seguir, existem alguns problemas no plano amostral do IBOPE, mas tais irregularidades somente seriam percebidas por um Estatístico com bastante experiência. O que nos deixa a pergunta: Existiu laudo de Estatístico como base para tal impugnação?

Em caso de não existir tal laudo, a sentença desta reclamação feita à justiça eleitoral do Piauí poderá tornar, em tese, qualquer pesquisa registrada hoje no Brasil passível de impugnação.

Sobre o plano amostral e ponderação quanto a sexo, idade, grau de instrução e nível econômico do entrevistado


Plano amostral


Numa pesquisa o plano amostral é um conjunto de etapas que possibilitam a definição de segmentos pertencentes a uma amostra de resultados, os segmentos podem ser a “população” e o “universo”.

A “população” refere-se ao público-alvo pretendido para a extração de informações a uma amostra. O “universo” é o conjunto de todos os elementos amostrais da população.

Dentro da pesquisa a unidade amostral é o ambiente onde está situado o elemento amostral; o elemento amostral, por sua vez, é o objeto de uma mensuração, a fonte de informações sobre o tema e problemapei a ser pesquisado e estudado.

No plano amostral, a extensão geográfica denomina a área geográfica na qual está sendo realizada a coleta de dados de uma pesquisa. O tempo é o prazo referido em dia, semana, mês e ano de levantamento.

É importante salientar que em um plano amostral, deve ser informado como se procederá a amostragem dentre as diversas técnicas disponíveis.

Também deve ser respeitado o que se exige na resolução TSE 23.364/11, onde se impõe a presença de ‘Margem de erro e intervalo de Confiança, o que por sí só já vedaria algumas técnicas de amostragem, como a amostragem por quotas.

O que está constando no regístro

Ao se verificar o regístro da referida pesquisa, se encontra o seguinte texto:

Plano amostral e ponderação quanto a sexo, idade, grau de instrução e nível econômico do entrevistado; intervalo de confiança e margem de erro:

Representativa do eleitorado da área em estudo, elaborada em dois estágios.
No primeiro estágio faz-se um sorteio probabilístico dos setores censitários, onde as entrevistas serão realizadas, pelo método PPT (probabilidade Proporcional ao Tamanho), tomando o eleitorado como base para tal seleção.
No segundo e último estágio, dentro dos setores sorteados, os respondentes são selecionados através de quotas amostrais proporcionais em função de variáveis significativas, a saber:
SEXO: (masculino) 45%; (feminino) 55%;
IDADE: 16-24 (masculino) 23% (feminino) 21%; 25-29 (masculino) 14% (feminino) 14%; 30-39 (masculino) 23% (feminino) 22%; 40-49 (masculino) 17% (feminino) 18%; 50 e+ (masculino) 23% (feminino) 25%;
INSTRUÇÃO: Até Ensino Médio (masculino) 79% (feminino) 77%; Ensino Superior (masculino) 21% (feminino) 23%;
NÍVEL ECONÔMICO: Economicamente ativo (masculino) 76% (feminino) 52%; Não Economicamente ativo (masculino) 24% (feminino) 48%.
Está prevista eventual ponderação para correção das variáveis sexo e idade, com base nos percentuais anteriormente mencionados, caso ocorram diferenças superiores a 3 pontos percentuais entre o previsto na amostra e a coleta de dados realizada.
Para as variáveis de grau de instrução e nível econômico do entrevistado, o fator previsto para ponderação é 1 (resultados obtidos em campo).
O intervalo de confiança estimado é de 95% e a margem de erro máxima estimada considerando um modelo de amostragem aleatório simples, é de 4 (quatro) pontos percentuais para mais ou para menos sobre os resultados encontrados no total da amostra.
FONTE DOS DADOS: Censo 2010 | TSE 2012

Verificamos no texto acima a presença de:
  1. Público pesquisado
  2. Tipo de amostra
  3. Ponderações
  4. Intervalos de Confiança e Margem de Erro
No plano amostral, encontramos os seguintes dizeres:

  1. Representativa do eleitorado da área em estudo, elaborada em dois estágios.
    1. No primeiro estágio faz-se um sorteio probabilístico dos setores censitários, onde as entrevistas serão realizadas, pelo método PPT (probabilidade Proporcional ao Tamanho), tomando o eleitorado como base para tal seleção.
    2. No segundo e último estágio, dentro dos setores sorteados, os respondentes são selecionados através de quotas amostrais proporcionais em função de variáveis significativas
  2. Está prevista eventual ponderação para correção das variáveis sexo e idade, com base nos percentuais anteriormente mencionados, caso ocorram diferenças superiores a 3 pontos percentuais entre o previsto na amostra e a coleta de dados realizada.
  3. Para as variáveis de grau de instrução e nível econômico do entrevistado, o fator previsto para ponderação é 1 (resultados obtidos em campo).
  4. O intervalo de confiança estimado é de 95% e a margem de erro máxima estimada considerando um modelo de amostragem aleatório simples, é de 4 (quatro) pontos percentuais para mais ou para menos sobre os resultados encontrados no total da amostra.
 Verificamos neste texto, no ítem 1, a definição de como se dará o processo de amostragem, a qual consistirá:
  1. Sorteio de setores Censitários
  2. Dentro dos setores, sorteio dos respondentes
Contudo, o texto deixa o plano amostral inconclusivo ao afirmar:
  1. Que as entrevistas serão realizadas pelo método PPT
  2. Será tomando o eleitorado como base para tal seleção
Na minha visão, houve uma ligeira confusão na redação, pois não está claro:
  1.  O processo de sorteio dos setores Censitários
    1.  Sabemos que cada setor Censitário possui quantidades diferentes de residentes, o que demandaria
      1. Probabilidades de seleção diferentes para cada um destes, ou
      2. Ponderação específica em cada um
  2. O processo de se chegar até o eleitor dentro de cada Setor censitário sorteado.
Estas dúvidas existem porque ao se definir o plano amostral em vários estágios, se precisa conhecer exatamente como chegar a cada unidade amostral (1º Estágio = Setores Censitários, 2º Estágio = Eleitor). Contudo, tal informação não prejudica a execução dos trabalhos, pois existe uma linha de raciocínio a ser seguida. Única dúvida que permanece é sobre como se dará a ponderação dos setores censitários (1º estágio)

Vejamos agora outro exemplo de regístro (PI-00583/2012), o qual foi registrado em data próxima ao do IBOPE para a cidade de Teresina/PI

no regístro, encontramos os seguintes dizeres:

Metodologia de pesquisa:
Pesquisa do tipo quantitativa, por amostragem não probabilística por cotas, com aplicação de questionário estruturado e abordagem individual domiciliar. O conjunto do eleitorado do município do TERESINA-PI com 16 anos ou mais de idade será tomado como universo da pesquisa.

Claramente, a empresa informa que está descumprindo a resolução 23.364/2011 do tse ao afirmar que o processo amostral é não probabilístico

Plano amostral e ponderação quanto a sexo, idade, grau de instrução e nível econômico do entrevistado; intervalo de confiança e margem de erro:
A amostragem será por cotas de zona, gênero, escolaridade, faixa etária em acordo com os dados eleitorais disponíveis no TER/TSE e faixa de renda disponível no IBGE com entrevistas distribuídas proporcionalmente entre as cotas citadas com percentuais a saber: SEXO (TSE) MASCULINO = 45,54% e FEMININO = 54,46% ZONA (IBGE) URBANA = 94,27% e RURAL = 5,73% FAIXA ETÁRIA (TSE) ATÉ 24 ANOS = 18,23%, MAIS DE 24 A 34 ANOS = 26,58%, MAIS DE 34 A 44 ANOS = 20,19%, MAIS DE 44 A 59 ANOS = 21,50%, 60 OU MAIS ANOS = 13,50% ESCALARIDADE (TSE) ANALFABETO = 4,63%, LÊ E ESCREVE = 11,81% FUNDAMENTAL INCOMPLETO/COMPLETO = 36,98%, MÉDIO, INCOMPLETO/COMPLETO = 39,31%, SUPERIOR INCOMPLETO/COMPLETO = 7,27% FAIXA DE RENDA (IBGE) ATÉ 1 SALÁRIO MÍNIMO = 52,97%, MAIS DE 1 A 2 SALÁRIOS MÍNIMOS = 23,47%, MAIS DE 2 A 5 SALÁRIOS MÍNIMOS = 14,55% MAIS DE 5 A 10 SALÁRIOS MÍNIMOS = 5,86%, MAIS DE 10 SALÁRIOS MÍNIMOS = 3,15% Nivel de confiança de 95% e Margem de erro máximo admitida de 3%. 
 Neste plano, ao contrário do anterior, não se tem a mínima idéia de o quê se fará para sortear a amostra, prevalece o senso comum de que será feita uma amostra estratificada por zonas

Aí entra em questão a afirmativa do Magistrado Djalma Sobreira, onde ele aponta como provável fonte de manipulação, não obedecer a proporcionalidade do eleitorado de cada bairro. A visão que todos tem de pesquisa eleitoral é a que devemos fazer uma pesquisa tal que todos sejam ouvidos, o que contraria todos princípios de amostragem, onde existem várias soluções de amostragem para se obter uma amostra confiável sem passar por uma estratificação de 'zonas', como proposto neste último regístro.

Infelizmente, os estatísticos, ao não saber redigir corretamente os planos amostrais, estão colaborando e muito para que este tipo de pensamento prospere.

E esta afirmativa de não saber redigir ganha força ao se acessar o sítio do IBOPE, onde encontramos  em detalhes como funciona o processo de amostragem de suas pesquisas.

Neste endereço, descobrimos que o processo de seleção da amostragem final do IBOPE passa por três estágios distintos:
  • Seleção probabilística dos municípios que comporão a amostra por meio do método de Probabilidade Proporcional ao Tamanho (PPT), tomando como base a população de cada um deles. Este método permite que a proporcionalidade existente entre as várias áreas do município sejam respeitadas.
  • Seleção probabilística dos setores censitários do IBGE onde serão realizadas as entrevistas, utilizando também o método PPT.
  • Seleção dos entrevistados de acordo com cotas proporcionais de sexo, idade, grau de instrução e setor de dependência econômica, dentro dos setores censitários sorteados previamente.
    • As cotas servem para evitar erros decorrentes da não existência de cadastros dos eleitores dentro dos setores censitários e da impossibilidade do levantamento de tal informação durante o processo da pesquisa.
Portanto, o IBOPE tem o conhecimento de como fazer, apenas negligenciou a parte de escrita no texto do regístro.