Mostrando postagens com marcador previsões. Mostrar todas as postagens
Mostrando postagens com marcador previsões. Mostrar todas as postagens

segunda-feira, 14 de novembro de 2011

Brasileirão 2011 - 40 jogos restando

Mais uma rodada se foi e as coisas vão se clareando para muitas equipes.

No post de hoje vou me limitar apenas a postar os resultados atualizados de maneira semelhante ao último.

> probabilities(dados.2)
                      champ      libert        sulam   rebaixa
América/MG    0.00000000000 0.000000000 0.0005666667 0.9690667
Atlético/GO   0.00000000000 0.000000000 0.8173666667 0.0062000
Atlético/MG   0.00000000000 0.000000000 0.4956000000 0.0767000
Atlético/PR   0.00000000000 0.000000000 0.0119000000 0.8688000
Avaí          0.00000000000 0.000000000 0.0000000000 0.9983667
Bahia         0.00000000000 0.000000000 0.7501666667 0.0221000
Botafogo      0.00500000000 0.550900000 0.4491000000 0.0000000
Ceará         0.00000000000 0.000000000 0.0513000000 0.7212333
Corinthians   0.44046666667 0.998666667 0.0013333333 0.0000000
Coritiba      0.00000000000 0.152600000 0.8474000000 0.0000000
Cruzeiro      0.00000000000 0.000000000 0.1928666667 0.3200333
Figueirense   0.01913333333 0.710566667 0.2894333333 0.0000000
Flamengo      0.00423333333 0.438933333 0.5610666667 0.0000000
Fluminense    0.03416666667 0.778500000 0.2215000000 0.0000000
Grêmio        0.00000000000 0.005233333 0.9938666667 0.0000000
Internacional 0.00000000000 0.107033333 0.8929666667 0.0000000
Palmeiras     0.00000000000 0.000000000 0.6811333333 0.0175000
Santos        0.00003333333 1.000000000 0.0000000000 0.0000000
São Paulo     0.00036666667 0.257566667 0.7424333333 0.0000000
Vasco         0.49660000000 1.000000000 0.0000000000 0.0000000
>

Os resultados acima ilustram o que venho comentado: A 2 rodadas, o América/MG possuia probabilidades baixíssimas de fugir do rebaixamento. Vem fazendo bem a sua parte e já possui hoje uma probabilidade próxima a 4% de escapar. vimos também nesta rodada, o corinthians praticamente assegurar vaga à copa Libertadores 2012. Vimos também o campeonato praticamente se polarizar entre Vasco e corinthians.

Quanto à pontuação para se escapar do rebaixamento, vemos abaixo que 43 pontos tende a ser uma pontuação segura para se manter na série A em 2012:

> with(dados[dados$Pos == 17,], quantile(P, c(0.025, 0.5, 0.975, 0.995)))
 2.5%   50% 97.5% 99.5%
   38    41    43    44
> with(dados[dados$Pos == 16,], quantile(P, c(0.025, 0.5, 0.975, 0.995)))
 2.5%   50% 97.5% 99.5%
   40    43    45    46
>
Veja que em pelo menos 50% das simulações, o 16º conseguiu escapar com 43 ou mais pontos. Por outro lado, em apenas 2,5% das simulações mostraram o 17º alcançando pontuação igual ou superior a este.

Falando de Copa Libertadores, vemos abaixo que 64 pontos continua um valor bem interessante para se garantir no torneio de 2012.

> with(dados[dados$Ranking == 4,], quantile(P, c(0.025, 0.5, 0.975, 0.995), na.rm=TRUE))
 2.5%   50% 97.5% 99.5%
   58    61    63    64
> with(dados[dados$Ranking == 5,], quantile(P, c(0.025, 0.5, 0.975, 0.995), na.rm=TRUE))
 2.5%   50% 97.5% 99.5%
   57    59    62    63
>

Para se escapar da pré-libertadores, no entanto, esta exigencia pula para perto dos 68 pontos. Mas se o assunto for título, seria bom conseguir algo acima dos 70 ponto, veja abaixo:

> with(dados[dados$Ranking == 2,], quantile(P, c(0.025, 0.5, 0.975, 0.995), na.rm=TRUE))
 2.5%   50% 97.5% 99.5%
   61    64    68    68
> with(dados[dados$Pos == 1,], quantile(P, c(0.025, 0.5, 0.975, 0.995)))
 2.5%   50% 97.5% 99.5%
   65    69    73    73
> with(dados[dados$Pos == 2,], quantile(P, c(0.025, 0.5, 0.975, 0.995)))
 2.5%   50% 97.5% 99.5%
   63    66    70    71
>

Partindo da mesma lógica em que se analisou a permanência na Série a para 2012,  note que em 2,5% das simulações, o 2º colocado alcançou pontuação superior ou igual a 70 pontos, para superar esta colocação seria lógico fazer mais que estes 70, contudo, a pontuação do 1º colocado em 47,5% das simulações, esteve entre 69 e 73 pontos. 73 pontos, acredito ser uma pontuação bastante segura para ser o Campeão Brasileiro de 2011.

Continuo aguardando comentários e sugestões quanto a este tema e a todos que tenho discutido ultimamente neste espaço.

No feriado de 15 de novembro tentarei colocar no ar mais um post sobre este assunto, com as probabilidades dos resultados de alguns jogos chave da próxima rodada.

segunda-feira, 31 de outubro de 2011

Previsões Brasileiro 2011 - meus pitacos

Quem me acompanha sabe que a uns 5 anos eu faço por diversão estudos de simulação do Campeonato Brasileiro de Futebol série A.

No último fim de semana, eu andei adaptando os scripts que possuia, os quais eram totalmente escritos em Java,  passando para algo mais próximo de um Estatístico, que é o software R.

As vantagens desta migração são imensas no ponto de vista estatístico, pois os dados passam a ser gerados com algumas facilidades em termos de idéias que não seriam facilmente implementadas em uma linguagem de programação normal.

A partir da rodada seguinte, tentarei colocar alguns destes resultados disponíveis neste meu espaço.

Quero deixar claro que esta divulgação se dá como meio de fazer algo "diferente" do que já existe. algo com um apelo mais estatístico, não tenho intenção de "acertar", sim de mostrar a maneira mais correta de se interpretar as informações que possuímos em mãos.

Para este primeiro preview, fiz uma simulação bem curta, apenas para testar o mecanismo que construí, à medida que forem surgindo idéias de como mostrar melhor esta informação, elas serão com certeza discutidas neste blog.

tentarei colar aqui as saídas tal e qual foram geradas. em um futuro, discutirei com calma todos os detalhes envolvidos no processo entre se ter uma tabela do campeonato semi-preenchida e se obter as probabilidades finais.

As probabilidades para a "libertadores" ainda não foram totalmente corrigidas, creio que nas próximas versões eu possa mostrá-las com maior detalhe, pois elas envolvem algumas coisas que, em princípio, parecem triviais mas acabam por serem tediosos e se não forem feitos com a devida atenção. O resultado será um cálculo errado das mesmas.

Vamos lá então:

Brasileiro 2011- 32ª rodada - Série A - Janela: 10.000 iterações


> probabilities(dados)
               Camp.   top5  last4
América/MG    0.0000 0.0000 0.9915
Atlético/GO   0.0000 0.0021 0.0007
Atlético/MG   0.0000 0.0000 0.0846
Atlético/PR   0.0000 0.0000 0.7610
Avaí          0.0000 0.0000 0.8638
Bahia         0.0000 0.0000 0.2022
Botafogo      0.0742 0.7711 0.0000
Ceará         0.0000 0.0000 0.7437
Corinthians   0.4567 0.9874 0.0000
Coritiba      0.0000 0.0379 0.0000
Cruzeiro      0.0000 0.0000 0.3442
Figueirense   0.0063 0.3222 0.0000
Flamengo      0.0077 0.3717 0.0000
Fluminense    0.0403 0.6666 0.0000
Grêmio        0.0000 0.0478 0.0000
Internacional 0.0107 0.5200 0.0000
Palmeiras     0.0000 0.0005 0.0083
Santos*       0.0000 0.0340 0.0000
São Paulo     0.0019 0.2606 0.0000
Vasco*        0.4022 0.9781 0.0000
* - Equipes previamente classificadas para a copa Toyota Libertadores 2012



Uma maneira mais visual de se mostrar estes dados é a demonstrada a seguir:


A figura anterior foi gerada pelo comando a seguir do software R:

boxplot(
Pos~Equipe, data=dados,
horizontal=TRUE, 
las=2, cex=0.6, col="grey",
xlab="posição prevista ao final do campeonato"
)
abline(v=c(4.5,16.5),lty="dotdash")
title("Boxplot: posição prevista ao final do campeonato")


Gerei mais uma figura semelhante à anterior, representando a pontuação que cada equipe supostamente fará ao fim do campeonato:


a figura foi gerada através do seguinte comando do software R:


boxplot(
P~Equipe, data=dados,
horizontal=FALSE,
las=3, cex=0.5, col="grey",
ylab="Pontuação prevista ao final do campeonato"
)
abline(h=c(68,60,41),lty="dotdash")
title("Boxplot: pontuação prevista por equipe ao final do campeonato")


Pretendo retomar este assunto mais para o fim da semana, afinal de contas estou de folga e com criatividade a mil.