Brasil tem 4,7% de chances de ganhar a Copa do Mundo, segundo simulações de computador
Achim Zeileis é professor de estatística na Universidade de Innsbruck
Antigamente, quando queríamos saber qual seleção venceria a Copa do Mundo, precisávamos recorrer a videntes com bolas de cristal, adivinhação com folhas de chá ou torcer para que Paul, o Polvo nos indicasse o que iria acontecer.Mas a ciência de dados moderna pode oferecer uma alternativa melhor. Como parte de uma equipe de estatísticos, ajudei a treinar um algoritmo de aprendizado de máquina para prever o desfecho mais provável do torneio.
Previsões probabilísticas e dados viciados
O algoritmo que criamos funciona em duas etapas.
Na primeira, modelos estatísticos sofisticados e insights de especialistas em apostas e no mercado de transferências são combinados para determinar os pontos fortes de todas as seleções e de seus jogadores. Na segunda etapa, um algoritmo de aprendizado de máquina decide a melhor forma de combinar as estimativas de força com outras informações sobre as seleções.
Isso gerou uma previsão probabilística para cada partida possível do torneio. Isso pode ser comparado a um par de dados viciados: em vez de terem os números de 1 a 6 com probabilidades iguais, esses dados viciados têm probabilidades diferentes para o número de gols de cada time.
Por exemplo, de acordo com nossa previsão, o México tem uma média de 1,9 gols
na partida de estreia, enquanto a África do Sul, seu adversário, tem uma média de apenas 0,7. Mas isso não significa que o México certamente vencerá. Em vez disso, uma vitória do México é o resultado mais provável, com 65% de probabilidade. Um empate é menos provável (21%), e uma vitória da África do Sul é o resultado menos provável (14%).
‘Vuelve a casa, el fútbol vuelve a casa!’
Usando diferentes pares de dados viciados, o resultado de cada partida da Copa do Mundo pode ser simulado. Levamos em consideração o sorteio oficial do torneio e todas as regras da Fifa, incluindo a possibilidade de prorrogação e pênaltis. Executamos a simulação 100.000 vezes para determinar o roteiro mais provável do torneio.
Os resultados mostram que a Espanha é a favorita ao título, com uma probabilidade de vitória de 14,5%, seguida de perto pela Inglaterra e pela França, ambas com 12,4%, e pela Alemanha, com 11,2%.
Devido à ampliação do torneio – esta Copa do Mundo conta com 48 seleções e cinco rodadas na fase eliminatória –, este grupo de favoritas está bastante disputado. Portugal e a Argentina também têm boas chances de conquistar o título, com 8,9% e 8,2%, respectivamente. Já o Brasil vem na sétima posição, com 4,7%
Os Estados Unidos, por sua vez, têm boas chances de chegar às oitavas de final: 78%. Essa é a maior probabilidade do grupo, que conta com outras três seleções. Na fase eliminatória, no entanto, quando cada partida é decisiva, as chances da seleção americana “sobreviver” caem relativamente rápido. A probabilidade de uma vitória da seleção anfitriã na final no MetLife Stadium, em Nova Jersey, em 19 de julho, é de apenas 1%.
Um olhar mais profundo na sala de máquinas
Nosso algoritmo de aprendizado de máquina e as simulações subsequentes são alimentados por dados, conhecimento especializado e modelos estatísticos.
Primeiro, todas as partidas internacionais dos últimos oito anos servem de base para uma estimativa “retrospectiva” da força das seleções. Em segundo lugar, uma estimativa “prospectiva” da força é obtida a partir das cotações de várias casas de apostas internacionais, refletindo suas opiniões especializadas sobre o torneio que se aproxima.
Em terceiro lugar, as avaliações dos jogadores individuais são produzidas com base em suas contribuições para os gols nos níveis de clube e nacional. E, finalmente, a qualidade atual e o potencial futuro dos jogadores se refletem em seus esperados valores de mercado.
Essas informações estão disponíveis no site Transfermarkt, que utiliza uma abordagem de sabedoria coletiva para estimar os valores reais de mercado ainda desconhecidos.
Essas quatro variáveis são combinadas com uma ampla gama de outros dados relevantes que refletem a situação atual das diferentes seleções e dos países de origem dos jogadores. Isso inclui detalhes específicos das equipes, como sua classificação na Fifa e o número de jogadores nas semifinais da Liga dos Campeões deste ano. Também levamos em conta fatores socioeconômicos específicos de cada país, como o PIB per capita.
Para determinar se e como essas características são relevantes para os resultados reais em uma Copa do Mundo, foi utilizado um algoritmo de aprendizado de máquina.
Aqui, uma chamada floresta aleatória é treinada, consistindo em muitas árvores de decisão que capturam subconjuntos ligeiramente diferentes dos dados. O algoritmo foi treinado com todos os jogos disputados nos principais torneios de futebol desde a Copa do Mundo de 2006. Assim, ele relaciona a força de uma equipe, seu valor de mercado e outros fatores ao número de gols marcados nas partidas da Copa do Mundo. Essas são as informações que definem o resultado de nossas simulações.
Saiba mais
Esta não é a primeira vez que nossa equipe, composta por Andreas Groll e Rouven Michels e colegas da Universidade Técnica de Dortmund, na Alemanha, Lars Magnus Hvattum da Faculdade Universitária de Molde, na Noruega, Gunther Schauberger da Universidade Técnica de Munique e eu colaboramos para fazer uma previsão da Copa do Mundo.
Na Copa do Mundo Feminina de 2019, previmos corretamente que os EUA seriam os vencedores. Na Copa do Mundo Feminina de 2023 e na Copa do Mundo Masculina de 2022, os vencedores – Espanha e Argentina, respectivamente – não eram nossos favoritos, embora tenhamos previsto que fossem sérios candidatos.
O ponto principal é que previsões tratam de probabilidades. Nosso programa não vai prever o vencedor com 100% de certeza – mas pode se sair melhor do que um molusco de oito braços.
Achim Zeileis, Professor of Statistics, University of Innsbruck
This article is republished from The Conversation under a Creative Commons license. Read the original article.
O que achou dessa notícia? Deixe um comentário abaixo e/ou compartilhe em suas redes sociais. Assim conseguiremos informar mais pessoas sobre as curiosidades do mundo!
Esta notícia foi originalmente publicada em:
Fonte original
