Apresentamos as probabilidades estatísticas baseadas nos parâmetros do modelo de “Gols Esperados” ou “Expectativa de Gols” (xG), uma métrica consolidada na análise de dados que tem como referência as finalizações cadastradas pelo Espião Estatístico em todos os jogos de Brasileirões desde a edição de 2013.
As variáveis consideradas no modelo são: (1) a distância e o ângulo da finalização em relação ao gol; (2) se a finalização foi feita cara a cara com o goleiro; (3) se foi feita sem a presença do goleiro; (4) a parte do corpo utilizada para concluir; (5) se a finalização foi feita de primeira, ajeitada ou carregada; se o chute foi feito com a perna boa ou ruim do jogador; (6) a origem do lance (pênalti, escanteio, cruzamento, falta direta, roubada de bola, lateral etc); (7) se a assistência foi feita de dentro da área; (8) a posição em que o atleta joga; (9) indicadores de força do chute; (10) o valor de mercado das equipes em cada temporada a partir de dados do site Transfermarkt (como proxy de qualidade do elenco); (11) o tempo de jogo; (12) a idade do jogador; (13) a altura do goleiro em jogadas originadas de bolas aéreas; (14) a diferença no placar no momento de cada finalização.
De cada cem finalizações da meia-lua, por exemplo, apenas sete viram gol. Então, uma finalização da meia-lua tem expectativa de gol (xG) de cerca de 0,07. Cada posição do campo tem uma expectativa diferente de uma finalização virar gol, que cresce se for um contra-ataque por haver menos adversários para evitar a conclusão da jogada. Cada pontuação é somada ao longo da partida para se chegar ao xG total de uma equipe em cada jogo. Essa variação indica as chances de os times vencerem cada adversário e, a partir daí, é calculada a chance de os clubes terminarem o campeonato em cada posição.
O modelo empregado nas análises segue uma distribuição estatística chamada Poisson Bivariada, que calcula as probabilidades de eventos (no caso, os gols de cada equipe) acontecerem dentro de um certo intervalo de tempo (o jogo). Para chegar às previsões sobre as chances de cada time terminar o campeonato em cada posição foi empregado o método de Monte Carlo, que basicamente se baseia em simulações para gerar resultados. Para cada jogo ainda não disputado, realizamos dez mil simulações.
More Stories
Projeto Mar Seguro capacita pescadores e marisqueiras de Madre de Deus
Crescimento do PIB em 4,0% reforça sucesso das políticas econômicas do Governo Lula
Lula comemora alta do PIB: ‘Mais emprego e renda na mão dos brasileiros’