Les algorithmes d’apprentissage automatique peuvent-ils prédire des résultats sportifs ou des jeux?

40

J'ai divers jeux de données de la NFL qui pourraient constituer un bon projet parallèle, mais je ne les ai pas encore utilisés.

Venir sur ce site m’a fait penser à des algorithmes d’apprentissage automatique et je me demandais jusqu’à quel point ils pourraient bien prédire l’issue des matchs de football ou même le prochain match.

Il me semble que certaines tendances pourraient être identifiées - le 3e et le 1er, une équipe avec un fort demi- offensif devrait théoriquement avoir tendance à courir le ballon dans cette situation.

Il peut être plus difficile de prédire le pointage, mais l’équipe gagnante peut l’être.

Ma question est de savoir s'il s'agit de bonnes questions à poser à un algorithme d'apprentissage automatique. Il se peut qu'un millier de personnes l'aient essayé auparavant, mais la nature du sport en fait un sujet peu fiable.

Steve Kallestad
la source

Réponses:

18

Il y a beaucoup de bonnes questions sur le football (et le sport en général) qu'il serait génial de jeter à un algorithme et de voir ce qui en sort. La partie délicate est de savoir quoi jeter dans l’algorithme.

Une équipe avec un bon RB pourrait simplement passer 3e et courte simplement parce que ses adversaires s'attendent probablement à une course, par exemple. Ainsi, afin de produire des résultats louables, j’exposerais le problème en morceaux plus petits et les analyserais de manière statistique tout en les jetant aux machines.

Il y a quelques (bons) sites Web qui essaient de faire la même chose, vous devriez les vérifier et utiliser ce qu'ils ont trouvé pour vous aider:

Et si vous voulez vraiment explorer l'analyse des données sportives, vous devez absolument regarder les vidéos de la conférence sportive de Sloan . Il y en a beaucoup sur Youtube.

ldr
la source
13

Oui. Pourquoi pas?! Avec autant de données enregistrées dans chaque sport de chaque jeu, une utilisation intelligente des données pourrait nous amener à obtenir des informations importantes sur les performances des joueurs.

Quelques exemples:

Donc, oui, l'analyse statistique des enregistrements de joueurs peut nous aider à déterminer quels sont les joueurs les plus susceptibles de jouer, mais pas quels joueurs le feront . Ainsi, l’apprentissage automatique, un proche cousin de l’analyse statistique, va changer la donne.

binga
la source
9

Ils peuvent certainement. Je peux vous cibler un bon papier . Une fois que je l’ai utilisé pour l’implémentation d’un algorithme de prédiction des résultats dans les ligues de football, mon objectif principal était d’avoir une certaine valeur contre les bookmakers.

Extrait du papier:

un modèle généralisé dynamique bayésien pour estimer les aptitudes dépendantes du temps de toutes les équipes d'une ligue et pour prévoir les matches de football du week-end prochain.

Mots clés:

Modèles dynamiques, modèles linéaires généralisés, modèles graphiques, méthodes de Monte-Carlo en chaîne de Markov, prédiction de matches de football

Citation:

Rue, Havard et Oyvind Salvesen. "Prévision et analyse rétrospective des matchs de football dans une ligue." Journal de la Société royale de statistique: série D (The Statistician) 49.3 (2000): 399-418.

IharS
la source
7

L'apprentissage automatique et les techniques statistiques peuvent améliorer les prévisions, mais personne ne peut prédire le résultat réel.

Il y a quelques mois, il y avait eu une compétition difficile pour prédire le tournoi 2014 de la NCAA . Vous pouvez lire le Forum de la concurrence pour avoir une meilleure idée de ce que les gens ont fait et des résultats obtenus.

Stanpol
la source
7

Il a déjà été démontré que les techniques d’apprentissage automatique pouvaient être appliquées à la prévision des résultats sportifs. Une simple recherche sur Google devrait vous donner un tas de résultats.

Cependant, il a également été démontré (pour la NFL btw) que des modèles prédictifs très complexes, des modèles prédictifs simples, des questions posées aux personnes ou des informations sur les foules en utilisant les informations sur les paris sont tous plus ou moins les mêmes. Source: "Une fois que vous avez compris la réponse, tout est évident - le sens commun échoue ", chapitre 7, de Duncan Watts.

iliasfl
la source
Intéressant. La raison pour laquelle j'ai posé la question est que je me suis demandé si quelque chose de semblable à "l'erreur du joueur" (ou même de GF elle-même). Je pensais qu'il y avait une chance que ce fût une entreprise infructueuse. Encore - ces autres réponses sont intrigantes.
Steve Kallestad
6

Michael Maouboussin, dans son livre intitulé "L'équation du succès", cherche à distinguer la chance de l'habileté dans divers domaines, y compris le sport. En réalité, il classe les sports en fonction de la chance qui contribue à la performance dans les différents sports (p. 23) et environ les 2/3 de la performance dans le football sont attribuables à l'habileté. En revanche, j’ai utilisé la technique de MM pour analyser les performances en course de Formule 1 et constaté que 60% était attribuable aux compétences (moins que ce à quoi j’attendais.)

Cela dit, il semble que ce genre d'analyse impliquerait qu'un ensemble de fonctionnalités suffisamment détaillé et élaboré permettrait aux algorithmes ML de prédire les performances des équipes de la NFL, peut-être même au niveau du jeu, tout en gardant à l'esprit qu'une variance importante existerait encore en raison de l'influence. de la chance dans le jeu.

utilisateur44202
la source
5

J'ai fait des recherches dans ce domaine. J'ai trouvé que les chaînes de Markov de premier ordre fonctionnent bien pour prédire la dynamique de notation des matchs dans divers sports.

Vous pouvez lire plus en détail ici: http://www.epjdatascience.com/content/3/1/4

merritts
la source
5

Ils ne peuvent pas prédire, mais ils peuvent vous dire le résultat le plus probable. Etienne a publié une étude sur ce type d’approche - Prédire qui remportera la Coupe du monde avec Wolfram Language . C'est une étude très détaillée, vous pouvez donc vérifier toute la méthodologie utilisée pour obtenir les prévisions.

Assez intéressant, 11 sur 15 matches étaient corrects!

Comme on pouvait s'y attendre, le Brésil est le favori avec une probabilité de victoire de 42,5%. Ce résultat remarquable est dû au fait que le Brésil a à la fois le classement le plus élevé d’Elo et joue chez lui.

(Allons Brésil!)

mtture
la source
3

Beaucoup de gens ont insisté sur ce qui peut être prédit dans leurs réponses. Maintenant, avec la fascination pour l'apprentissage en profondeur, vous pouvez, par exemple, utiliser le RNN (par exemple, le LSTM) pour prédire les résultats des problèmes sportifs basés sur le temps. Ce sont l'état de l'art et battre les modèles traditionnels haut la main.

RAM
la source