Utilisation du classement Elo pour les paris sportifs
Statistiques, classement, et probabilités prédictives de résultats sportifs
Au contraire des jeux de hasard pur (loto, roulette, ...), et même s'ils contiennent une part indéniable de hasard, d'imprévisible, les paris sportifs peuvent être cernés, étudiés, à l'aide d'outils mathématiques: statistiques et probabilités.
Les bookmakers en sont la meilleure démonstration: avec un bon niveau d'expertise et de calculs mathématiques, on peut tirer profit des paris sportifs.
Bien, mais comment ? Remplir des tableaux de résultats passés, calculer des moyennes, ou autre écart type, certes, mais comment transformer ces données en paris efficaces ?
Par exemple, comment le fait de savoir qu'un joueur en grande forme qui a gagné 80% de ses dernières matchs m'avance-t-il pour savoir s'il est intéressant de miser dans un match futur où il a une cote de 1,4 ?
Le système de classement Elo est un système de classement que chacun peut mettre en place, utilisant judicieusement les fameuses statistiques relevées jusque là. Ensuite, une fois le classement établi, il permet directement de calculer la probabilité de victoire, donc de comparer avec la cote du bookmaker et finalement de juger mathématiquement si il est intéressant de miser (value bet ou non).
Finalement, le critère de Kelly peut être utilisé pour dimensionner exactement, et de manière optimale, le montant de la mise à parier.
Toute cette méthode mathématique est décrite et détaillée dans cette page.
Établir son propre modèle statistique et son classement Elo
La première partie de la méthode consiste à exploiter les données statistiques avec à la fois son expertise et quelques calculs mathématiques.A ce stade, il faut déjà avoir collecté des données, des statistiques, sur les dernières années (les deux dernières par exemple).
Spécialiser ses données
Dans un tout premier temps, on choisit de se spécialiser, selon son expertise du sport. Par exemple, pour s'intéresser à des paris sportifs de tennis, je peux décider de spécialiser mes données, de les catégoriser par type de surface. Je sépare alors mes données en 4 catégories: résultats de matchs sur terre battue, sur gazon, sur surfaces dures, et une dernière catégorie globale toutes surfaces confondues.Pour des paris sportifs sur des matchs de foot, je peux distinguer championnat, coupe, ...
Je spécialise ainsi mes données selon mes catégories, mes connaissances.
Calculer un classement Elo
L'étape suivante va permettre d'exploiter ces données statistiques par catégorie. On calcule un classement Elo à partir de ces résultats passés de la manière suivante:- On donne pour commencer un classement identique à toutes les joueurs, ou toutes les équipes, de 1500 points ELo
- On prend ensuite l'historique des résultats, nos données statistiques, dans l'ordre chronologique. A chaque match, à partir du résultat, on calcule le nouveau classement Elo de chaque adversaire par la formule mathématique ou à l'aide de la calculatrice suivante:
On peut laisser dans un premier temps le paramètre K = 20. Il sera discuter plus tard, et aussi dans la partie "valider et/ou ajuster le modèle global" - On recommence l'étape précédente, calcul des nouveaux classements, après chaque match dans l'ordre chronologique de notre base de données.
Calculer les probabilités et cotes à partir des classements
Tout l'intérêt du classement de type Elo est justement de permettre le calcul direct de la probabilité de victoire des adversaires. Pour un écart de classement d, la probabilité de victoire estOn peut aussi utiliser la calculatrice suivante qui fait ces calculs mathématiques automatiquement:
Par exemple, si A classé 1900 rencontre B classé 1750, l'écart de classement est d = 150 et la probabilité pour A de gagner est
Repérer les paris intéressants - Détecter un value bet
On arrive maintenant à l'étape centrale: miser ou non !On compare donc notre résultat précédent avec les cotes des bookmakers à la recherche d'un value bet: si un bookmaker propose une cote supérieure, par exemple 1,5 avec l'exemple précédent, je mise ! sinon, je m'abstiens d'investir dans ce pari là.
Combien miser ? Calculer la mise optimale à parier
Dans le cas où on choisit de parier. On voit bien que plus l'écart entre notre cote estimée et celle du bookmaker est importante, plus on a intérêt à miser beaucoup. Mais combien exactement ?La formule mathématique du critère de Kelly répond exactement à cette question.
Avec l'exemple précédent, probabilité de victoire que j'estime à 70% donc une cote de 1,4, si un bookmaker propose une cote de 1,5, alors en utilisant la calculatrice Kelly je trouve que je dois investir 10% de ma bankroll.
Mon classement Elo me permet donc de détecter automatiquement les situations favorables et le montant des mises à parier.
Simuler, tester, évaluer la qualité du modèle
La procédure (algorithme même) précédente permet d'exploiter une base de données statistiques jusqu'à la mise exacte et optimale à investir. Comme tout modèle mathématique, il est important de passer par une phase de test et éventuelle ajustement du modèle. Bien sûr, gratuitement et sans risque !Comment tester le modèle et la procédure sans risque ?
On se rappelle de plus au passage que le modèle comprend un paramètre (K pour l'actualisation des classements) dont la valeur peut encore être validée ou adaptée, voir le paragraphe suivant.
Le modèle mathématique complet doit donc être ajuster et valider. Des simulations permettent cela, simulation par exemple sur un mois complet.
On utilise pour cela systématiquement notre modèle sur tous les matchs relevant d'une de nos catégories spécialisée pour laquelle on a établi un classement Elo. On applique l'algorithme complet précédent: on calcule donc si on doit miser ou non, dans chaque pari proposé par notre bookmaker. Mais, dans cette période de test: on ne mise pas réellement: on simule seulement. On note ce qu'on aurait misé, et le gain ou la perte.
A l'issue de la période de test, gratuite donc car on n'a jamais misé, on peut évaluer la qualité de notre modèle mathématique.
On peut utiliser autant de fois qu'on le souhaite cette même période de test, en faisant varier des paramètres (valeur du paramètre K, montant des mises, ...) afin d'obtenir le gain maximum. Ce gain est alors à la fois théorique: rien n'a été vraiment gagné, et pratique car il provient de données réelles.
Ensuite, on peut soit procéder de même le mois suivant, un autre mois de test, avec le modèle ajusté et optimisé précédent, soit se lancer dans des mises réelles si le modèle nous convient.
Mettre en place un modèle prend du temps, depuis la collecte des données et statistiques passées jusqu'aux calculs mathématiques des classements, probabilités, cotes, et enfin mises, puis la phase de test/ajustement/validation.
On rappelle alors finalement le leitmotiv: Vivre de ses gains ?! oui, c'est possible, cela s'appelle alors un travail !
Retour sur le paramètre K
Le paramètre K utilisé dans le calcul des nouveaux classement après le résultat d'un match peut être ajusté de différentes façon. Plus la valeur de K est importante, plus la variation des classements sera aussi importante. Il s'agit dans le modèle Elo d'un paramètre de stabilité/volatilité des classements: si K est petit (proche de 0), les classements varient peu après un nouveau résultat tandis que pour des valeurs plus importantes les classements varient beaucoup plus rapidement.Le classement Elo à été conçu originellement pour les joueurs d'échecs, où la règle suivante est utilisée:
- K = 40 jusqu'à la 30ème partie du joueur
- K = 20 pour un classement Elo en dessous de 2 400 Elo
- K = 10 pour un classement Elo au-dessus de 2 400.
Pour des paris sportifs sur des matchs de football, en plus du résultat du match, victoire/défaite, on peut avec ce paramètre prendre en compte la différence de niveau pendant le match. Cette différence peut de mesure par l'écart du nombre de buts et son incidence sur le paramètre:
- K = 10 pour 1 but d'écart
- K = 20 pour 2 but d'écart
- K = 30 pour 3 but d'écart
- K = 40 pour plus de 4 but d'écart
Voir aussi: