Le déséquilibre des probabilités est scientifiquement plausible pour la loterie pancanadienne 6/49

Vendredi dernier (2015-11-06), le journaliste Mathias Marchal a publié un article dans lequel il a examiné les résultats de 3317 tirages de la loterie pancanadienne 6/49 publiés par Loto-Québec. Depuis le 12 juin 1982, parmi les boules numérotées de 1 à 49, certaines sont sorties plus souvent que d’autres. Le journaliste communique avec Loto-Québec qui répond avec une ânerie marketing. Marisol Schnorr indique que des spécialistes en mathématiques de Loto-Québec, qu’on ne nomme pas, auraient examiné ces résultats sans n’y voir rien d’anormal.

Le journaliste s’oriente alors vers deux mathématiciens, certainement compétents, mais qui ne sont manifestement pas familiers avec le domaine du jeu. Les tests qu’ils rapportent n’ont pratiquement pas de puissance statistique. Ils n’ont rien décelé d’anormal ce qui apparaît confirmer la réponse de Marisol Schnorr. Et pourtant, il y a quelque chose à voir.

Voici l’histogramme des résultats des 3317 tirages. À première vue, les boules sortent à peu près à la même fréquence. Il y a des petites différences qui pourraient disparaître après 5000, 100000, ou un million de tirages. C’est ce que suggère le myope test de chi-carré, même adapté pour les tirages sans remise.

Lotto649_long.png
Mais, regardez bien l’histogramme. Il y a une pente positive! Les fréquences à gauche semblent systématiquement moins élevées que les fréquences à droite. En principe, s’il n’y a que le hasard qui détermine le choix des boules, il ne devrait pas y avoir de pente. Évidemment, il s’agit d’un échantillon de 3317 tirages et on ne peut pas s’attendre à un résultat parfait avec un tel échantillon. La question est alors : est-ce que la pente est suffisamment inclinée pour qu’on puisse rejeter l’hypothèse d’une pente nulle en réalité.

En statistique, on peut tester cette hypothèse avec un test de régression linéaire … puisque la pente semble linéaire. La variable indépendante est le numéro de la boule et la variable dépendante est la fréquence d’occurrence parmi les 3317 tirages. Le test va nous livrer quatre paramètres : (1) la pente, (2) l’ordonnée à l’origine, (3) une valeur p et (4) un R carré. Si les résultats sont parfaitement aléatoires, la valeur p sera supérieure à ,05. Par contre, on rejettera l’hypothèse du hasard si la valeur p est égale ou inférieure à ,05.

Aussi, si le hasard est le seul déterminant des résultats des tirages, l’ordonnée à l’origine doit être égal à 3317 divisé par sept, donc 473,86. Voici ce que livre le test de régression linéaire.

Lotto649_nuage.png
Tout d’abord, la valeur p est égale à ,001. Cela signifie qu’on a seulement une chance sur 1000 de se tromper si on rejette l’hypothèse du hasard comme seul responsable du résultat des tirages. La pente est manifestement inclinée. Les joueurs qui cherchent un biais d’occurrence dans les numéros gagnants ont ici un résultat scientifiquement probant. La pente de ,6344 n’est pas nulle et l’ordonnée à l’origine égal à 458 est statistiquement différent du 473,86 attendu.

Avec des grands échantillons, il arrive parfois que la valeur p soit significative alors que le biais est négligeable. La valeur p est une mesure de certitude. Mais, la certitude d’avoir vu quelque chose ne dit pas si cette chose est grande ou petite. Pour cela, il faut examiner la taille d’effet, c’est-à-dire le R carré. Et ici, c’est sidérant. Le R carré est égal à ,2112 (ou 21,12% de la variance à expliquer). En tenant compte de la taille de l’échantillon, le R carré ajusté demeure élevé à 19,4%. Dit autrement, le numéro inscrit sur la boule explique jusqu’à 19,4% des différences d’occurrence entre les boules. Dans ce contexte, c’est énorme. Ne pas voir ça, c’est comme ne pas voir un éléphant rose qui flotte dans les airs dans son bureau.

En comparaison, voici les résultats pour 1129 tirages de la Française des jeux, l’équivalent de Loto-Québec en France. La valeur p est à ,523. On ne peut pas rejeter l’hypothèse que la pente soit nulle. Par surcroît, le R carré est aussi quasiment nul. L’ordonnée à l’origine est égale à 116,87 alors qu’on s’attendait à une valeur de 115,20. Il est vraisemblable que les 49 numéros de la Française de jeux soient équiprobales, c’est-à-dire identiques.

FdJ_Lotto.png
En Californie, il y a une loterie à 47 boules où on ne détecte pas davantage de pente inclinée (p=,598).

California_Lotto.png
Pour les loteries française et californienne, il est clair que les boules sont équiprobables et que le tirage correspond à ce qu’on attend traditionnellement d’une loterie honnête.

Svenska Spel, l’équivalent de Loto-Québec en Suède, a une loterie à 35 boules. En voici les résultats depuis le 11 juin 2011. À l’œil, il semble y avoir une pente descendante. Mais, le test statistique indique qu’il pourrait s’agir uniquement d’un hasard d’échantillonnage. La valeur p est de ,135. En contrepartie, il s’agit d’un échantillon très petit de 461 tirages. En augmentant le nombre de tirages, il n’est pas exclu que la valeur p diminuera en bas de ,05.

Svenska_Spel_Lotto.png
Dans le cas de la loterie nationale en Grande-Bretagne, la pente inclinée est probante (p=,031). La pente est moins prononcée que pour la loterie pancanadienne 6/49, mais elle n’est manifestement pas nulle.

UK_National_Lotto.png
Les données de ces dernières loteries proviennent du site multilotto. Sur ce site, on trouve aussi des résultats pour la loterie 6/49 canadienne couvrant uniquement la période du 19 juin 2011 à aujourd’hui. Cette fois, la valeur p est de ,720. Pour ce segment plus récent, la pente apparaît dorénavant clairement nulle! Ces données témoignent que les boules de la loterie pancanadienne 6/49 n’étaient pas équiprobables quelque part entre juin 1982 et juin 2011. Il y avait un biais favorisant les numéros les plus élevés.

Lotto649_court.png
Est-ce que cela pourrait être intentionnel? Deux chercheurs français ont déjà pu établir que les mises, à ce type de loterie, favorisent surtout le choix de petits nombres par les parieurs. Incidemment, on connaît bien la prédilection des parents à choisir l’âge de leurs enfants comme nombres chanceux. Dans ce contexte, en réduisant la probabilité des boules aux numéros les plus souvent choisis, on stimule artificiellement la création de lots progressifs plus grands.

À quel point le biais constaté dans les fréquences des boules de la Lotto pancanadienne 6/49 peut-il avoir eu un impact négatif sur l’espérance de gain des parieurs canadiens. Pour le déterminer, j’ai construit un simulateur de Lotto 6/49 avec lequel je peux varier la probabilité des boules. En simulant 10 milliards de tirages avec 49 boules équiprobables, j’ai gagné 723 le gros lot avec ma combinaison 1, 2, 3, 4, 5, 6. J’ai donc gagné une fois à toutes les 13 831 259 mises. C’est très près de la probabilité théorique de 13 983 816. Le simulateur fonctionne plutôt bien.

Par la suite, j’ai modifié la probabilité des boules pour créer un biais identique à celui calculé par l’équation de régression des 3317 tirages depuis le 12 juin 1982. Cette fois, les plus petits nombres sont défavorisés. Après 10 autres milliards de tirages simulés, je n’ai gagné que 627 fois avec ma combinaison 1, 2, 3, 4, 5, 6. J’ai gagné une fois à tous les 15 948 963 tirages. C’est loin du 13 983 816 qu’on me promet! Maintenant, avec la combinaison 44, 45, 46, 47, 48, 49, j’ai gagné le gros lot 821 fois, c’est-à-dire une fois à chaque 12 180 268 tirages.

Avant juin 2011, la probabilité de gagner était manifestement plus grande avec les numéros plus grands. Mais, ce biais n’existe plus … en tout cas pour la Lotto 6/49 car voyez ce que donne les données récentes pour le Lotto Max. Ce n’est pas encore statistiquement significatif (p=127). Mais, il n’y a que 320 tirages. Scientifiquement, ce serait intéressant de corréler la fréquence d’occurrence des boules avec leur préférence lors des choix des parieurs. Malheureusement, cette information n’est jamais publiée par les loteries. On se demande pourquoi!

LottoMax_resultats.png
Alors, comme le prétend Marisol Schnorr, est-ce qu’il y a vraiment quelqu’un de sérieux chez Loto-Québec qui vérifie les résultats des tirages? Et puis, les firmes de vérification, elles font quoi au juste? Sur le site de Loto-Québec, dans la section Intégrité et rigueur, on nous présente une image de balance de précision probablement sensible au millième de gramme. Cette photo est reproduite dans l'article de monsieur Marchal. Avec ce genre de photo sans contexte précis, on nous place dans un tunnel cognitif pour nous amener à croire que les boules doivent nécessairement être de même poids. Mais, en réalité, cela signifie seulement qu’une firme de vérificateur a pesé les boules. Le client de la firme n’est pas la population. C’est l’organisateur de la loterie. La firme n’a fait que vérifier que les boules pèsent le poids requis par l’organisateur. Et, la liste des poids requis pour chaque boule n’est publiée nulle part. Et puis, qui a déjà vu le rapport des firmes de vérification? Tous ces éléments ne sont qu’un tunnel cognitif pour vous amener à croire que les boules sont équiprobables. Alors, pourquoi n’est-il jamais affirmé explicitement que les boules sont équiprobables?

Dans le domaine du jeu, mentir avec des demi-vérités est le nerf du commerce. C’est un peu le piège dans lequel sont tombés les mathématiciens consultés par le journaliste. Ils ont plausiblement pris pour acquis que les joueurs font régulièrement des erreurs d’estimation statistique … et ils ont trop facilement rejeté l’hypothèse d’un déséquilibre entre les probabilités des boules peut-être plus en fonction d’un raisonnement théorique, ou d’un préjugé à l’égard des personnes moins instruites en mathématique, qu’en fonction d’une vérification empirique adéquatement approfondie. Avec le jeu, il faut prendre expressément garde aux tunnels cognitifs.

Jean Leblond

Author: Jean Leblond

Restez au courant de l'actualité et abonnez-vous au Flux RSS de cette catégorie

Commentaires (3)

Pokerman Pokerman ·  12 novembre 2015, 07:58

Votre excellent article nous permet très certainement, encore une fois, de sérieusement se questionner au sujet de l'intégrité de Loto-Québec. Que ce soit causé uniquement par le boulier et/ou par tout autres genres de magouilles, il est clair et net que les résultats des tirages ont bel et bien été biaisés jusqu'en 2011. Depuis cette année 2011, nous sommes toujours très certainement en droit de continuer à se questionner à savoir si vraiment les tirages sont réellement aléatoires ou s'ils ont tout simplement colmaté la faille statistique tout en continuant à "contrôler" les résultats. En ce qui me concerne, je penche définitivement vers la dernière possibilité.

Je ne suis pas un adepte des loteries quelles qu'elles soient, surtout après avoir opéré un dépanneur pendant quelques années où j'y vendait aux alentours de 5000.00$ par semaine de toutes les loteries confondues et où jamais le moindre lot significatif n'était gagné!

Quand je lis vos 2 derniers paragraphes, il est intéressant de réaliser que l'on pourrait appliquer vos commentaires et constatations au poker en ligne. Il ne suffit que de remplacer le mot "boules" par "cartes". Le doute concernant les firmes de vérifications est tout aussi justifié dans un cas comme dans l'autre. Qu'est-ce qui nous prouve que les boules utilisées lors des tirages sont celles vérifiées? Qu'en est-il du boulier lui-même? Au poker en ligne, qu'est-ce qui nous prouve que le générateur de nombres vérifié est celui utilisé en jeu? Et qu'en est-il des racines de programmation qui sont assurément implantées à ce générateur?

Définitivement, il faut être volontairement aveugle pour ne pas voir l'arnaque possible. Une chose est sûre: Le poker en ligne se meurt à grand pas et ce fait n'est pas indifférent à l'évidence que quelque chose ne va pas avec la distribution des cartes et c'est très bien ainsi.

Alexandre Alexandre ·  18 novembre 2015, 10:20

Oh wow, un article de Jean Leblond qui critique la job du monde en math. Tu as fais tes études en sciences molles, t'es le moins crédible de la gang pour discuter du sujet des stats, et à plusieurs reprises tu l'as démontré.

JackAceJack

Jean Leblond Jean Leblond ·  24 novembre 2015, 08:40

Bonjour Alexandre

Peux-tu me dire où j'aurais fait erreur?

Ajouter un commentaire Fil des commentaires de ce billet

Les commentaires peuvent être formatés en utilisant une syntaxe wiki simplifiée.

Aucune annexe



À voir également

You_got_my_number__5411729245_.jpg.jpg

Les 639 premiers jours de bingo en ligne sur EspaceJeux

Sur le site EspaceJeux de Loto-Québec, le bingo en ligne a été inauguré de 12 juin 2014 avec deux...

Lire la suite

LQ_2016-02-29_BalancePrecision.png

Les tirages du Lotto 6/49 pourraient ne pas être ce qu’on croit

Quand on regarde un tirage du Lotto 6/49, sauf la couleur et le numéro, on voit 49 boules...

Lire la suite