Lotto, 10elotto e SuperEnalotto: Sistemi, analisi statistiche, previsioni tutto gratis

Analisi statistica delle macchine Venus usate per le estrazioni del lotto


Finalmente ci siamo! Per tutti coloro che hanno “sopportato” la nostra lunga litania sul problema dell’equiprobabilità dei numeri estratti al lotto, anche solo per la serie “voglio proprio vedere dove vuole arrivare” (come diceva Totò nel divertente sketch Pasquale), cominciamo il nostro studio statistico delle estrazioni effettuate con le, non più tanto nuove, macchinette Venus.

Precisiamo subito che si tratta di uno studio “serio” intendendo con questa parola un’analisi statistica come quella che potrebbe fare un matematico incaricato di testare la casualità di un PRNG (vedi il nostro articolo precedente sull’argomento) per cui chi cerca una formuletta per il terno da estrarre domani resterà deluso. I calcoli matematici, seppur non eccessivamente complicati, potranno sembrare astrusi ad un lettore che ignori i rudimenti della statistica e seguire il tutto un po’ noioso ma alla fine, tutti, anche chi non è riuscito a seguire i calcoli, potranno avere un’idea chiara di come stanno le cose dal punto di vista matematico e saperne di più di tanti soloni e tuttologi.

Il nostro studio è effettuato su un campione di 1366 estrazioni effettuate dal 2 Gennaio 2010 fino al 25 Settembre 2018 incluso. Considerato che le ruote in totale sono 11 abbiamo un totale di 15026 estrazioni su singola ruota,

Come abbiamo cercato di sintetizzare nel nostro articolo precedente già sopra citato i metodi per accertare la completa casualità di una sequenza numerica sono numerosi, anche perché, ovviamente, diverse sono le caratteristiche che vanno controllate per garantire un’accettabile casualità, dove la soglia di accettabilità dipende ovviamente dall’applicazione a cui è destinato il macchinario o l’algoritmo che “sceglie” i numeri.  Certamente una delle prime cose da controllare è l’equiprobabilità dei singoli estratti, in pratica, nel nostro caso, se i 90 numeri hanno tutti la stessa probabilità di sortire. Cominciamo quindi la nostra analisi proprio da questo.

Analisi per singolo estratto

Su un totale di 15026 estrazioni su singola ruota il valore atteso delle presenze dei singoli estratti è semplice da calcolare, considerato che la sortita di ogni estratto è equiprobabile e che ci sono 5 estratti per ruota il valore cercato è 15026*5/90=834,78. Ovviamente intorno a questo valore medio il numero di presenze può oscillare in base alle leggi statistiche e pertanto non è facile a primo sguardo rendersi conto se la distribuzione dei valori delle frequenze corrisponde a quanto atteso nel caso di equiprobabilità.

Istogramma delle frequenze dei 90 numeri, la linea corrisponde al valore medio atteso

Per soddisfare la vostra curiosità abbiamo inserito l’istogramma delle frequenze con il relativo valore medio atteso indicato con una retta. Come era da aspettarsi alcune frequenze sono sopra il valore atteso altre sono inferiori con un’alternanza può sembrare o meno casuale ad un primo sguardo soggettivo. In effetti dedurre semplicemente “ad occhio” se qualcosa è casualmente distribuito non è affatto semplice anzi. Per farvi un esempio cito ancora un post di Maurizio Codogno (come nell’articolo precedente) che vi invito a leggere per intero qui

 qui vedete due successioni di venti lanci di una moneta: una di esse è effettivamente stata il risultato di un lancio, l’altra è stata scritta a mano e quindi è finta. Riuscite a riconoscerla?

TCCTT CTCTT CTCCT CTTCT
CCTTT CCCCT CTTTC CCCCC

Se non conoscete il trucco, è probabile che abbiate dato la risposta sbagliata, anche se confesso che sono rimasto stupido dal risultato “casuale” che ho ottenuto. Quando noi cerchiamo di simulare una successione casuale, generalmente facciamo in modo da avere più o meno lo stesso numero di teste e croci, e allo stesso tempo ci sia più o meno un’alternanza. Le cose non funzionano così! Se vi mettete a fare i conti, vi accorgete che c’è una probabilità su 16 di avere quattro teste in fila (o quattro croci, del resto) e abbiamo 17 gruppi di quattro lanci consecutivi. Ora, è vero che questi quartetti di lanci non sono tutti scorrelati tra di loro (ne avevo parlato trattando del paradosso di Penney) ma facendo conti più complicati si vede che la probabilità di averne uno è molto alta. Quindi una successione di lanci senza questa caratteristica è sospetta.

Inoltre come abbiamo già spiegato in un nostro articolo precedenti il nostro cervello tende a trovare delle correlazioni ovunque anche dove non ci sono per cui è bene non fidarsi solo del proprio istinto in questi casi a causa proprio di un biasing cognitivo dovuto all’evoluzione che non colpisce solo gli uomini ma anche altri animali, per chi è curioso riportiamo da un post del sito del CICAP lo strano caso della superstizione dei piccioni.

Piccioni superstiziosi

Ritornando al nostro problema delle macchine Venus come possiamo stimare che la distribuzione delle frequenze sia sufficientemente casuale o che ci sia il ragionevole dubbio di una possibile deviazione dalla perfetta casualità? Ovviamente come dicevamo possiamo approcciare il problema in diversi modi ma la cosa più conveniente è cercare di ipotizzare in base alla nostra conoscenza del meccanismo estrazionale perché alcuni numeri potrebbero avere un vantaggio o svantaggio rispetto ad altri e poi andare  a verificare se i dati sperimentali confermano la nostra ipotesi o meno.

Leggendo come funziona la Venus o anche semplicemente dai video pubblicati da Lottomatica delle estrazioni ci rendiamo conto che prima di essere mescolati i 90 numeri sono divisi in gruppi di 15 numeri secondo l’ordine naturale (1-15, 16-30 …) come potete vedere anche in figura. Viene naturale quindi chiedersi se i numeri appartenenti ai 6 gruppi abbiano esattamente la stessa probabilità di sortita, o, questa piccola differenza nella posizione iniziale, possa indurre qualche piccola, magari impercettibile ad occhio, ma probabilisticamente significativa, imperfezione rispetto alla totale casualità.

Abbiamo quindi calcolato come è facile immaginare la frequenza totale di ciascuno dei 6 gruppi. Considerando che con numeri equiprobabili la probabilità di un numero estratto di appartenere ad un qualsiasi gruppo è pari a 1/6 il valore atteso per la frequenza è 75130/6=12521,6. In pratica è come se tirassimo un dado 75130 volte per contare quante volte esce 1, quante 2 via di seguito fino a 6.


Il risultato ottenuto è mostrato con l’istogramma in figura con i numeri delle rispettive frequenze: 12739, 12383, 12756, 12446, 12272 e 12534. 

Ovviamente una certa variazione rispetto al valore medio era da attendersi, le leggi delle probabilità ci dicono che la variazione percentuale rispetto al valore atteso tende a diminuire con l’aumentare delle prove. La domanda è come calcolare se gli scostamenti riscontrati sono quelli che ci si poteva attendere o se si può sospettare una non equiprobabilità dei numeri?

Per la risposta vi rimandiamo al prossimo post ma vi anticipiamo che gli sviluppi sono molto interessanti almeno dal nostro punto di vista.

Have any Question or Comment?

Lascia un commento