Lotto, 10elotto e SuperEnalotto: Sistemi, analisi statistiche, previsioni tutto gratis

Nessuno è perfetto: neanche Venus


Venus, o Venere,  la dea della bellezza, da sempre considerata simbolo di perfezione eppure  come si chiede Anna Utopia Giordano nella geniale serie “Venus” cosa sarebbe successo se ai tempi di Hayez, Velàzquez e Botticelli fosse esistito il fotoritocco? Anche questi grandi pittori avrebbero modificato i corpi delle loro modelle, aumentando il seno, eliminando le imperfezioni e assottigliando i fianchi? Probabilmente, visto che come dicevamo nel titolo nessuno è perfetto.

Come sapranno bene coloro che hanno seguito il nostro ultimo articolo (che vi invitiamo a leggere se non lo avete ancora fatto) la Venus a cui noi ci riferiamo non è Afrodite ma la macchina che permette le estrazioni del lotto italiano di cui abbiamo cominciato a studiare le caratteristiche dal punto di vista statistico nell’appena citato articolo.

Come ricorderete avevamo calcolato le frequenze dei gruppi 1-15, 16-30, 31-45, 46-60, 6175, 76-90 ottenendo rispettive frequenze: 12739, 12383, 12756, 12446, 12272 e 12534. La domanda come dicevamo ora è “come calcolare se gli scostamenti riscontrati sono quelli che ci si poteva attendere o se si può sospettare una non equiprobabilità dei numeri?” Insomma questi dati rientrano nella norma? Sono distribuiti come ci si attendeva, sono normali? oppure per citare Troisi sono normali ma ogni tanto ….

 

Come abbiamo visto nell’articolo precedente ci troviamo ad analizzare le frequenze di 6 gruppi a priori equiprobabili, siamo pertanto nella stessa situazione di un comune dado a 6 facce di cui vogliamo analizzare la statistica. La distribuzione di probabilità in questo caso è la binomiale. Non è certo questo il luogo per una lunga spiegazione, a coloro che vogliono approfondire un po’ consigliamo il post di Agnese Bissi che trovate qui. L’articolo, in due parti, è intitolato “Una definizione matematica di normalità: la distribuzione gaussiana” perché parte dalla binomiale come distribuzione tipica per il lancio del dado e poi dimostra come per numeri “grandi” si avvicina sempre più alla distribuzione gaussiana che per le sue caratteristiche (vedi seconda parte dell’articolo) è anche detta normale (ritorna non a caso questo parola). In particolare l’articolo recita:

Arriviamo ora alla parte più affascinante, e che ci fa capire anche perché questa distribuzione sia ”normale”. C’è un teorema, che si chiama teorema del limite centrale, che afferma che la media di un grande numero di variabili aleatorie, indipendenti e dotate della stessa distribuzione, è approssimata dalla distribuzione normale, indipendentemente dalla natura della distribuzione a cui realmente appartengono. Questo risultato mostra che nonostante sia molto difficile capire quale distribuzione di probabilità segua una determinata variabile, come ad esempio l’altezza degli individui che vedevamo prima, se abbiamo a disposizione molti ”eventi” allora siamo certi che la distribuzione che meglio approssima quella ”vera” è la distribuzione gaussiana. E questo ci spiega perché si chiama anche ”normale”, perché se abbiamo sufficienti eventi, normalmente sono descritti dalla distribuzione gaussiana.

Tecnicamente la gaussiana che meglio approssima la nostra distribuzione ha come parametri media μ= n*p=75130*1/6=12521,6 e varianza σ2 = n*p*(1-p)=10434,7. In figura mostriamo la tipica forma a campana della distribuzione con i parametri appena ricavati. Le barre nere corrispondono ai 6 valori ottenuti per i 6 gruppi di numeri. Per coloro che non hanno letto l’articolo della Bissi ricordiamo che l’ordinata (o altezza della curva) rappresenta la probabilità del verificarsi dell’evento e come è facile intuire è massima per il valore medio per poi diminuire avvicinandosi asintoticamente a zero allontanandosi da esso. La forma gaussiana è particolarmente utile per i calcoli in quanto ci sono delle tabelle che ci permettono di stabilire velocemente la probabilità di ottenere valori in base alla loro lontananza dal valore medio. In particolare è noto che ottenere valori distanti più di 2 σ (nel nostro caso σ = 102,2, per cui valori minori di 12321,7 o maggiori di 12726) dal valore medio ha una probabilità del solo 5% e noi ne abbiamo ottenuti 3 su 6 con i valori 12739, 12756 e 12272. E’ facile capire che le probabilità di ottenere simili risultati con gruppi di numeri equiprobabili è abbastanza bassa e che pertanto è forte il sospetto che i gruppi non siano equiprobabili e pertanto la Venus non è poi tanto perfetta come si poteva credere a prima vista.

Per calcolare meglio una stima della probabilità di quanto ottenuto in modo forse più intuitivo per il grande pubblico, abbiamo utilizzato anche il metodo Montecarlo, di cui spero ricorderete abbiamo già parlato nell’articolo Come cercare imperfezioni nella Venus. Per chi non ha studiato 🙂 ricordiamo che in pratica si simula la situazione nella quale si vuole calcolare la probabilità di un certo evento. La simulazione e le informazioni da essa ricavabili si sostituiscono al calcolo rigoroso della probabilità per via tradizionale che può risultare particolarmente complesso o lungo. Ad esempio, la frequenza osservata di un certo evento costituisce una valutazione della probabilità di quell’evento (a patto che il campionamento sia stato simulato per un consistente numero di volte).
Nel nostro caso abbiamo effettuato la seguente simulazione: grazie ad un software Java abbiamo chiesto al generatore di numeri casuali di fornirci 75130 volte un numero casuale fra 1 e 6 e abbiamo annotato il numero di 1, 2,3, 4, 5 e 6 totali. Simulando quindi il lancio di un comune dado. Quindi abbiamo ripetuto il procedimento per 100.000 volte. Abbiamo potuto constatare che in 80.310 casi non c’è stato nessun numero (1, 2,3, 4, 5 e 6) apparso più di 12700 volte o meno di 12300 volte. In 16.804 casi c’è stato un solo numero apparso più di 12700 volte o meno di 12300 volte, in 2662 casi ce ne sono stati 2, e pertanto solo in 224 casi su 100.000 si è verificato un caso come quello delle nostre Venus con 3 numeri con presenze fuori dell’intervallo 12300-12700. Pertanto possiamo stimare che la probabilità di avere i risultati ottenuti con le Venus se i numeri fossero equiprobabili, è di circa lo 0.2% vale a dire circa 1 su 500.

Chi ha letto i nostri articoli sul calcolo delle anomalie statistiche ricorderà che purtroppo non è possibile da questo dichiarare con assoluta certezza che i numeri estratti dalle Venus non sono equiprobabili ma certo l’esperimento effettuato pone ben più di un ragionevole dubbio a questo proposito visto che la confidenza dell’affermazione i numeri delle Venus non sono equiprobabili è di oltre il 99%.

 

Have any Question or Comment?

Lascia un commento