CONTATTI

GeoTrading non utilizza cookies di profilazione.

© 2019 GeoTrading

  • GeoTrading Linkedin
  • GeoTrading YouTube
  • GeoTrading Facebook
  • GeoTrading Twitter
  • GeoTrading Instagram

GeoTrading, Milano  |  ​info@geotrading.it

p.iva: 08548200966

norton_200x99.png
ssl-cert-wv.png

TRADING & FRODI

la legge di benford

Nel Giugno 2009 si tengono le elezioni presidenziali in Iran. La sfida è tra il fra il presidente uscente Ahmadinejad, e il leader dell’opposizione Mousavi. Ecco i risultati ufficiali:

  • Ahmadinejad – 62.63%

  • Mousavi – 33.75%

Ahmadinejad, contro ogni aspettativa, ottiene un ottimo risultato nelle aree urbane, inclusa Tehran, dove si pensava fosse molto impopolare, ma anche a Tabriz, la città del candidato Mousavi.

Mousavi, però, denuncia irregolarità nel voto e chiede nuove elezioni. Qualche giorno dopo i risultati in dettaglio delle elezioni vengono pubblicati su Internet dal ministro degli interni iraniano; è da qui che Boudewijn Roukema, astronomo polacco, li scarica, per cercare di scoprire se ci sono state irregolarità nel conteggio dei voti.

Città per città, Roukema analizza le frequenze della prima cifra significativa del numero di voti e confronta queste frequenze con quelle derivanti dalla Legge di Benford. Come risultato, egli nota che in 3 delle 6 aree più popolate dell’Iran il numero 3 e il numero 8 comparivano con una frequenza “anomala”. In queste zone il vincitore Ahmadinejad aveva ottenuto una percentuale di voti molto più elevata che nelle altre aree, avvalorando pertanto la tesi di Mousavi di brogli elettorali. 

Nel 1938, il fisico Frank Benford analizzò raccolte di numeri di molti ambiti di applicazione: la popolazione dei comuni di una regione, la quotazione delle azioni di una giornata, i numeri sulle porte di casa di una via, ecc.

E notò che è più frequente che un numero cominci con una cifra piccola piuttosto che con una grande; in altre parole, la probabilità che un numero della raccolta inizi con l’uno è circa del 30%, e la stessa diminuisce via via fino a diventare minore del 5% quando si tratta della probabilità che inizi con il nove.

Ecco le probabilità per le 9 cifre:

  •   P(1)=30,1%

  •   P(2)=17,6%

  •   P(3)=12,5%

  •   P(4)=9,7%

  •   P(5)=7,9%

  •   P(6)=6,7%

  •   P(7)=5,8%

  •   P(8)=5,1%

  •   P(9)=4,6%

 

E’ importante precisare che ciò avviene solo quando la raccolta di dati proviene da situazioni “naturali”.

Nel 1972, l’economista Hal Varian, personalità piuttosto importante negli Stati Uniti, suggerì di utilizzare la legge di Benford per verificare i dati presentati a sostegno di iniziative politiche: se infatti è piuttosto facile raccogliere dei dati reali, ed è anche molto facile taroccarli, è estremamente difficile taroccare dei dati reali in maniera che continuino ad obbedire alla legge di Benford.

Talmente difficile che nel 1992 il commercialista e matematico Mark Nigrini propose di utilizzare la legge di Benford per verificare le dichiarazioni dei redditi. E dimostrò, usando dati reali, che le dichiarazioni che non si conformano alla legge di Benford sono fraudolente.

 Milano.xls

Proviamo anche noi ad applicare la Legge di Benford ad un caso reale. Il file Excel da scaricare (milano.xls) contiene dati statistici di Milano e della Lombardia, comparati con gli stessi parametri del Nord-ovest e dell’Italia. Ho scaricato il file dal sito www.unioncamere.gov.it. La colonna da analizzare è la E (Lombardia). Per la post-elaborazione ho aggiunto le colonne evidenziate in giallo. Nella colonna H isolo la prima cifra dei numeri della colonna E, mentre nelle colonne I e J vado a contare la ricorrenza dei valori della prima cifra di tutta la colonna dei dati. Siamo quasi pronti a riportare questi valori su un grafico. Ma per poterli comparare con la curva di Benford è necessario costruire prima quest’ultima. Nelle colonne P e Q ho messo i valori di Benford, costruendo il grafico subito alla destra di questi dati: in blu la curva di Benford. Subito sotto proviamo ora a costruire un grafico simile, che includa anche la serie della Lombardia (O47:Q56). Nel nuovo grafico vedremo la curva della Lombardia, ma non quella di Benford che, a causa dei valori, risulterà schiacciata sull’asse orizzontale. Clicchiamo sulla linea blu, che rappresenta la serie di Benford, e con il tasto destro selezioniamo “formato serie di dati”, cliccando su “asse secondario”. A questo punto la curva di Benford risulterà visibile con i riferimenti sull’asse verticale destro. Aggiungiamo alla curva della Lombardia anche la linea di tendenza. A questo punto appare chiaro che la linea di tendenza è molto simile alla curva di Benford, pertanto possiamo essere ragionevolmente sicuri che i dati sono reali e non sono stati manipolati. Se proprio volessimo indagare sulla piccola discrepanza che si nota sulla cifra “4”, evidenziamo le righe in cui compare il 4 come prima cifra. Questa seconda parte di analisi viene svolta sul “Foglio 2” dello stesso file Excel. Applichiamo la formattazione condizionale (fondo rosso) alle celle della colonna E per evidenziare le celle che potrebbero essere state manipolate e controlliamo le voci (colonna A) alle quali corrispondono, ponendo attenzione se esistono sezioni in cui le celle rosse tendono a concentrarsi. In realtà le celle evidenziate risultano equamente distribuite. Quindi ne deduciamo che la tolleranza rientra nel trend della curva di Benford e che i dati presentati sono veritieri.

E’ ovviamente necessaria la prudenza prima di applicare la legge di Benford, in quanto solo un insieme di numeri scelti a caso da una data variabile casuale obbedisce a tale legge, mentre un insieme di dati “reali” può, ma non deve, seguire tale legge, se sono stati imposti anche inconsapevolmente dei limiti.

Gaetano Di Marco