GLI OPEN DATA NEI PAESI DESI

L’utilizzo degli open data è cresciuto tra il 2016 ed il 2021 di un ammontare pari a 7,64 unità, equivalente al 218,79%

1663455754OPEN_DATA.jpg

Quello relativo all’utilizzo degli open data è un indicatore che considera due elementi: in che misura un paese ha delle politiche sugli open data e quali sono gli impatti politici, sociali ed economici degli stessi. La variabile prende in considerazione le funzionalità, la reperibilità dei dati e l’utilizzo dei portali di open data nazionali. La serie storica analizzata è compresa tra il 2016 ed il 2021. Il Regno Unito è escluso dal calcolo delle variabili costitutive del DESI Index.

Ranking dei paesi europei per valore degli open data. La Danimarca è al primo posto con un valore degli open data pari ad un ammontare di 13,67, seguita dalla Spagna con un valore pari a 13,49 unità, e dalla Francia con un ammontare pari a 13,47. A metà classifica vi sono la Grecia con un valore pari a 12,18 unità, la Finlandia con un valore di 12,15 unità e la Slovenia con un valore pari a 12,01 unità. Chiudono la classifica il Portogallo con un ammontare pari a 6,8 unità, Malta con un valore di 6,71 unità e l’Ungheria con un valore pari a 4,82 unità.

Ranking dei paesi per valore della variazione assoluta del valore degli open data tra il 2016 ed il 2021. La Danimarca è al primo posto per valore della variazione assoluta degli open data tra il 2016 ed il 2021 con un valore pari a 9,56, seguita dalla Spagna con un valore pari a 9,44 unità, e dalla Francia con un valore pari a 9,42 unità. A metà classifica vi è la Grecia con un valore pari a 8,52 unità, seguita dalla Finlandia pari ad un ammontare di 8,50 unità, e dalla Slovenia pari ad un valore di 8,40 unità. Chiudono la classifica la Slovacchia con un valore pari a 3,71 unità, l’Ungheria con un valore di 3,38 unità e il Portogallo con un valore di 2,99 unità.

Clusterizzazione con algoritmo k-Means. Di seguito viene presentata una clusterizzazione attraverso l’utilizzo dell’algoritmo k-Means ottimizzato per il tramite del coefficiente di Silhouette. L’analisi mostra la presenza di due diversi clusters:

  • Cluster 1: Malta, Portogallo, Slovacchia, Ungheria, Belgio, Lussemburgo;
  • Cluster 2: Romania, Repubblica Ceca, Bulgaria, Lettonia, Danimarca, Spagna, Francia, Croazia, Irlanda, Svezia, Slovenia, Estonia, Polonia, Austria, Finlandia, Grecia, Paesi Bassi, Lituania, Germania, Italia, Cipro.

Dal punto di vista metrico risulta che il valore della mediana del cluster 2 è pari ad un ammontare di 12,21 mentre il valore della mediana del cluster 1 è pari ad un ammontare di 7,22 unità. Ne deriva pertanto che C2=12,21>C1=7,22.

Machine Learning and predictions. Di seguito viene realizzata una analisi attraverso l’utilizzo di un confronto tra dieci diversi algoritmi di machine learning per la predizione del valore futuro del valore della variabile open data. Gli algoritmi sono addestrati con l’80 % dei dati disponili. Viene realizzata una classifica in base alla capacità degli algoritmi di massimizzare l’R-squared e di minimizzare gli errori statistici MAE, MSE, RMSE. Di seguito viene indicato l’ordinamento degli algoritmi in base alla performance:

  • Linear Regression con un valore del payoff pari a 4;
  • SGD con un valore del payoff pari a 8;
  • AdaBoost con un valore del payoff pari a 12;
  • Gradient Boosting con un valore del payoff pari a 16;
  • Random Forest con un valore del payoff pari a 20;
  • kNN con un valore del payoff pari a 24;
  • Tree con un valore del payoff pari a 24;
  • SVM con un valore del payoff pari a 31.
  • Costant con un valore del payoff pari a 36;
  • Neural Network con un valore del payoff pari a 40.

Pertanto, l’algoritmo Linear Regression è il best predictor per la serie storica della variabile Open Data nell’ambito dell’analisi del dataset del DESI Index.

Network Analysis con la Distanza di Manhattan. Di seguito viene realizzata una analisi con lo strumento della network analysis ottimizzato con la distanza di Manhattan. Nello specifico vengono individuati delle strutture a network complesse, ovvero delle strutture aventi più di tre nodi e delle strutture a network semplificate ovvero delle strutture aventi soltanto due nodi.

Esiste una struttura a network complessa tra Grecia, Paesi Bassi, Lituania, Finlandia:

  • La Grecia ha una connessione con i Paesi Bassi per un valore pari a 0,0078, con la Finlandia per un valore pari a 0,015 unità, con la Lituania per un valore pari a 0,023 unità;
  • I Paesi Bassi hanno una connessione con la Grecia per un valore pari a 0,0078 unità, con la Finlandia per un valore pari a 0,023 unità e con la Lituania per un valore pari a 0,015 unità;
  • La Lituania ha una connessione con i Paesi Bassi per un valore pari a 0,015 unità, con la Grecia per un valore pari a 0,023 unità, con la Finlandia per un valore pari a 0,039;
  • La Finlandia ha una connessione con i Paesi Bassi per un valore pari a 0,023, con la Lituania per un valore pari a 0,039, con la Grecia per un valore pari a 0,015 unità.

Esiste una connessione tra Austria, Polonia ed Estonia. In modo particolare:

  • L’Austria ha una connessione con la Polonia per un valore pari a 0,031 unità;
  • La Polonia ha una connessione con l’Austria per un valore pari a 0,031 unità e con l’Estonia per un ammontare di 0,074 unità;

Esiste una connessione tra Cipro, Italia e Germania ovvero:

  • Cipro ha una connessione con l’Italia per un valore pari a 0,027;
  • L’Italia ha una connessione con Cipro per un valore pari a 0,027 e con la Germania per un valore pari a 0,085 unità;
  • La Germania ha una connessione con l’Italia per un valore pari a 0,085.

Esiste una relazione biunivoca tra i seguenti paesi ovvero:

  • La Svezia e la Slovenia hanno una connessione per un valore pari a 0,039;
  • La Francia e la Spagna hanno una connessione per un valore pari a 0,012 unità.

Conclusioni. L’utilizzo degli open data è ancora molto scarso nei paesi DESI. Nel paese più avanzato in termini di Open Data, ovvero la Danimarca, la variabile ha raggiunto il valore di 13,67 unità. In molti paesi la variabile è stabile al di sotto del valore di 10, compresa la Germania dove il valore è 8,76 e l’Italia con 8,68 unità. Se la possibilità di utilizzare degli open data è scarsa, ancora più rara è ovviamente la capacità di fare business con gli open data. Sono ancora troppo poche le aziende in grado di fare business con gli open data attraverso l’utilizzo del machine learning, dell’intelligenza artificiale e dei big data. Vi sono certamente delle opportunità anche di miglioramento della pubblica amministrazione, che tuttavia non vengono adeguatamente colte dagli enti pubblici. Ne deriva che sia il settore privato sia il settore pubblico sono ampiamente indietro nell’utilizzo degli open data e così facendo aumentano la distanza tra economia potenziale ed economia reale.

cms_27554/Foto_1.jpg

cms_27554/Foto_2.jpg

cms_27554/Foto_3.jpg

Angelo Leogrande

Tags:

Lascia un commento



Autorizzo il trattamento dei miei dati come indicato nell'informativa privacy.
NB: I commenti vengono approvati dalla redazione e in seguito pubblicati sul giornale, la tua email non verrà pubblicata.

International Web Post

Direttore responsabile: Attilio miani
Condirettore: Federica Marocchino
Condirettore: Antonina Giordano
Editore: Azzurro Image & Communication Srls - P.iva: 07470520722

Testata registrata presso il Tribunale di Bari al Nrº 17 del Registro della Stampa in data 30 Settembre 2013

info@internationalwebpost.org
Privacy Policy

Collabora con noi

Scrivi alla redazione per unirti ad un team internazionale di persone dinamiche ed appassionate!

Le collaborazioni con l’International Web Post sono a titolo gratuito, salvo articoli, contributi e studi commissionati dal Direttore responsabile sulla base di apposito incarico scritto secondo modalità e termini stabiliti dallo stesso.


Seguici sui social

Newsletter

Lascia la tua email per essere sempre aggiornato sui nostri contenuti!

Iscriviti al canale Telegram