3.2 Definizione dei Big Data

I dati possono essere analogici e digitali; in entrambi i casi, essi vengono raccolti ed aggregati per poi essere analizzati e categorizzati a seconda dell’utilizzo che se ne vuole fare. Le nuove tecnologie, Internet, i social media e social network hanno aumentato esponenzialmente la disponibilità degli stessi, creandone una nuova tipologia: i big data, ovvero dati caratterizzati da (figura 3):

Figura 3. Le 5V dei Big Data, Osservatori Digital Innovation (2021)
  • VelocitĂ , i dati vengono prodotti, raccolti e processati in maniera sempre piĂą rapida e tempestiva;

  • Volume. Si tratta dell’elemento piĂą caratteristico dei big data, che risultano non essere gestibili da software e tecnologie tradizionali. Questi dati vengono misurati in zettabyte (ZB), un’unitĂ  di misura che equivale a 1 x 10^12 Gigabyte (GB).

  • VarietĂ , in quanto ci si può interfacciare con diverse tipologie di dati. Conseguentemente potranno essere aggregati in maniera strutturata, semi strutturata o non strutturata;

Queste prime tre caratteristiche dei dati sono state definite nel 2001 da Duog Laney (Osservatori Digital Innovation, 2021), che descrisse in un report il modello delle 3V relative ai Big Data, per rappresentare in modo semplice e sintetico la grande innovazione di queste nuove tipologie di dati. Oggi, tale modello è stato arricchito di altre due variabili, due nuove dimensioni di cui tener conto:

  • VeridicitĂ . I dati devono essere affidabili e devono rappresentare il vero. Si tratta di una caratteristica da non dare per scontato in tema di big data;

  • Valore. I dati se sottoposti ad un’adeguata analisi, possono produrre informazione e valore economico. Quando si lavora con grandi quantitĂ  di dati, essi saranno piĂą significativi e dunque anche l’informazione da essi prodotta risulta avere piĂą valore.

Si è in breve tempo colta l’importanza di sfruttare la capacità informativa e conoscitiva dei dati: è così che ha avuto origine la data economy, un mercato che verte sul valore economico creato dall’elaborazione dei dati in informazione ed infine conoscenza. Ciò ha permesso a piattaforme digitali, aziende, amministrazioni pubbliche e private e molti altri soggetti di prendere decisioni profittevoli grazie alle loro fondamenta empiriche, radicate nei dati prodotti e raccolti a monte.

Lavorare con i dati porta a doversi interfacciare con alcune sfide:

  • Prima di tutto, la disponibilitĂ  degli stessi. Per lavorare con i dati e ottenere dei risultati significativi, è necessario poter accedere ai dataset e poterli modellare a seconda delle esigenze d’utilizzo e di impiego;

  • Segue la necessitĂ  di avere dati di qualitĂ , poter decretare quanto siano rilevanti e consistenti, oltre che aggiornati, e la loro capacitĂ  di soddisfare necessitĂ  fattuali e implicite quando utilizzati;

  • Bisogna essere in grado di trovare i dati tramite le tecniche di data discovery, in particolar modo quando ci si interfaccia con Internet: qui, le quantitĂ  e tipologie di dati disponibili potrebbero essere fuorvianti in merito agli scopi prefissati;

  • La necessitĂ  di avere conoscenze informatiche tali da poter combinare data set diversi tra loro;

  • I dati devono essere completi e in grado di coprire il range di utilizzo;

  • Problemi di privacy. Lavorare con i dati può scaturire problematiche non irrilevanti per quanto riguarda la dimensione del diritto alla privacy.

Il primo problema elencato, quello della disponibilità dei dati, è proprio l’elemento alla base del concetto di Open Data. Con l’avvento della data economy certe tipologie di dati sono divenute accessibili solamente a pagamento (basti pensare alle numerose aziende la cui attività principale si concentra sull’elaborazione di database che aggregano dati, il cui accesso è riservato su pagamento); questa nuova consapevolezza in merito al valore dei dati ha fatto emergere l’urgenza di rendere liberamente accessibili i dati provenienti dalle Pubbliche Amministrazioni, fondamentali nella definizione della vita pubblica e civica. In questo modo, gli Open Data garantirebbero la trasparenza delle amministrazioni pubbliche e aumenterebbero la fiducia nelle stesse, grazie all’accessibilità e l’utilizzo pratico che se ne possa fare.

Last updated