Data Science, il futuro è nei dati
Era il 2006 e il matematico inglese Clive Humby scrisse una frase che diverrà lo slogan usato per definire la quarta rivoluzione industriale: «I dati sono il nuovo petrolio». I dati sono una ricchezza in grado di modificare il mercato e la società, creando nuove opportunità di business e nuove professioni, proprio alla stregua del petrolio tra il XIX e il XX secolo.
Lo sviluppo tecnologico ha contributo negli ultimi 15 anni alla crescita esponenziale e continua di dati, incrementando anche la tipologia di informazioni processabili. Siamo circondati da Big Data, Open Data, da cloud e database, la maggior parte dei quali prodotti da dispositivi e sensori IoT, come assistenti vocali, Gps, smartphone. È in questo contesto in continuo divenire, e praticamente inarrestabile, che nasce la Data Science o scienza dei dati, una disciplina complessa che abbraccia l’intera catena produttiva dell’informazione, dalla raccolta all’elaborazione e analisi critica dei risultati, e che è considerata strategica per il futuro. La sua capacità di creare connessioni tra la ricerca accademica e il mondo del business e di essere trasversale ad ogni settore produttivo – perché i dati, lo sappiamo, sono ovunque intorno a noi – ha reso la figura del data scientist tra le professioni più ambite, soprattutto dai laureati STEM.
Ma quanto sappiamo del nuovo oro nero e delle competenze necessarie per diventare uno scienziato del dato? PHYD lo ha chiesto a due esperti Microsoft nel corso del talk “Data Science, il futuro è nei dati” Luca Malinverno e Franco Pigoli, rispettivamente data scientist ed education manager per Porini, azienda specializzata in ERP e tra i principali partner internazionali di Microsoft.
Per capire di cosa parliamo è sempre bene partire da una definizione, come ci suggerisce Malinverno, per quanto generica possa essere: «Ogni scienza è intrinsecamente legata al dato, si serve di questo per osservare la realtà. Ma la Data Science, al contrario di altre discipline scientifiche, non usa i dati per studiare un fenomeno umano o naturale, il suo oggetto di studio è proprio il dato in sé». E studiarlo vuol dire conoscere e comprendere il mondo che ci circonda, capire i nessi causali tra gli accadimenti, prevedere i comportamenti, anticipare i bisogni, ridurre gli errori. Con i dati possiamo realmente conoscere i profili dei clienti di una piattaforma e-commerce, per esempio, o definire gli andamenti di mercato. Per questo, le aree di applicazione della Data Science sono molteplici e in costante sviluppo – c’è la IoT, il Machine Learning, l’AI, un domani forse anche il Quantum Computing- e, con esse, crescono e mutano anche le competenze richieste.
La Data Science, al contrario di altre discipline scientifiche, non usa i dati per studiare un fenomeno umano o naturale, il suo oggetto di studio è proprio il dato in sé.
Luca Malinverno, data scientist
Secondo Malinverno, per diventare un buon data scientist «devono piacerti gli enigmi o gli indovinelli, perché bisogna rispondere a domande, a volte, davvero complicate. Bisogna poi avere competenze analitico-matematiche importanti unite a una buona conoscenza del computer, inteso però come strumento di calcolo. La Data Science è ancora una disciplina di frontiera e la stiamo costruendo oggi.»
E in questo percorso tutto da tracciare giocano un ruolo fondamentale il mondo accademico e quello aziendale: solo una collaborazione e una prossimità tra queste due realtà può, infatti, favorire la formazione di una classe di scienziati preparata ed esperta. Perché, seppure le basi teoriche siano fondamentali, i percorsi dedicati alle materie STEM o all’econometria forniscono una solida base fenomenologica di partenza, da sole non bastano, la realtà è sempre più complessa e imprevedibile. Un ponte tra università e azienda possono essere le professional academy, le accademie di formazione professionale altamente specializzata le quali sono in grado di dotare i futuri data scientist del giusto mindset per entrare adeguatamente nel mondo del lavoro.
La Data Science è ancora una disciplina di frontiera e la stiamo costruendo oggi.
Luca Malinverno, data scientist
Che strada prenderà questa disciplina nel prossimo futuro, quali skill o attitudini richiederà non è possibile dirlo, ci troviamo senza dubbio nel bel mezzo del cambiamento e immersi in un oceano di informazioni e domande in attesa di essere elaborate e soddisfatte. Quel che è certo però, come chiosa Franco Pingoli, è che «chi gioca coi dati non si annoia mai.»
Per approfondire l’argomento e guardare il webinar, è sufficiente registrarsi al sito PHYD.