Data Science Machine, per prevedere il comportamento delle persone - KOIMANO
VUOI PUBBLICARE UN ARTICOLO SU KOIMANO?Contattaci

Data Science Machine, per prevedere il comportamento delle persone


Prevedere il comportamento. Scrivono, sognano, fanno calcoli e giocano a scacchi meglio di noi, ma quando si tratta di creatività e di intuizione dovremmo continuare a superare i computer ancora per un bel po’. O almeno, è quel che ci piace pensare. L’ultima invenzione dei ricercatori del Computer Science and Artificial Intelligence Laboratory dell’Mit, invece, potrebbe farci ricredere: si tratta di un programma in grado di prevedere il comportamento di una persona, con risultati paragonabili (se non migliori) a quelli di una persona in carne e ossa.

Il dispositivo, presentato durante la recente IEEE Data Science and Advanced Analytics Conference di Parigi, è una Data Science Machine: un sistema automatico in grado di sviluppare modelli predittivi partendo da grandi database di dati grezzi, come possono essere ad esempio le informazioni raccolte nei server di Google o di Facebook.

Come tutti i meccanismi di data science (cioè di analisi scientifica di grandi set di dati), il dispositivo è pensato per estrarre informazioni, individuare pattern e relazioni, ed estrapolare previsioni in grado di prevedere il comportamento. Normalmente ad affiancare una macchina in questa attività c’è un operatore umano, che deve scegliere gli elementi rilevanti, chiamati variabili, tra quelli immagazzinati nel database (come ad esempio età, sesso, o formazione scolastica degli utenti di un sito internet), intuire quali correlazioni potrebbero nascondervisi (abitudini, tipo di acquisti, preferenze politiche o culturali) e chiedere poi al computer di effettuare i calcoli.

I ricercatori dell’Mit hanno però sviluppato una tecnica, definita Deep Feature Synthesis, che permette alla macchina di individuare da sola le variabili rilevanti all’interno di un database, e di intuire come utilizzarle. Per verificare l’efficacia del loro dispositivo, i ricercatori dell’Mit hanno iscritto la loro macchina a tre competizioni di data science, in cui il computer ha gareggiato contro 906 team di ricercatori in carne e ossa.

Prevedere il comportamento, test pratico

Per farsi un’idea, in una delle gare si chiedeva ad esempio ai partecipanti di predire quali tra gli studenti di un programma di apprendimento online avrebbe abbandonato il corso entro 10 giorni dall’inizio, utilizzando le informazioni registrate nei server del sito riguardo interazioni degli utenti con i contenuti disponibili. Il dispositivo dell’Mit ha risolto il problema, intuendo che, per scoprire chi si sarebbe ritirato dal corso, bastava guardare due variabili: con quanto anticipo gli studenti iniziassero a lavorare agli esercizi assegnati dai docenti, e il tempo medio che trascorrevano sul sito del corso. Grazie a questa “intuizione”, la macchina è riuscita a superare l’86% dei partecipanti (umani) alla competizione. E ancora: l’algoritmo è riuscito a prevedere se un progetto di crowdfounding sarebbe stato considerato o meno “eccitante” dal pubblico; e riconoscere quali compratori di un sito di shopping online sarebbero diventati clienti abituali. Non male, in effetti, per essere i primi tentativi.

In totale il dispositivo ha sconfitto 615 dei team iscritti alle competizioni. Non è ancora in grado di vincere sempre contro gli esseri umani, ma, spiegano i suoi inventori, offre risultati simili e in molto meno tempo: un esperto di data science lavora per mesi ai propri algoritmi, mentre la macchina dell’Mit ha impiegato solo 12 ore per elaborare quelli utilizzati nelle gare.

Per questo, i ricercatori immaginano che potrebbe trovare presto utilizzo in questo campo di studi.

“Pensiamo alla nostra Data Science Machine come un complemento naturale dell’intelligenza umana”, spiega Max Kanter, uno degli autori del dispositivo. “Ci sono tantissimi dati là fuori che potrebbero essere analizzati, e non vengono utilizzati solo per mancanza di tempo. Ora invece potremmo avere una soluzione che ci dia almeno un indizio, qualcosa da cui da cui partire”.

BIG DATA per Prevedere il comportamento

  • Di Data Science si parla più o meno da 50 anni. È solo con l’avvento dei computer più moderni, e la loro incredibile capacità di calcolo, che si è trasformata però in una disciplina scientifica a tutti gli effetti: l’utilizzo di specifici metodi statistici e algoritmi di calcolo per estrarre informazioni da grandi set di dati, o big data. Oggi se ne sente parlare molto spesso in relazione all’analisi dei database generati dal web, in particolare social media e applicazioni per smartphone, ma le sue applicazioni più importanti sono probabilmente nel campo della scienza. Telescopi come il Kepler della Nasa ad esempio setacciano costantemente lo spazio registrando dati di ogni tipo, generando database enormi di informazioni, che gli astronomi utilizzano, grazie a tecniche di data science, per andare a caccia di esopianeti, buchi neri, e lontane galassie
  • Il Large Hadron Collider del Cern è il più grande acceleratore di particelle del mondo. Ogni anno, i suoi sensori registrano oltre 30 petabyte di dati sulle collisioni che avvengono al suo interno. Il più grande set di dati al mondo, da cui ci aspettiamo grandi rivelazioni sulla stessa natura dell’Universo. Per analizzarlo, il Cern si affida a tecniche di data science, e a decine di migliaia di computer, sparsi in più di 150 centri di calcolo internazionali.
  • Un altro campo in cui trova applicazione la data science è quello della genetica. Oggi è possibile sequenziare rapidamente il Dna di virus, batteri e anche l’intero genoma di una persona. I dati raccolti costituiscono enormi database che, una volta analizzati, possono dirci molto sulle funzioni dei geni, e il loro effetto sulla nostra vita e la nostra salute.
  • Anche il campo della medicina oggi non può fare a meno dei big data. Nei trial clinici, che studiano sicurezza ed efficacia di nuove terapie, vengono raccolti ampi database di dati provenienti da migliaia di pazienti, che devono essere decifrati dai medici con l’aiuto di un esperto di data science.
  • Lo sviluppo di nuovi farmaci oggi si affida alla data science. Grazie all’analisi di grandi set di dati sulle molecole in fase di sviluppo, gli scienziati sono in grado di scegliere le più promettenti, prevedere le categorie di pazienti su cui si dimostreranno effecaci e i possibili effetti collaterali, prima ancora di arrivare a sperimentare i farmaci su animali o esseri umani.
  • Oggi gps, foto satellitari e sensori sono divenuti parte integrante degli strumenti dell’agricoltura. I dati raccolti, analizzati da esperti di data science, forniscono informazioni sull’impatto che hanno il tempo, le caratteristiche del suolo e altri fattori rilevanti sul raccolto, e aiutano a sviluppare modelli con cui ottimizzare il lavoro degli agricoltori.
  • Nella sicurezza informatica, la data science è parte integrante del lavoro. Analizzando le informazioni raccolte dagli utenti, le compagnie che producono antivirus e programmi di sicurezza sono in grado di scovare nuove minacce informatiche, e ridurre i rischi di attacchi ai nostri danni.

di Simone Valesini

Articoli correlati

LASCIA UN COMMENTO A QUESTO ARTICOLO

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Scroll Up