Written by Approfondimenti

MACHINE LEARNING ED EDUCAZIONE

Machine Learning

Nel corso degli ultimi due decenni, l’Apprendimento Automatico (AA) o Machine Learning è diventato uno dei pilastri della tecnologia dell’informazione e ha acquisito un ruolo centrale, anche se di solito nascosto, nella nostra vita. La sempre crescente quantità di informazioni disponibili rende indispensabile l’analisi intelligente dei dati. Lo scopo di questo articolo è quello di riflettere sulle applicazioni nel campo della formazione e dell’educazione in generale che sfruttano i principi dell’apprendimento automatico.

 

Definizione di Machine Learning
L’apprendimento automatico rappresenta una delle aree fondamentali dell’intelligenza artificiale e si occupa della realizzazione di sistemi e algoritmi che analizzano una grande quantità di dati per la sintesi di nuova conoscenza. Secondo l’opinione corrente, i sistemi di Machine Learning sono in grado di apprendere dall’esperienza, dove per esperienza si intende la capacità di un sistema di catturare ca-ratteristiche di interesse provenienti da esempi, strutture dati e sensori, con lo scopo di analizzarle e valutarne le relazioni tra le variabili osservate.
Una prima distinzione. Estrarre informazioni “nascoste” da strutture dati esistenti rientra negli scopi del data mining, che da tempo fornisce tecniche e metodologie per estrarre informazioni utili da un insieme di dati. L’Apprendimento Automatico differisce dal data mining, in quanto lo scopo in questo caso è quello di creare sistemi in grado di imparare dai dati, basandosi sul principio della generalizzazione degli algoritmi, la capacità cioè di lavorare in situazioni nuove, dopo un “addestramento” su un primo insieme di dati.

La prima definizione di Machine Learning risale al 1959: “Field of study that gives computers the ability to learn without being explicit programmed” (Arthur Samuel).
La definizione che però sta alla base della moderna ricerca sull’Apprendimento Automatico, risale al 1998 ed è stata formulata da Tom Mitchell: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.

Esempio: supponiamo che il nostro client di posta elettronica “osservi” quali email noi etichettiamo come spam e quali no e, basandosi su questa osservazione, impari a filtrare meglio le email in arrivo. In questo esempio, per esperienza E si intende l’attività di “osservazione” del nostro comportamento, per task T si intende la classificazione delle email come spam o meno, e come indicatore di perfor-mance P si può utilizzare il numero di email correttamente classificate sul totale delle email in arrivo. Quello appena descritto è uno scenario già sufficiente a definire l’approccio dell’Apprendimento Au-tomatico. Se l’indicatore di performance aumenta risulta chiaro che gli algoritmi di apprendimento au-tomatico adottati stanno funzionando. Questa è la dimostrazione che il Machine Learning ha come scopo quello di migliorare la performance, aumentando la capacità di prendere decisioni intelligenti in automatico.

Si distinguono diverse tipologie di algoritmi di Apprendimento Automatico:

  • Apprendimento supervisionato, dove i sistemi di addestramento sono più rigidi e, in sintesi, si tratta di insegnare all’algoritmo come apprendere in base a input definiti. Esistono cioè degli esempi noti.
  • Apprendimento non supervisionato, sono quelli in cui non è possibile valutare una soluzio-ne perché non esistono esempi noti e dove i dati in ingresso non sono classificati. In sostanza l’algoritmo è libero di imparare da solo.
  • Apprendimento per rinforzo, che si verifica quando il sistema è in grado di valutare la scelta effettuata e rinforzarla con un “premio” se è efficace.
  • Sistemi di raccomandazioni, cioè quei sistemi che si occupano di fornire agli utenti consigli personalizzati e di loro probabile interesse riguardo un dominio di oggetti (musica, libri, cine-ma ecc.)

 

Campi di applicazione
Le applicazioni del Machine Learning sono tantissime e molto presenti nella nostra vita di tutti i giorni.
Prendiamo un caso orami esemplare. Ognuno di noi può vantare una certa familiarità con il concetto di ranking di una pagina web. Con ciò si intende il processo attraverso cui un motore di ricerca risponde ad una query per trovare pagine web pertinenti e li restituisce in ordine di rilevanza. Per raggiungere questo obiettivo, un motore di ricerca ha bisogno di “sapere” quali pagine sono rilevanti e quali pagine soddisfano la query. Tale conoscenza può essere acquisita tramite tecniche di Machine learning applicate ai dati provenienti da diverse fonti: la struttura dei link delle pagine stesse, il loro contenuto, la frequenza con cui gli utenti seguiranno i link suggeriti.

Un altro campo di applicazione, correlato al precedente, è il filtraggio collaborativo. Siti come Amazon e molti altri, per invogliare gli utenti a fare altri acquisti suggeriscono prodotti simili a quello ricercato, ritrovandoli tra quelli scelti da utenti simili a noi. Il problema è molto simile a quello del ranking. Anche qui si vuole ottenere un elenco ordinato. L’unica differenza è che nell’ultimo esempio manca la query esplicita. L’algoritmo prende in esame le scelte simili di tutti gli utenti e così facendo impara a prevederne il comportamento ed è quindi in grado di suggerire opzioni con alta probabilità di interessare. Questo è l’approccio tipico del Machine learning.
I principali campi di applicazione del Machine Learning sono:

  • Campagne pubblicitarie mirate. Consiste nell’individuazione, tra i prospect (clienti promettenti), quelli con maggiore probabilità di acquistare prodotti dell’azienda, così da creare campagne mirate.
  • Market basket analysis. Consiste nel suggerire ad un cliente altri prodotti, che potrebbero interessargli, in base al suo comportamento di acquisto.
  • Adaptive website. Consiste nell’adattare la struttura e la rappresentazione delle informazioni, in un sito web, in base all’interazione dell’utente col sito, in modo da migliorarne l’interazione futura.
  • Game playing. Consiste nell’apprendere le regole e le tecniche di un gioco strategico, giocando attraverso altri avversari. Questo permette di migliorare l’esperienza finale per l’utente.

 

L’apprendimento automatico nel campo educativo
Negli ultimi anni, la grande popolarità dei MOOC ha obbligato i ricercatori in campo educativo ad affrontare problemi che fino qualche anno prima non era possibile immaginare.
Data la mole dei set di dati prodotti dai MOOC, si sono dovute adottare tecniche e metodologie sviluppate nel campo dell’Apprendimento Automatico per riuscire a fornire una più accurata previsione dei comportamenti e dei risultati degli studenti. Anche se rimangono ancora valide le tecniche statistiche classiche, il grande set di dati permette di scoprire i modelli più profondi per produrre inferenze e, prevedendo i comportamenti degli studenti, consente di fornire risposte più personalizzate nel loro percorso di apprendimento.

Le applicazioni del Machine Learning in campo educativo comprendono i seguenti gruppi applicativi:

  • Analisi dei contenuti. Le tecniche di analisi dei contenuti sono state sviluppate per le aziende col fine di organizzare i contenuti destrutturati, sia in formato testuale che multimediale (audio, video, immagini). I software di analisi dei contenuti utilizzano query in linguaggio naturale, l’analisi delle tendenze, e l’analisi predittiva per scoprire modelli e tendenze attraverso i contenuti non strutturati di un’azienda. L’obiettivo è quello di acquisire nuove conoscenze per una migliore processo decisionale. Tali tecniche sono applicate ai sistemi tecnologici educativi per organizzare e ottimizzare moduli formativi. Alcuni esempi sono:
    • Gooru
    • IBM Watson Content Analytics
  • Analisi dei dati di apprendimento (Learning analytics). Questi sistemi tracciano le conoscenze degli studenti e sono in grado di raccomandare agli stessi i passi successivi:
    • Sistemi di apprendimento adattivi: DreamBox, ALEKS, Reasoning Mind, Knewton
    • Apprendimento basati sui giochi: ST Math, Mangahigh
  • Sistemi di scheduling dinamico per abbinare studenti che hanno bisogno di aiuto a inse-gnanti che hanno tempo a disposizione:
    • NewClassrooms utilizza i learning analytics per programmare esperienze personalizza-te di apprendimento di matematica.
  • Sistemi di valutazione online e verifica plagio:
    • WriteToLearn di Pearsono Lightside di Turnitin, servizio online per il controllo di originalità di un testo scritto e per la valutazione online.
    • Lightside Labs è un servizio online che utilizza l’apprendi-mento automatico per fornire in tempo reale, un feedback automatizzato sulla scrittura degli studenti.

 

Conclusioni. Tra Big Data e Machine Learning
Nel nostro precedente articolo, Learning Analytics e Big Data, prendevamo in esame il rapporto tra Big Data e Learning Analytics in campo educativo. Anche nel settore educativo i tradizionali strumenti di analisi non sono adatti a catturare l’intero valore dei dati raccolti attraverso i sistemi di gestione dell’apprendimento online.

Si è tentato di ragionare, nell’articolo citato, sul fatto che, sebbene i sistemi di tracciamento dei dati di fruizione siano ampiamente consolidati e rispondano perfettamente ad una specifica visione della formazione online, l’opportunità creata dai Big Data educativi non può essere disattesa ancora a lungo. C’è in ballo la possibilità di creare veri percorsi personalizzati di apprendimento e la concreta possibilità di rendere più adattive gli ecosistemi di apprendimento. L’Apprendimento Automatico è ideale per sfruttare le opportunità nascoste nei Big Data.

La grande importanza acquisita dai Big Data è testimoniata anche da ciò che accade in Italia, dove, nel luglio di quest’anno, il Gruppo di lavoro sui Big Data (MIUR), ha reso pubblico il report con cui fa il punto sul lavoro fin qui svolto. La considerazione iniziale è che il Miur può contare su un vasto patrimonio di dati, da condividere in formato aperto per il riuso: questo principio è già inserito nella legge 107/2015, La Buona Scuola.

Ebbene, questo rapporto e, ancor più il PNSD (Piano Nazionale Scuola Digitale), intendono promuovere con forza l’utilizzo dei Big Data a fini educativi, sviluppando al contempo le professionalità ad essi legate. Nel campo della formazione digitale, ormai da molti anni parliamo di apprendimento collaborativo e di approccio costruttivista, teso a dare strumenti per la creazione collaborativa di materiale formativo. Ebbene, il PNSD afferma che la sfida formativa “è oggi relativa in primo luogo alla capacità di reperire, comprendere, descrivere, utilizzare, produrre informazione complessa e strutturata, tanto nell’ambito scientifico e tecnologico quanto in quello umanistico e sociale”.

La capacità di reperire, comprendere, descrivere, utilizzare e produrre informazione strutturata, rientra nella più tipica competenza trasversale di questi nostri anni: Imparare ad imparare (learning to learn). In uno scenario in cui i Big Data hanno tanta rilevanza, tale competenza diventa ancor più strategica e delicata. L’analisi intelligente dei dati, quindi, è una risorsa che diverrà sempre più importante per supportare i processi formativi. Il machine learning, con le sue tecniche per analizzare grandi quantità di dati e produrre sintesi intelligenti, sarà il nostro prezioso alleato.

 

Close