La ricerca di risorse didattiche è un’attività importante per gli insegnanti: quando preparano una nuova lezione, esplorano un nuovo campo o argomento o preparano qualche attività. Questo materiale (courseware) può servire solo come documentazione, ma a volte l’insegnante potrebbe voler costruire un nuovo courseware a partire da esso; ed è allettante e intellettualmente legittimo non reinventare la ruota e usare una forma intelligente di copia-incolla. Ovviamente questo non è legale nella maggior parte dei Paesi, in quanto viola le leggi sul copyright.
Quando gli autori delle risorse concedono il loro lavoro con licenza Creative Common, le risorse diventano Risorse Educative Aperte (in inglese Open Educational Resources, o OER) e l’insegnante può riutilizzarle, trasformarle, remixarle e ridistribuirle liberamente. L’unico obbligo, di solito, è quello di citare correttamente l’autore originale. È quindi importante identificare quando una risorsa è aperta o meno.
Esistono alcune raccolte di risorse educative aperte con buone licenze e probabilmente il vostro ministero ne ha una. Ma come trovare queste risorse ovunque sul web? Possiamo utilizzare un motore di ricerca specifico per questo?
Il progetto X5-GON è stato finanziato dall’Unione Europea per trovare e indicizzare le OER, utilizzare l’intelligenza artificiale per curare queste OER e proporre strumenti di intelligenza artificiale, tipicamente strumenti di ricerca, che consentano agli utenti di trovare meglio le OER.
Dove si colloca l’IA in questo processo?
Apparirà in tutte le fasi:
Durante la fase di ingestione, i robot effettuano lo scraping del web e restituiscono le OER: si tratta di un processo complesso, poiché significa riconoscere le OER e quindi le licenze. Una parte di questo processo può essere vista come un tipico compito di classificazione (un comune compito di AI).
Quando il robot ha trovato una risorsa, è necessario recuperare il testo da questa risorsa. Quando la risorsa è un file audio o video, ciò significa utilizzare la trascrizione (per saperne di più, si veda il Capitolo 7).
Il 5 in X5-GON si riferisce alle 5 barriere o dimensioni che il progetto voleva affrontare: una di queste è la lingua. La fase successiva del processo consiste quindi nell’utilizzare strumenti di traduzione automatica per ottenere versioni del testo in ciascuna delle lingue scelte. Ancora una volta uno strumento tipico dell’AI.
A questo punto vi chiederete: La trascrizione e la traduzione automatiche sono tecnologie in rapida crescita. Ma commettono ancora gravi errori. Non è pericoloso affidarsi a queste tecnologie? La risposta è che gli algoritmi di ricerca e raccomandazione non hanno bisogno del testo esatto. Hanno bisogno di posizionare il documento in uno spazio, accanto a parole chiave o ad altri documenti.
Pensate a quando avete una scatola piena di vecchi documenti da organizzare. L’ideale sarebbe avere un’organizzazione predefinita e archiviare ogni foglio nel posto giusto. Ma di solito non abbiamo questo sistema di archiviazione preesistente e finiamo per mettere i documenti uno vicino all’altro quando hanno cose in comune, con regole non scritte di ogni tipo: questi due documenti vanno insieme perché risalgono allo stesso anno, questi due perché sono legati alle automobili, questi due perché hanno le stesse dimensioni, e così via… Il termine chiave qui è “vicino a”: ne parleremo più avanti nel libro.
Una volta estratti i testi grezzi, è possibile costruire dei modelli. I documenti diventeranno vettori in uno spazio ad alta dimensionalità e il confronto dei vettori ci permetterà di rispondere alle domande: quali sono i 10 documenti più simili a questo? Quali sono i 5 documenti che corrispondono meglio a questa parola chiave?
I modelli più ricchi possono essere ottenuti attraverso l’addestramento. Possono rispondere a domande più complesse:
- Quanto è difficile questo corso? La risposta può forse trovarsi da qualche parte nella descrizione del corso, o nei meta-dati, i dati nascosti all’osservatore ma che dovrebbero fornire informazioni su un documento. Più probabilmente, possono essere ottenuti attraverso l’analisi automatica del documento: la lunghezza delle frasi e delle parole, le parole stesse sono forti indicatori dell’età a cui un corso è stato destinato.
- Dovrei guardare questo courseware prima di quest’altro? Questo è il prequel per poter avere un corso completo costruito automaticamente da un courseware dato.
- Qual è la qualità del corso? Questa è per l’IA la domanda più difficile. È anche una domanda forse sbagliata, in cui l’IA può fare più male che bene. Tuttavia, essere in grado di scoprire se i fatti di un corso sono corretti ha molto senso. Dopo le fake news, avremo anche i corsi falsi?
Alcuni link
X5-Discover (https://discovery.x5gon.org/) è un motore di ricerca.
La piattaforma di apprendimento X5-Learn (http://x5learn.org/) permette di scegliere il proprio materiale didattico e di far sì che l’intelligenza artificiale lo organizzi nell’ordine migliore. In questo caso, si utilizza un motore di raccomandazione.
Più strumenti X5-GON (un’API per gli sviluppatori, una versione da installare in Moodle) possono essere trovati qui.
Il progetto X5GON è stato finanziato dal programma di ricerca e innovazione Horizon 2020 dell’Unione Europea con la sovvenzione n. 761758.