{"id":107,"date":"2023-11-30T17:18:21","date_gmt":"2023-11-30T17:18:21","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/chapter\/ai-speak-data-based-systems-part-2\/"},"modified":"2024-01-31T11:38:35","modified_gmt":"2024-01-31T11:38:35","slug":"ai-speak-data-based-systems-part-2","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/chapter\/ai-speak-data-based-systems-part-2\/","title":{"raw":"Parlare di IA: sistemi basati sui dati - Parte 2","rendered":"Parlare di IA: sistemi basati sui dati &#8211; Parte 2"},"content":{"raw":"<p class=\"no-indent\">La progettazione e l'implementazione di un progetto incentrato sui dati potrebbe essere suddivisa in 6 fasi. Le fasi si susseguono e l'intero processo pu\u00f2 essere ripetuto pi\u00f9 volte per ottenere il risultato desiderato.<\/p>\n<p class=\"indent\">Per essere efficaci in classe, i team multidisciplinari con insegnanti, esperti pedagogici e informatici dovrebbero essere coinvolti in ogni fase del processo<sup>1<\/sup>. Gli esperti umani sono necessari per identificare l'esigenza e progettare il processo, progettare e preparare i dati, selezionare gli algoritmi di ML, interpretare criticamente i risultati e pianificare l'utilizzo dell'applicazione<sup>2<\/sup>.<\/p>\n\n<h3>1) Comprendere il contesto educativo<\/h3>\n<p class=\"no-indent\"><img class=\"alignleft wp-image-285\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step1-683x1024-1.png\" alt=\"\" width=\"298\" height=\"446\">Il primo passo nella progettazione di uno strumento AIED \u00e8 la comprensione delle esigenze della classe. Una volta fissati gli obiettivi, bisogna capire come raggiungerli: quali fattori considerare e quali ignorare. Qualsiasi soluzione basata sui dati \u00e8 orientata verso fenomeni che possono essere facilmente calcolati e standardizzati<sup>3<\/sup>. Pertanto, ogni decisione deve essere discussa dagli insegnanti che utilizzeranno lo strumento, dagli esperti di pedagogia che possono garantire che tutte le decisioni siano fondate su una teoria comprovata e dagli informatici che comprendono il funzionamento degli algoritmi.<\/p>\n<p class=\"indent\">Le prime due fasi sono molto complicate, poich\u00e9 ci\u00f2 che \u00e8 possibile fare dipende anche dai dati disponibili<sup>2<\/sup>. Inoltre, la progettazione di strumenti educativi \u00e8 soggetta a leggi che impongono restrizioni sull'uso dei dati e sui tipi di algoritmi che possono essere utilizzati.<\/p>\n\n<h3>2) Comprendere i dati<\/h3>\n<p class=\"no-indent\">Una volta identificati gli obiettivi e i fattori che vi contribuiscono, l'attenzione si sposta sui dati necessari, sulle modalit\u00e0 di approvvigionamento e di etichettatura, sulla gestione della privacy e sulla misurazione della qualit\u00e0 dei dati<sup>3<\/sup>. Affinch\u00e9 un'applicazione di apprendimento automatico abbia successo, i dataset devono essere sufficientemente grandi, diversificati e ben etichettati.<\/p>\n\n\n[caption id=\"attachment_279\" align=\"alignright\" width=\"367\"]<img class=\" wp-image-279\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-MNIST-e1697986859822-1024x946-1.png\" alt=\"\" width=\"367\" height=\"339\"> Adattato da \"File:MnistExamples.png\" di Josef Steppan pubblicato con licenza CC BY-SA 4.0. Per visualizzare una copia di questa licenza, visitare <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/?ref=openverse<\/a>[\/caption]\n<p class=\"indent\">L'apprendimento automatico (ML) richiede dati per addestrare il modello e dati su cui lavorare o fare previsioni. Per alcuni compiti di ML, come il riconoscimento dei volti e degli oggetti, sono gi\u00e0 disponibili molti database pubblici e privati per l'addestramento.<\/p>\n<p class=\"indent\">Se non sono gi\u00e0 disponibili in forma utilizzabile, \u00e8 possibile che i dataset esistenti debbano essere aggiunti o rietichettati per adattarsi alle esigenze del progetto. In caso contrario, potrebbe essere necessario creare ed etichettare da zero set di dati dedicati. Anche le tracce digitali generate dallo studente durante l'utilizzo di un'applicazione potrebbero essere utilizzate come una delle fonti di dati.<\/p>\n<p class=\"indent\">In ogni caso, i dati e le caratteristiche rilevanti per il problema devono essere accuratamente identificati<sup>2<\/sup>. Le caratteristiche irrilevanti o ridondanti possono spingere un algoritmo a trovare falsi modelli e influenzare le prestazioni del sistema<sup>2<\/sup>. Poich\u00e9 la macchina pu\u00f2 trovare modelli solo nei dati che le vengono forniti, la sceltadel dataset definisce implicitamente anche il problema<sup>4<\/sup>. Se sono disponibili molti dati, \u00e8 necessario selezionarne un sottoinsieme con l'aiuto di tecniche statistiche e verificare i dati per evitare errori e distorsioni.<\/p>\n<p class=\"indent\">Come esempio di dati di addestramento errati, in una vicenda risalente agli albori della computer vision, un modello fu addestrato a discriminare tra immagini di carri armati russi e americani. Si scopr\u00ec in seguito che la sua elevata precisione era dovuta al fatto che i carri armati russi erano stati fotografati in una giornata nuvolosa e quelli americani in una giornata di sole<sup>4<\/sup>.<\/p>\n<p class=\"indent\">Pertanto, il dataset scelto deve essere verificato per la sua qualit\u00e0, tenendo conto del motivo per cui \u00e8 stato creato, cosa contiene, quali sono i processi utilizzati per la raccolta, la pulizia e l'etichettatura, la distribuzione e la manutenzione<sup>4<\/sup>. Le domande chiave da porre sono <em>I dataset sono adatti agli scopi per cui sono stati concepiti?<\/em>\u00a0e\u00a0<em>I dataset contengono rischi nascosti che possono rendere i modelli distorti o discriminatori<\/em><sup>3<\/sup>?\n<img class=\"aligncenter wp-image-296\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step2.png\" alt=\"\" width=\"296\" height=\"351\"><\/p>\n\n<h3>3) Preparare i dati<\/h3>\n<p class=\"no-indent\">La preparazione dei dati comporta la creazione di dataset unendo i dati disponibili in luoghi diversi, correggendo le incongruenze (per esempio, alcuni punteggi dei test potrebbero essere su una scala da 1 a 10, mentre altri sono dati in percentuale) e cercando valori mancanti o estremi. Si possono poi eseguire test automatizzati per verificare la qualit\u00e0 dei dataset. Ci\u00f2 include il controllo di eventuali fughe di notizie sulla privacy e di correlazioni o stereotipi imprevisti<sup>2<\/sup>. In questa fase, i dataset possono anche essere suddivisi in dataset di allenamento e di test. Il primo viene utilizzato per addestrare il modello e il secondo per verificarne le prestazioni. Eseguire un test sul dataset di addestramento sarebbe come distribuire il foglio d'esame il giorno prima per i compiti a casa: la prestazione dello studente all'esame non indicher\u00e0 la sua comprensione<sup>2<\/sup>.\n<img class=\"aligncenter wp-image-295\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step3.png\" alt=\"\" width=\"283\" height=\"312\"><\/p>\n\n<h3>4) Modellazione<\/h3>\n<p class=\"no-indent\"><img class=\"alignleft wp-image-294\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step4.png\" alt=\"\" width=\"326\" height=\"364\">In questa fase, gli algoritmi vengono utilizzati <a href=\"ai-speak--machine-learning\" data-cke-saved-href=\"ai-speak--machine-learning\">per estrarre schemi dai dati<\/a> e creare <a href=\"ai-speak--how-youtube-learns-you\" data-cke-saved-href=\"ai-speak--how-youtube-learns-you\">modelli<\/a>. Di solito vengono testati diversi algoritmi per vedere quale funziona meglio. Questi modelli possono poi essere utilizzati per fare previsioni su nuovi dati.<\/p>\n<p class=\"indent\">Nella maggior parte dei progetti, i modelli iniziali rivelano problemi nei dati che richiedono un passaggio continuo tra le fasi 2 e 3<sup>2<\/sup>. Finch\u00e9 esiste una forte correlazione tra le caratteristiche dei dati e il valore di uscita, \u00e8 molto probabile che un algoritmo di apprendimento automatico generi buone previsioni.<\/p>\n<p class=\"indent\">Questi algoritmi utilizzano tecniche statistiche e di calcolo avanzate per elaborare i dati. I programmatori devono regolare le impostazioni e provare diversi algoritmi per ottenere i risultati migliori. Prendiamo un'applicazione che rileva gli imbrogli. Un falso positivo si ha quando viene segnalato uno studente che non ha imbrogliato. Un falso negativo \u00e8 quando uno studente che imbroglia non viene segnalato. I progettisti del sistema possono mettere a punto il modello per ridurre al minimo i falsi positivi, in cui alcuni comportamenti di imbroglio potrebbero essere ignorati, o i falsi negativi, in cui anche i casi dubbi vengono segnalati.<sup>5 <\/sup>La messa a punto (tuning) dipende quindi da ci\u00f2 che vogliamo che il sistema faccia.<\/p>\n\n<h3>5) Valutazione<\/h3>\n<p class=\"no-indent\"><img class=\"alignright wp-image-293\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step5.png\" alt=\"\" width=\"306\" height=\"189\">Durante la fase di modellazione, ogni modello pu\u00f2 essere messo a punto per l'accuratezza della previsione sul dataset di addestramento. I modelli vengono poi testati sul dataset di prova e viene scelto un modello da utilizzare. Questo modello viene valutato anche in base a come risponde alle esigenze educative: gli obiettivi stabiliti nella fase 1 sono stati raggiunti? Ci sono problemi imprevisti? La qualit\u00e0 \u00e8 buona? Si pu\u00f2 migliorare o fare qualcosa in un altro modo? \u00c8 necessaria una riprogettazione? L'obiettivo principale \u00e8 decidere se l'applicazione pu\u00f2 essere utilizzata nelle scuole. In caso contrario, si ricomincia l'intero processo.<sup>2<\/sup><\/p>\n\n<h3>6) Implementazione (deployment)<\/h3>\n<p class=\"no-indent\"><img class=\"alignleft wp-image-292\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step6.png\" alt=\"\" width=\"295\" height=\"282\">La fase finale di questo processo consiste nel vedere come integrare l'applicazione basata sui dati con il sistema scolastico per ottenere i massimi benefici, sia per quanto riguarda l'infrastruttura tecnica che le pratiche didattiche.<\/p>\n<p class=\"indent no-indent\">Anche se viene dato come passo finale, l'intero processo \u00e8 iterativo. Dopo l'implementazione, il modello deve essere rivisto regolarmente per verificare se \u00e8 ancora pertinente al contesto. Le esigenze, i processi o le modalit\u00e0 di acquisizione dei dati potrebbero cambiare, influenzando l'output del sistema. Pertanto, l'applicazione deve essere rivista e aggiornata quando necessario. Il sistema deve essere monitorato costantemente per verificarne l'impatto sull'apprendimento, l'insegnamento e la valutazione.<sup>6\n<\/sup><sup><img class=\"wp-image-91 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch1-page-4-ethical-guidelines-1024x724-1.png\" alt=\"\" width=\"447\" height=\"316\"><\/sup>\nLe Linee guida etiche sull'uso dell'IA e dei dati per gli educatori sottolineano che la scuola dovrebbe essere in contatto con il fornitore di servizi di IA per tutto il ciclo di vita del sistema di IA, anche prima dell'implementazione. Dovrebbe richiedere una documentazione tecnica chiara e chiedere chiarimenti sui punti poco chiari. \u00c8 necessario stipulare un accordo per l'assistenza e la manutenzione e accertarsi che il fornitore abbia rispettato tutti gli obblighi di legge<sup>6<\/sup>.<\/p>\n<p class=\"no-indent\"><strong>Nota:<\/strong> Sia le fasi qui elencate che l'illustrazione sono adattate alle fasi e ai compiti di CRISP-DM Datascience (basati sulla figura 3 di Chapman, Clinton, Kerber, et al. 1999) come descritto in<sup>2.<\/sup><\/p>\n\n\n<hr>\n<p class=\"hanging-indent\"><sup>1 <\/sup>Du Boulay, B., Poulovasillis, A., Holmes, W., Mavrikis, M., <em>Artificial Intelligence And Big Data Technologies To Close The Achievement Gap,<\/em>in Luckin, R., ed. Enhancing Learning and Teaching with Technology, London: UCL Institute of Education Press, pp. 256\u2013285, 2018.<\/p>\n<p class=\"hanging-indent\"><sup>2<\/sup> Kelleher, J.D, Tierney, B, <em>Data Science<\/em>, London, 2018.<\/p>\n<p class=\"hanging-indent\"><sup>3 <\/sup>Hutchinson, B., Smart, A., Hanna, A., Denton, E., Greer, C., Kjartansson, O., Barnes, P., Mitchell, M., <em><a href=\"https:\/\/doi.org\/10.1145\/3442188.3445918\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/doi.org\/10.1145\/3442188.3445918\">Towards Accountability for Machine Learning Datasets: Practices from Software Engineering and Infrastructure<\/a><\/em>, Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, Association for Computing Machinery, New York, 2021.<\/p>\n<p class=\"hanging-indent\"><sup>4 <\/sup>Barocas, S.,\u00a0 Hardt, M., Narayanan, A., <em><a href=\"https:\/\/fairmlbook.org\/\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/fairmlbook.org\/\">Fairness and machine learning Limitations and Opportunities<\/a>, <\/em>2022.<\/p>\n<p class=\"hanging-indent\"><sup>5 <\/sup>Schneier, B., <em>Data and Goliath: The Hidden Battles to Capture Your Data and Control Your World, <\/em>W. W. Norton &amp; Company, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>6 <\/sup><em><a href=\"https:\/\/education.ec.europa.eu\/news\/ethical-guidelines-on-the-use-of-artificial-intelligence-and-data-in-teaching-and-learning-for-educators\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/education.ec.europa.eu\/news\/ethical-guidelines-on-the-use-of-artificial-intelligence-and-data-in-teaching-and-learning-for-educators\">Ethical guidelines on the use of artificial intelligence and data in teaching and learning for educators<\/a><\/em>, European Commission, October 2022.<\/p>","rendered":"<p class=\"no-indent\">La progettazione e l&#8217;implementazione di un progetto incentrato sui dati potrebbe essere suddivisa in 6 fasi. Le fasi si susseguono e l&#8217;intero processo pu\u00f2 essere ripetuto pi\u00f9 volte per ottenere il risultato desiderato.<\/p>\n<p class=\"indent\">Per essere efficaci in classe, i team multidisciplinari con insegnanti, esperti pedagogici e informatici dovrebbero essere coinvolti in ogni fase del processo<sup>1<\/sup>. Gli esperti umani sono necessari per identificare l&#8217;esigenza e progettare il processo, progettare e preparare i dati, selezionare gli algoritmi di ML, interpretare criticamente i risultati e pianificare l&#8217;utilizzo dell&#8217;applicazione<sup>2<\/sup>.<\/p>\n<h3>1) Comprendere il contesto educativo<\/h3>\n<p class=\"no-indent\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft wp-image-285\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step1-683x1024-1.png\" alt=\"\" width=\"298\" height=\"446\" \/>Il primo passo nella progettazione di uno strumento AIED \u00e8 la comprensione delle esigenze della classe. Una volta fissati gli obiettivi, bisogna capire come raggiungerli: quali fattori considerare e quali ignorare. Qualsiasi soluzione basata sui dati \u00e8 orientata verso fenomeni che possono essere facilmente calcolati e standardizzati<sup>3<\/sup>. Pertanto, ogni decisione deve essere discussa dagli insegnanti che utilizzeranno lo strumento, dagli esperti di pedagogia che possono garantire che tutte le decisioni siano fondate su una teoria comprovata e dagli informatici che comprendono il funzionamento degli algoritmi.<\/p>\n<p class=\"indent\">Le prime due fasi sono molto complicate, poich\u00e9 ci\u00f2 che \u00e8 possibile fare dipende anche dai dati disponibili<sup>2<\/sup>. Inoltre, la progettazione di strumenti educativi \u00e8 soggetta a leggi che impongono restrizioni sull&#8217;uso dei dati e sui tipi di algoritmi che possono essere utilizzati.<\/p>\n<h3>2) Comprendere i dati<\/h3>\n<p class=\"no-indent\">Una volta identificati gli obiettivi e i fattori che vi contribuiscono, l&#8217;attenzione si sposta sui dati necessari, sulle modalit\u00e0 di approvvigionamento e di etichettatura, sulla gestione della privacy e sulla misurazione della qualit\u00e0 dei dati<sup>3<\/sup>. Affinch\u00e9 un&#8217;applicazione di apprendimento automatico abbia successo, i dataset devono essere sufficientemente grandi, diversificati e ben etichettati.<\/p>\n<figure id=\"attachment_279\" aria-describedby=\"caption-attachment-279\" style=\"width: 367px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-279\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-MNIST-e1697986859822-1024x946-1.png\" alt=\"\" width=\"367\" height=\"339\" \/><figcaption id=\"caption-attachment-279\" class=\"wp-caption-text\">Adattato da &#8220;File:MnistExamples.png&#8221; di Josef Steppan pubblicato con licenza CC BY-SA 4.0. Per visualizzare una copia di questa licenza, visitare <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/?ref=openverse<\/a><\/figcaption><\/figure>\n<p class=\"indent\">L&#8217;apprendimento automatico (ML) richiede dati per addestrare il modello e dati su cui lavorare o fare previsioni. Per alcuni compiti di ML, come il riconoscimento dei volti e degli oggetti, sono gi\u00e0 disponibili molti database pubblici e privati per l&#8217;addestramento.<\/p>\n<p class=\"indent\">Se non sono gi\u00e0 disponibili in forma utilizzabile, \u00e8 possibile che i dataset esistenti debbano essere aggiunti o rietichettati per adattarsi alle esigenze del progetto. In caso contrario, potrebbe essere necessario creare ed etichettare da zero set di dati dedicati. Anche le tracce digitali generate dallo studente durante l&#8217;utilizzo di un&#8217;applicazione potrebbero essere utilizzate come una delle fonti di dati.<\/p>\n<p class=\"indent\">In ogni caso, i dati e le caratteristiche rilevanti per il problema devono essere accuratamente identificati<sup>2<\/sup>. Le caratteristiche irrilevanti o ridondanti possono spingere un algoritmo a trovare falsi modelli e influenzare le prestazioni del sistema<sup>2<\/sup>. Poich\u00e9 la macchina pu\u00f2 trovare modelli solo nei dati che le vengono forniti, la sceltadel dataset definisce implicitamente anche il problema<sup>4<\/sup>. Se sono disponibili molti dati, \u00e8 necessario selezionarne un sottoinsieme con l&#8217;aiuto di tecniche statistiche e verificare i dati per evitare errori e distorsioni.<\/p>\n<p class=\"indent\">Come esempio di dati di addestramento errati, in una vicenda risalente agli albori della computer vision, un modello fu addestrato a discriminare tra immagini di carri armati russi e americani. Si scopr\u00ec in seguito che la sua elevata precisione era dovuta al fatto che i carri armati russi erano stati fotografati in una giornata nuvolosa e quelli americani in una giornata di sole<sup>4<\/sup>.<\/p>\n<p class=\"indent\">Pertanto, il dataset scelto deve essere verificato per la sua qualit\u00e0, tenendo conto del motivo per cui \u00e8 stato creato, cosa contiene, quali sono i processi utilizzati per la raccolta, la pulizia e l&#8217;etichettatura, la distribuzione e la manutenzione<sup>4<\/sup>. Le domande chiave da porre sono <em>I dataset sono adatti agli scopi per cui sono stati concepiti?<\/em>\u00a0e\u00a0<em>I dataset contengono rischi nascosti che possono rendere i modelli distorti o discriminatori<\/em><sup>3<\/sup>?<br \/>\n<img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-296\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step2.png\" alt=\"\" width=\"296\" height=\"351\" \/><\/p>\n<h3>3) Preparare i dati<\/h3>\n<p class=\"no-indent\">La preparazione dei dati comporta la creazione di dataset unendo i dati disponibili in luoghi diversi, correggendo le incongruenze (per esempio, alcuni punteggi dei test potrebbero essere su una scala da 1 a 10, mentre altri sono dati in percentuale) e cercando valori mancanti o estremi. Si possono poi eseguire test automatizzati per verificare la qualit\u00e0 dei dataset. Ci\u00f2 include il controllo di eventuali fughe di notizie sulla privacy e di correlazioni o stereotipi imprevisti<sup>2<\/sup>. In questa fase, i dataset possono anche essere suddivisi in dataset di allenamento e di test. Il primo viene utilizzato per addestrare il modello e il secondo per verificarne le prestazioni. Eseguire un test sul dataset di addestramento sarebbe come distribuire il foglio d&#8217;esame il giorno prima per i compiti a casa: la prestazione dello studente all&#8217;esame non indicher\u00e0 la sua comprensione<sup>2<\/sup>.<br \/>\n<img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-295\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step3.png\" alt=\"\" width=\"283\" height=\"312\" \/><\/p>\n<h3>4) Modellazione<\/h3>\n<p class=\"no-indent\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft wp-image-294\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step4.png\" alt=\"\" width=\"326\" height=\"364\" \/>In questa fase, gli algoritmi vengono utilizzati <a href=\"ai-speak--machine-learning\" data-cke-saved-href=\"ai-speak--machine-learning\">per estrarre schemi dai dati<\/a> e creare <a href=\"ai-speak--how-youtube-learns-you\" data-cke-saved-href=\"ai-speak--how-youtube-learns-you\">modelli<\/a>. Di solito vengono testati diversi algoritmi per vedere quale funziona meglio. Questi modelli possono poi essere utilizzati per fare previsioni su nuovi dati.<\/p>\n<p class=\"indent\">Nella maggior parte dei progetti, i modelli iniziali rivelano problemi nei dati che richiedono un passaggio continuo tra le fasi 2 e 3<sup>2<\/sup>. Finch\u00e9 esiste una forte correlazione tra le caratteristiche dei dati e il valore di uscita, \u00e8 molto probabile che un algoritmo di apprendimento automatico generi buone previsioni.<\/p>\n<p class=\"indent\">Questi algoritmi utilizzano tecniche statistiche e di calcolo avanzate per elaborare i dati. I programmatori devono regolare le impostazioni e provare diversi algoritmi per ottenere i risultati migliori. Prendiamo un&#8217;applicazione che rileva gli imbrogli. Un falso positivo si ha quando viene segnalato uno studente che non ha imbrogliato. Un falso negativo \u00e8 quando uno studente che imbroglia non viene segnalato. I progettisti del sistema possono mettere a punto il modello per ridurre al minimo i falsi positivi, in cui alcuni comportamenti di imbroglio potrebbero essere ignorati, o i falsi negativi, in cui anche i casi dubbi vengono segnalati.<sup>5 <\/sup>La messa a punto (tuning) dipende quindi da ci\u00f2 che vogliamo che il sistema faccia.<\/p>\n<h3>5) Valutazione<\/h3>\n<p class=\"no-indent\"><img loading=\"lazy\" decoding=\"async\" class=\"alignright wp-image-293\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step5.png\" alt=\"\" width=\"306\" height=\"189\" \/>Durante la fase di modellazione, ogni modello pu\u00f2 essere messo a punto per l&#8217;accuratezza della previsione sul dataset di addestramento. I modelli vengono poi testati sul dataset di prova e viene scelto un modello da utilizzare. Questo modello viene valutato anche in base a come risponde alle esigenze educative: gli obiettivi stabiliti nella fase 1 sono stati raggiunti? Ci sono problemi imprevisti? La qualit\u00e0 \u00e8 buona? Si pu\u00f2 migliorare o fare qualcosa in un altro modo? \u00c8 necessaria una riprogettazione? L&#8217;obiettivo principale \u00e8 decidere se l&#8217;applicazione pu\u00f2 essere utilizzata nelle scuole. In caso contrario, si ricomincia l&#8217;intero processo.<sup>2<\/sup><\/p>\n<h3>6) Implementazione (deployment)<\/h3>\n<p class=\"no-indent\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft wp-image-292\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch3-page-4-step6.png\" alt=\"\" width=\"295\" height=\"282\" \/>La fase finale di questo processo consiste nel vedere come integrare l&#8217;applicazione basata sui dati con il sistema scolastico per ottenere i massimi benefici, sia per quanto riguarda l&#8217;infrastruttura tecnica che le pratiche didattiche.<\/p>\n<p class=\"indent no-indent\">Anche se viene dato come passo finale, l&#8217;intero processo \u00e8 iterativo. Dopo l&#8217;implementazione, il modello deve essere rivisto regolarmente per verificare se \u00e8 ancora pertinente al contesto. Le esigenze, i processi o le modalit\u00e0 di acquisizione dei dati potrebbero cambiare, influenzando l&#8217;output del sistema. Pertanto, l&#8217;applicazione deve essere rivista e aggiornata quando necessario. Il sistema deve essere monitorato costantemente per verificarne l&#8217;impatto sull&#8217;apprendimento, l&#8217;insegnamento e la valutazione.<sup>6<br \/>\n<\/sup><sup><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-91 aligncenter\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/12\/2023\/11\/ch1-page-4-ethical-guidelines-1024x724-1.png\" alt=\"\" width=\"447\" height=\"316\" \/><\/sup><br \/>\nLe Linee guida etiche sull&#8217;uso dell&#8217;IA e dei dati per gli educatori sottolineano che la scuola dovrebbe essere in contatto con il fornitore di servizi di IA per tutto il ciclo di vita del sistema di IA, anche prima dell&#8217;implementazione. Dovrebbe richiedere una documentazione tecnica chiara e chiedere chiarimenti sui punti poco chiari. \u00c8 necessario stipulare un accordo per l&#8217;assistenza e la manutenzione e accertarsi che il fornitore abbia rispettato tutti gli obblighi di legge<sup>6<\/sup>.<\/p>\n<p class=\"no-indent\"><strong>Nota:<\/strong> Sia le fasi qui elencate che l&#8217;illustrazione sono adattate alle fasi e ai compiti di CRISP-DM Datascience (basati sulla figura 3 di Chapman, Clinton, Kerber, et al. 1999) come descritto in<sup>2.<\/sup><\/p>\n<hr \/>\n<p class=\"hanging-indent\"><sup>1 <\/sup>Du Boulay, B., Poulovasillis, A., Holmes, W., Mavrikis, M., <em>Artificial Intelligence And Big Data Technologies To Close The Achievement Gap,<\/em>in Luckin, R., ed. Enhancing Learning and Teaching with Technology, London: UCL Institute of Education Press, pp. 256\u2013285, 2018.<\/p>\n<p class=\"hanging-indent\"><sup>2<\/sup> Kelleher, J.D, Tierney, B, <em>Data Science<\/em>, London, 2018.<\/p>\n<p class=\"hanging-indent\"><sup>3 <\/sup>Hutchinson, B., Smart, A., Hanna, A., Denton, E., Greer, C., Kjartansson, O., Barnes, P., Mitchell, M., <em><a href=\"https:\/\/doi.org\/10.1145\/3442188.3445918\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/doi.org\/10.1145\/3442188.3445918\">Towards Accountability for Machine Learning Datasets: Practices from Software Engineering and Infrastructure<\/a><\/em>, Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, Association for Computing Machinery, New York, 2021.<\/p>\n<p class=\"hanging-indent\"><sup>4 <\/sup>Barocas, S.,\u00a0 Hardt, M., Narayanan, A., <em><a href=\"https:\/\/fairmlbook.org\/\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/fairmlbook.org\/\">Fairness and machine learning Limitations and Opportunities<\/a>, <\/em>2022.<\/p>\n<p class=\"hanging-indent\"><sup>5 <\/sup>Schneier, B., <em>Data and Goliath: The Hidden Battles to Capture Your Data and Control Your World, <\/em>W. W. Norton &amp; Company, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>6 <\/sup><em><a href=\"https:\/\/education.ec.europa.eu\/news\/ethical-guidelines-on-the-use-of-artificial-intelligence-and-data-in-teaching-and-learning-for-educators\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/education.ec.europa.eu\/news\/ethical-guidelines-on-the-use-of-artificial-intelligence-and-data-in-teaching-and-learning-for-educators\">Ethical guidelines on the use of artificial intelligence and data in teaching and learning for educators<\/a><\/em>, European Commission, October 2022.<\/p>\n","protected":false},"author":1,"menu_order":4,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":86,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/107"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/107\/revisions"}],"predecessor-version":[{"id":108,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/107\/revisions\/108"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/parts\/86"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/107\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/media?parent=107"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapter-type?post=107"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/contributor?post=107"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/license?post=107"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}