{"id":92,"date":"2023-11-30T16:29:58","date_gmt":"2023-11-30T16:29:58","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/ai-speak-data-based-systems-part-1\/"},"modified":"2024-01-31T11:50:41","modified_gmt":"2024-01-31T11:50:41","slug":"ai-speak-data-based-systems-part-1","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/ai-speak-data-based-systems-part-1\/","title":{"raw":"Parlons IA : Syst\u00e8mes bas\u00e9s sur les donn\u00e9es - Partie 1","rendered":"Parlons IA : Syst\u00e8mes bas\u00e9s sur les donn\u00e9es &#8211; Partie 1"},"content":{"raw":"<div class=\"textbox textbox--exercises\"><header class=\"textbox__header\">\n<h3 class=\"textbox__title\" style=\"text-align: left\"><strong>D\u00e9cisions en classe<\/strong><\/h3>\n<\/header>\n<div class=\"textbox__content\">\n<p class=\"no-indent\">En tant qu'enseignant, vous avez acc\u00e8s \u00e0 de nombreux types de donn\u00e9es. Soit des donn\u00e9es tangibles comme les feuilles de pr\u00e9sence et de performances, soit des donn\u00e9es intangibles comme les expressions corporelles des \u00e9l\u00e8ves. Pensez \u00e0 certaines des d\u00e9cisions que vous prenez dans votre vie professionnelle : <em>Quelles sont les donn\u00e9es qui vous aident \u00e0 prendre ces d\u00e9cisions ? <\/em>Il existe des applications technologiques qui peuvent vous aider \u00e0 visualiser ou \u00e0 traiter les donn\u00e9es. Les syst\u00e8mes d'intelligence artificielle utilisent les donn\u00e9es pour personnaliser l'apprentissage, faire des pr\u00e9dictions et prendre des d\u00e9cisions qui pourraient vous aider \u00e0 enseigner et \u00e0 g\u00e9rer votre classe : <em>Avez-vous des besoins auxquels la technologie peut r\u00e9pondre ? Si oui, quelles seront les donn\u00e9es dont un tel syst\u00e8me pourrait avoir besoin pour mener \u00e0 bien sa t\u00e2che ?<\/em><\/p>\n\n<\/div>\n<\/div>\n\n[caption id=\"attachment_91\" align=\"alignleft\" width=\"264\"]<img class=\"wp-image-90 \" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1.png\" alt=\"\" width=\"264\" height=\"469\"> R\u00e9f\u00e9rence : Kelleher, J.D, Tierney, B, Data Science, London, 2018 and Kitchin, R, Big Data, new epistemologies and paradigm shifts, Big Data &amp; Society, 2014[\/caption]\n<p class=\"no-indent\">Les syst\u00e8mes \u00e9ducatifs ont toujours g\u00e9n\u00e9r\u00e9 des donn\u00e9es - donn\u00e9es personnelles des \u00e9tudiants, dossiers acad\u00e9miques, donn\u00e9es de pr\u00e9sence et plus encore. Avec la num\u00e9risation et les applis AIED, davantage de donn\u00e9es sont enregistr\u00e9es et stock\u00e9es : clics de souris, pages consult\u00e9es, horodatages et frappes au clavier<sup>1<\/sup>. La pens\u00e9e centr\u00e9e sur les donn\u00e9es devenant la norme dans la soci\u00e9t\u00e9, il est naturel de se demander comment croquer toutes ces donn\u00e9es pour faire quelque chose de pertinent : pourrions-nous donner des retours plus personnalis\u00e9s \u00e0 l'apprenant ? Pourrions-nous concevoir de meilleurs outils de visualisation et de notification pour l'enseignant ?<sup>2<\/sup><\/p>\n<p class=\"indent\">Quelle que soit la technologie utilis\u00e9e, elle doit r\u00e9pondre \u00e0 un besoin r\u00e9el dans la salle de classe. Une fois le besoin identifi\u00e9, nous pouvons examiner les donn\u00e9es disponibles et nous demander ce qui est pertinent pour le r\u00e9sultat souhait\u00e9. Il s'agit de d\u00e9couvrir les facteurs qui permettent aux \u00e9ducateurs de prendre des d\u00e9cisions nuanc\u00e9es. Ces facteurs peuvent-ils \u00eatre saisis \u00e0 l'aide des donn\u00e9es disponibles ? Les donn\u00e9es et les syst\u00e8mes bas\u00e9s sur les donn\u00e9es sont-ils le meilleur moyen de r\u00e9pondre au besoin ? Quelles pourraient \u00eatre les cons\u00e9quences involontaires de l'utilisation des donn\u00e9es de cette fa\u00e7on ?<sup>3<\/sup><\/p>\n<p class=\"indent\">L'apprentissage automatique nous permet de renvoyer nombre de ces questions aux donn\u00e9es elles-m\u00eames<sup>4<\/sup>. Les applications du ML sont entra\u00een\u00e9es sur des donn\u00e9es. Elles fonctionnent en exploitant les donn\u00e9es. Elles trouvent des tendances et font des g\u00e9n\u00e9ralisations et les stockent sous forme de mod\u00e8les - des donn\u00e9es qui peuvent \u00eatre utilis\u00e9es pour r\u00e9pondre \u00e0 des demandes \u00e0 venir<sup>4<\/sup>. Leurs d\u00e9cisions et leurs pr\u00e9dictions, et la fa\u00e7on dont elles influencent l'apprentissage des \u00e9l\u00e8ves, sont \u00e9galement des donn\u00e9es. Ainsi, savoir comment les programmeurs, la machine et l'utilisateur traitent les donn\u00e9es est une partie importante de la compr\u00e9hension du fonctionnement de l'intelligence artificielle.<\/p>\n\n<h3>A propos des donn\u00e9es<\/h3>\n<p class=\"no-indent\">Les donn\u00e9es sont g\u00e9n\u00e9ralement li\u00e9es \u00e0 une entit\u00e9 du monde r\u00e9el - une personne, un objet ou un \u00e9v\u00e9nement. Chaque entit\u00e9 peut \u00eatre d\u00e9crite par un certain nombre d'<em>attributs<\/em> (<em>caract\u00e9ristiques<\/em> ou <em>variables<\/em>)<sup>5<\/sup>. Par exemple, le nom, l'\u00e2ge et la classe sont quelques attributs d'un \u00e9tudiant. L'ensemble de ces attributs constitue les donn\u00e9es dont nous disposons sur l'\u00e9tudiant, qui, bien qu'elles ne soient en aucun cas proches de l'entit\u00e9 r\u00e9elle, nous renseignent sur lui. Les donn\u00e9es collect\u00e9es, utilis\u00e9es et trait\u00e9es dans le syst\u00e8me \u00e9ducatif sont appel\u00e9es <em>donn\u00e9es \u00e9ducatives<\/em><sup>1<\/sup>.<\/p>\n<p class=\"indent\">Un jeu de donn\u00e9es (<em>dataset<\/em>) peut \u00eatre vu comme une collection d'entit\u00e9s organis\u00e9es en lignes et en colonnes. La feuille de pr\u00e9sence d'une classe est un ensemble de donn\u00e9es. Chaque ligne est le \"la fiche\" d'un \u00e9tudiant. Les colonnes peuvent \u00eatre leur pr\u00e9sence ou leur absence pendant un jour ou une session particuli\u00e8re. Ainsi, chaque colonne est un attribut.<\/p>\nhttps:\/\/youtu.be\/BlQF9s9xtIc?list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma\n\n[caption id=\"attachment_91\" align=\"alignright\" width=\"300\"]<img class=\"size-medium wp-image-91\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2.png\" alt=\"\" width=\"300\" height=\"300\"> The DIKW Pyramid. R\u00e9f\u00e9rence: Kelleher, J.D, Tierney, B, Data Science, London, 2018 and Kitchin, R, Big Data, new epistemologies and paradigm shifts, Big Data &amp; Society, 2014[\/caption]\n<p class=\"no-indent\">Les donn\u00e9es sont cr\u00e9\u00e9es en choisissant des attributs et en les mesurant : chaque donn\u00e9e est le r\u00e9sultat de d\u00e9cisions et de choix humains. Ainsi, la cr\u00e9ation de donn\u00e9es est un processus subjectif, partiel et d\u00e9sordonn\u00e9, sujet \u00e0 des difficult\u00e9s techniques<sup>4,5<\/sup>. De plus, ce que l\u2019on choisit de mesurer et ce que l\u2019on ne mesure pas peut avoir une grande influence sur les r\u00e9sultats attendus.<\/p>\n<p class=\"indent\">Les <em>traces<\/em> sont des enregistrements de l'activit\u00e9 des \u00e9l\u00e8ves tels que des clics de souris, des donn\u00e9es sur les pages ouvertes, le moment des interactions ou des appuis sur clavier dans un syst\u00e8me num\u00e9rique<sup>1<\/sup>. Les <em>m\u00e9tadonn\u00e9es<\/em>\u2014c'est-\u00e0-dire des donn\u00e9es qui d\u00e9crivent d'autres donn\u00e9es<sup>5<\/sup>. Les <em>donn\u00e9es d\u00e9riv\u00e9es<\/em> sont des donn\u00e9es calcul\u00e9es ou d\u00e9duites d'autres donn\u00e9es : les notes individuelles de chaque \u00e9l\u00e8ve sont des donn\u00e9es. La moyenne de la classe est une donn\u00e9e d\u00e9riv\u00e9e. Souvent, les donn\u00e9es d\u00e9riv\u00e9es sont plus utiles pour obtenir des perspectives utiles, trouver des mod\u00e8les et faire des pr\u00e9dictions. Les applications d'apprentissage automatique peuvent cr\u00e9er des donn\u00e9es d\u00e9riv\u00e9es et les lier \u00e0 des traces de donn\u00e9es et m\u00e9tadonn\u00e9es pour cr\u00e9er des <a href=\"https:\/\/youtu.be\/C3RrfySCnAg?list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma\" target=\"_blank\" rel=\"noopener\">mod\u00e8les d'apprentissage<\/a> d\u00e9taill\u00e9s, qui aident \u00e0 personnaliser l'apprentissage<sup>1<\/sup>.<\/p>\n<p class=\"indent\">Pour que toute application bas\u00e9e sur des donn\u00e9es soit une r\u00e9ussite, les attributs doivent \u00eatre soigneusement choisis et correctement mesur\u00e9s. Les mod\u00e8les qui y sont d\u00e9couverts doivent \u00eatre v\u00e9rifi\u00e9s pour voir s'ils ont du sens dans le contexte \u00e9ducatif. Lorsqu'ils sont con\u00e7us et maintenus correctement, les syst\u00e8mes bas\u00e9s sur les donn\u00e9es peuvent \u00eatre tr\u00e8s pr\u00e9cieux.<\/p>\nhttps:\/\/youtu.be\/CRq2hl5kVQo?list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma\n<div class=\"textbox textbox--sidebar\"><a href=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/more-on-big-data\/\" target=\"_blank\" rel=\"noopener\">V\u00e9rifiez si vous \u00eates au point sur les (Big) Data<\/a><\/div>\n<p class=\"no-indent\">Ce chapitre vise \u00e0 pr\u00e9senter quelques \u00e9l\u00e9ments fondamentaux des donn\u00e9es et de la technologie bas\u00e9e sur les donn\u00e9es, mais la ma\u00eetrise des donn\u00e9es est une comp\u00e9tence tr\u00e8s importante \u00e0 acqu\u00e9rir et m\u00e9rite une formation d\u00e9di\u00e9e et un soutien et des mises \u00e0 jour continus<sup>1<\/sup>.<\/p>\n\n<h3>La r\u00e9glementation que vous devez conna\u00eetre<\/h3>\n<p class=\"no-indent\">En raison de la baisse radicale des co\u00fbts de stockage des donn\u00e9es, davantage de donn\u00e9es et de m\u00e9tadonn\u00e9es sont sauvegard\u00e9es et conserv\u00e9es plus longtemps<sup>6<\/sup>. Cela peut entra\u00eener des atteintes \u00e0 la vie priv\u00e9e et des infractions aux droits. Des lois comme le <strong>R\u00e8glement g\u00e9n\u00e9ral sur la protection des donn\u00e9es<\/strong> (RGPD) d\u00e9couragent de telles pratiques et donnent aux citoyens de l'UE plus de contr\u00f4le sur leurs donn\u00e9es personnelles. Elles donnent des r\u00e8glements de protection des donn\u00e9es juridiquement ex\u00e9cutoires dans tous les \u00c9tats membres de l'UE.<\/p>\n<p class=\"indent\">Selon le RGPD, les donn\u00e9es personnelles sont toute information relative \u00e0 une personne identifi\u00e9e ou identifiable (sujet des donn\u00e9es). Les \u00e9coles, en plus de s'engager aupr\u00e8s des entreprises qui traitent leurs donn\u00e9es, stockent d'\u00e9normes quantit\u00e9s d'informations personnelles sur les \u00e9tudiants, les parents, le personnel, la direction et les fournisseurs. En tant que responsables du traitement des donn\u00e9es, elles sont tenues de stocker les donn\u00e9es qu'elles traitent de mani\u00e8re confidentielle et s\u00e9curis\u00e9e et de mettre en place des proc\u00e9dures pour la protection et l'utilisation appropri\u00e9e de toutes les donn\u00e9es personnelles<sup>1<\/sup>.<\/p>\n<p class=\"indent\">Les droits \u00e9tablis par le RGPD comprennent :<\/p>\n\n<ul>\n \t<li>Le <strong>Droit d'acc\u00e8s<\/strong> qui les oblige,les citoyens, \u00e0 savoir(facilement) quelles donn\u00e9es sont collect\u00e9es sur eux<\/li>\n \t<li>Le <strong>Droit d'\u00eatre inform\u00e9<\/strong> de l'utilisation faite de leurs donn\u00e9es<\/li>\n \t<li>Le <strong>Droit \u00e0 l'effacement<\/strong> qui permet \u00e0 un citoyen dont les donn\u00e9es ont \u00e9t\u00e9 collect\u00e9es par une plateforme de demander que ces donn\u00e9es soient retir\u00e9es du jeu de donn\u00e9es construit par la plateforme (et qui peut \u00eatre vendu \u00e0 d'autres personnes)<\/li>\n \t<li>Le <strong>Droit \u00e0 l'explication<\/strong> o\u00f9 une explication doit \u00eatre fournie chaque fois qu'ils ont besoin d'une clarification sur les processus de d\u00e9cision automatis\u00e9s qui les concernent.<\/li>\n<\/ul>\n<p class=\"indent\">Toutefois, le RGPD permet la collecte de certaines donn\u00e9es au titre de \u201cl'int\u00e9r\u00eat l\u00e9gitime\u201d<sup>7<\/sup> et l'utilisation de donn\u00e9es d\u00e9riv\u00e9es, agr\u00e9g\u00e9es ou anonymis\u00e9es ind\u00e9finiment et sans consentement<sup>5<\/sup>. La nouvelle l\u00e9gislation sur les services num\u00e9riques (<em>Digital Services Act<\/em>) restreint l'utilisation des donn\u00e9es personnelles dans le cadre de la publicit\u00e9 cibl\u00e9e<sup>7<\/sup>. En outre, le bouclier de protection de la vie priv\u00e9e UE-USA renforce les droits de protection des donn\u00e9es des citoyens de l'UE dans le contexte o\u00f9 leurs donn\u00e9es ont \u00e9t\u00e9 d\u00e9plac\u00e9es en dehors de l'UE<sup>5<\/sup>.<\/p>\nIl est possible de se r\u00e9f\u00e9rer \u00e0 ce <a href=\"https:\/\/www.liberties.eu\/en\/stories\/gdpr-for-dummies\/44076\" target=\"_blank\" rel=\"noopener\">RGPD pour les nuls<\/a> pour l'analyse faite par des experts ind\u00e9pendants de l'Union des libert\u00e9s civiles pour l'Europe (Liberties), une ONG qui prot\u00e8ge les droits de l'homme de chacun dans l'Union europ\u00e9enne.\n\n<hr>\n<p class=\"hanging-indent\"><sup>1 <\/sup><em><a href=\"https:\/\/education.ec.europa.eu\/news\/ethical-guidelines-on-the-use-of-artificial-intelligence-and-data-in-teaching-and-learning-for-educators\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/education.ec.europa.eu\/news\/ethical-guidelines-on-the-use-of-artificial-intelligence-and-data-in-teaching-and-learning-for-educators\">Ethical guidelines on the use of artificial intelligence and data in teaching and learning for educators<\/a><\/em>, European Commission, Octobre 2022.<\/p>\n<p class=\"hanging-indent\"><sup>2<\/sup> du Boulay, B., Poulovasillis, A., Holmes, W., Mavrikis, M., <em>Artificial Intelligence And Big Data Technologies To Close The Achievement Gap,<\/em>in Luckin, R., ed. Enhancing Learning and Teaching with Technology, London: UCL Institute of Education Press, pp. 256\u2013285, 2018.<\/p>\n<p class=\"hanging-indent\"><sup>3 <\/sup>Hutchinson, B., Smart, A., Hanna, A., Denton, E., Greer, C., Kjartansson, O., Barnes, P., Mitchell, M., <em><a href=\"https:\/\/doi.org\/10.1145\/3442188.3445918\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/doi.org\/10.1145\/3442188.3445918\">Towards Accountability for Machine Learning Datasets: Practices from Software Engineering and Infrastructure<\/a><\/em>, Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, Association for Computing Machinery, New York, 2021.<\/p>\n<p class=\"hanging-indent\"><sup>4 <\/sup>Barocas, S.,\u00a0 Hardt, M., Narayanan, A., <em><a href=\"https:\/\/fairmlbook.org\/\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/fairmlbook.org\/\">Fairness and machine learning Limitations and Opportunities<\/a>, <\/em>2022.<\/p>\n<p class=\"hanging-indent\"><sup>5 <\/sup>Kelleher, J.D, Tierney, B, <em>Data Science<\/em>, MIT Press, London, 2018.<\/p>\n<p class=\"hanging-indent\"><sup>6<\/sup> Schneier, B., Data and Goliath: The Hidden Battles to Capture Your Data and Control Your World, W. W. Norton &amp; Company, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>7<\/sup> Kant, T., <em>Identity, Advertising, and Algorithmic Targeting: Or How (Not) to Target Your \u201cIdeal User.\u201d<\/em>, MIT Case Studies in Social and Ethical Responsibilities of Computing, 2021.<\/p>","rendered":"<div class=\"textbox textbox--exercises\">\n<header class=\"textbox__header\">\n<h3 class=\"textbox__title\" style=\"text-align: left\"><strong>D\u00e9cisions en classe<\/strong><\/h3>\n<\/header>\n<div class=\"textbox__content\">\n<p class=\"no-indent\">En tant qu&rsquo;enseignant, vous avez acc\u00e8s \u00e0 de nombreux types de donn\u00e9es. Soit des donn\u00e9es tangibles comme les feuilles de pr\u00e9sence et de performances, soit des donn\u00e9es intangibles comme les expressions corporelles des \u00e9l\u00e8ves. Pensez \u00e0 certaines des d\u00e9cisions que vous prenez dans votre vie professionnelle : <em>Quelles sont les donn\u00e9es qui vous aident \u00e0 prendre ces d\u00e9cisions ? <\/em>Il existe des applications technologiques qui peuvent vous aider \u00e0 visualiser ou \u00e0 traiter les donn\u00e9es. Les syst\u00e8mes d&rsquo;intelligence artificielle utilisent les donn\u00e9es pour personnaliser l&rsquo;apprentissage, faire des pr\u00e9dictions et prendre des d\u00e9cisions qui pourraient vous aider \u00e0 enseigner et \u00e0 g\u00e9rer votre classe : <em>Avez-vous des besoins auxquels la technologie peut r\u00e9pondre ? Si oui, quelles seront les donn\u00e9es dont un tel syst\u00e8me pourrait avoir besoin pour mener \u00e0 bien sa t\u00e2che ?<\/em><\/p>\n<\/div>\n<\/div>\n<figure id=\"attachment_91\" aria-describedby=\"caption-attachment-91\" style=\"width: 264px\" class=\"wp-caption alignleft\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-90\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1.png\" alt=\"\" width=\"264\" height=\"469\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1.png 1080w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1-169x300.png 169w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1-576x1024.png 576w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1-768x1365.png 768w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1-864x1536.png 864w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1-65x116.png 65w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1-225x400.png 225w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-16.1-350x622.png 350w\" sizes=\"(max-width: 264px) 100vw, 264px\" \/><figcaption id=\"caption-attachment-91\" class=\"wp-caption-text\">R\u00e9f\u00e9rence : Kelleher, J.D, Tierney, B, Data Science, London, 2018 and Kitchin, R, Big Data, new epistemologies and paradigm shifts, Big Data &amp; Society, 2014<\/figcaption><\/figure>\n<p class=\"no-indent\">Les syst\u00e8mes \u00e9ducatifs ont toujours g\u00e9n\u00e9r\u00e9 des donn\u00e9es &#8211; donn\u00e9es personnelles des \u00e9tudiants, dossiers acad\u00e9miques, donn\u00e9es de pr\u00e9sence et plus encore. Avec la num\u00e9risation et les applis AIED, davantage de donn\u00e9es sont enregistr\u00e9es et stock\u00e9es : clics de souris, pages consult\u00e9es, horodatages et frappes au clavier<sup>1<\/sup>. La pens\u00e9e centr\u00e9e sur les donn\u00e9es devenant la norme dans la soci\u00e9t\u00e9, il est naturel de se demander comment croquer toutes ces donn\u00e9es pour faire quelque chose de pertinent : pourrions-nous donner des retours plus personnalis\u00e9s \u00e0 l&rsquo;apprenant ? Pourrions-nous concevoir de meilleurs outils de visualisation et de notification pour l&rsquo;enseignant ?<sup>2<\/sup><\/p>\n<p class=\"indent\">Quelle que soit la technologie utilis\u00e9e, elle doit r\u00e9pondre \u00e0 un besoin r\u00e9el dans la salle de classe. Une fois le besoin identifi\u00e9, nous pouvons examiner les donn\u00e9es disponibles et nous demander ce qui est pertinent pour le r\u00e9sultat souhait\u00e9. Il s&rsquo;agit de d\u00e9couvrir les facteurs qui permettent aux \u00e9ducateurs de prendre des d\u00e9cisions nuanc\u00e9es. Ces facteurs peuvent-ils \u00eatre saisis \u00e0 l&rsquo;aide des donn\u00e9es disponibles ? Les donn\u00e9es et les syst\u00e8mes bas\u00e9s sur les donn\u00e9es sont-ils le meilleur moyen de r\u00e9pondre au besoin ? Quelles pourraient \u00eatre les cons\u00e9quences involontaires de l&rsquo;utilisation des donn\u00e9es de cette fa\u00e7on ?<sup>3<\/sup><\/p>\n<p class=\"indent\">L&rsquo;apprentissage automatique nous permet de renvoyer nombre de ces questions aux donn\u00e9es elles-m\u00eames<sup>4<\/sup>. Les applications du ML sont entra\u00een\u00e9es sur des donn\u00e9es. Elles fonctionnent en exploitant les donn\u00e9es. Elles trouvent des tendances et font des g\u00e9n\u00e9ralisations et les stockent sous forme de mod\u00e8les &#8211; des donn\u00e9es qui peuvent \u00eatre utilis\u00e9es pour r\u00e9pondre \u00e0 des demandes \u00e0 venir<sup>4<\/sup>. Leurs d\u00e9cisions et leurs pr\u00e9dictions, et la fa\u00e7on dont elles influencent l&rsquo;apprentissage des \u00e9l\u00e8ves, sont \u00e9galement des donn\u00e9es. Ainsi, savoir comment les programmeurs, la machine et l&rsquo;utilisateur traitent les donn\u00e9es est une partie importante de la compr\u00e9hension du fonctionnement de l&rsquo;intelligence artificielle.<\/p>\n<h3>A propos des donn\u00e9es<\/h3>\n<p class=\"no-indent\">Les donn\u00e9es sont g\u00e9n\u00e9ralement li\u00e9es \u00e0 une entit\u00e9 du monde r\u00e9el &#8211; une personne, un objet ou un \u00e9v\u00e9nement. Chaque entit\u00e9 peut \u00eatre d\u00e9crite par un certain nombre d&rsquo;<em>attributs<\/em> (<em>caract\u00e9ristiques<\/em> ou <em>variables<\/em>)<sup>5<\/sup>. Par exemple, le nom, l&rsquo;\u00e2ge et la classe sont quelques attributs d&rsquo;un \u00e9tudiant. L&rsquo;ensemble de ces attributs constitue les donn\u00e9es dont nous disposons sur l&rsquo;\u00e9tudiant, qui, bien qu&rsquo;elles ne soient en aucun cas proches de l&rsquo;entit\u00e9 r\u00e9elle, nous renseignent sur lui. Les donn\u00e9es collect\u00e9es, utilis\u00e9es et trait\u00e9es dans le syst\u00e8me \u00e9ducatif sont appel\u00e9es <em>donn\u00e9es \u00e9ducatives<\/em><sup>1<\/sup>.<\/p>\n<p class=\"indent\">Un jeu de donn\u00e9es (<em>dataset<\/em>) peut \u00eatre vu comme une collection d&rsquo;entit\u00e9s organis\u00e9es en lignes et en colonnes. La feuille de pr\u00e9sence d&rsquo;une classe est un ensemble de donn\u00e9es. Chaque ligne est le \u00ab\u00a0la fiche\u00a0\u00bb d&rsquo;un \u00e9tudiant. Les colonnes peuvent \u00eatre leur pr\u00e9sence ou leur absence pendant un jour ou une session particuli\u00e8re. Ainsi, chaque colonne est un attribut.<\/p>\n<p><iframe loading=\"lazy\" id=\"oembed-1\" title=\"Donn\u00e9es : elles se pr\u00e9sentent sous de nombreuses formes et tailles\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/BlQF9s9xtIc?list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<figure id=\"attachment_91\" aria-describedby=\"caption-attachment-91\" style=\"width: 300px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" class=\"size-medium wp-image-91\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2.png\" alt=\"\" width=\"300\" height=\"300\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2.png 1080w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2-300x300.png 300w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2-1024x1024.png 1024w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2-150x150.png 150w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2-768x768.png 768w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2-65x65.png 65w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2-225x225.png 225w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-16.2-350x350.png 350w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><figcaption id=\"caption-attachment-91\" class=\"wp-caption-text\">The DIKW Pyramid. R\u00e9f\u00e9rence: Kelleher, J.D, Tierney, B, Data Science, London, 2018 and Kitchin, R, Big Data, new epistemologies and paradigm shifts, Big Data &amp; Society, 2014<\/figcaption><\/figure>\n<p class=\"no-indent\">Les donn\u00e9es sont cr\u00e9\u00e9es en choisissant des attributs et en les mesurant : chaque donn\u00e9e est le r\u00e9sultat de d\u00e9cisions et de choix humains. Ainsi, la cr\u00e9ation de donn\u00e9es est un processus subjectif, partiel et d\u00e9sordonn\u00e9, sujet \u00e0 des difficult\u00e9s techniques<sup>4,5<\/sup>. De plus, ce que l\u2019on choisit de mesurer et ce que l\u2019on ne mesure pas peut avoir une grande influence sur les r\u00e9sultats attendus.<\/p>\n<p class=\"indent\">Les <em>traces<\/em> sont des enregistrements de l&rsquo;activit\u00e9 des \u00e9l\u00e8ves tels que des clics de souris, des donn\u00e9es sur les pages ouvertes, le moment des interactions ou des appuis sur clavier dans un syst\u00e8me num\u00e9rique<sup>1<\/sup>. Les <em>m\u00e9tadonn\u00e9es<\/em>\u2014c&rsquo;est-\u00e0-dire des donn\u00e9es qui d\u00e9crivent d&rsquo;autres donn\u00e9es<sup>5<\/sup>. Les <em>donn\u00e9es d\u00e9riv\u00e9es<\/em> sont des donn\u00e9es calcul\u00e9es ou d\u00e9duites d&rsquo;autres donn\u00e9es : les notes individuelles de chaque \u00e9l\u00e8ve sont des donn\u00e9es. La moyenne de la classe est une donn\u00e9e d\u00e9riv\u00e9e. Souvent, les donn\u00e9es d\u00e9riv\u00e9es sont plus utiles pour obtenir des perspectives utiles, trouver des mod\u00e8les et faire des pr\u00e9dictions. Les applications d&rsquo;apprentissage automatique peuvent cr\u00e9er des donn\u00e9es d\u00e9riv\u00e9es et les lier \u00e0 des traces de donn\u00e9es et m\u00e9tadonn\u00e9es pour cr\u00e9er des <a href=\"https:\/\/youtu.be\/C3RrfySCnAg?list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma\" target=\"_blank\" rel=\"noopener\">mod\u00e8les d&rsquo;apprentissage<\/a> d\u00e9taill\u00e9s, qui aident \u00e0 personnaliser l&rsquo;apprentissage<sup>1<\/sup>.<\/p>\n<p class=\"indent\">Pour que toute application bas\u00e9e sur des donn\u00e9es soit une r\u00e9ussite, les attributs doivent \u00eatre soigneusement choisis et correctement mesur\u00e9s. Les mod\u00e8les qui y sont d\u00e9couverts doivent \u00eatre v\u00e9rifi\u00e9s pour voir s&rsquo;ils ont du sens dans le contexte \u00e9ducatif. Lorsqu&rsquo;ils sont con\u00e7us et maintenus correctement, les syst\u00e8mes bas\u00e9s sur les donn\u00e9es peuvent \u00eatre tr\u00e8s pr\u00e9cieux.<\/p>\n<p><iframe loading=\"lazy\" id=\"oembed-2\" title=\"Quelques probl\u00e8mes avec les donn\u00e9es\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/CRq2hl5kVQo?list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<div class=\"textbox textbox--sidebar\"><a href=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/more-on-big-data\/\" target=\"_blank\" rel=\"noopener\">V\u00e9rifiez si vous \u00eates au point sur les (Big) Data<\/a><\/div>\n<p class=\"no-indent\">Ce chapitre vise \u00e0 pr\u00e9senter quelques \u00e9l\u00e9ments fondamentaux des donn\u00e9es et de la technologie bas\u00e9e sur les donn\u00e9es, mais la ma\u00eetrise des donn\u00e9es est une comp\u00e9tence tr\u00e8s importante \u00e0 acqu\u00e9rir et m\u00e9rite une formation d\u00e9di\u00e9e et un soutien et des mises \u00e0 jour continus<sup>1<\/sup>.<\/p>\n<h3>La r\u00e9glementation que vous devez conna\u00eetre<\/h3>\n<p class=\"no-indent\">En raison de la baisse radicale des co\u00fbts de stockage des donn\u00e9es, davantage de donn\u00e9es et de m\u00e9tadonn\u00e9es sont sauvegard\u00e9es et conserv\u00e9es plus longtemps<sup>6<\/sup>. Cela peut entra\u00eener des atteintes \u00e0 la vie priv\u00e9e et des infractions aux droits. Des lois comme le <strong>R\u00e8glement g\u00e9n\u00e9ral sur la protection des donn\u00e9es<\/strong> (RGPD) d\u00e9couragent de telles pratiques et donnent aux citoyens de l&rsquo;UE plus de contr\u00f4le sur leurs donn\u00e9es personnelles. Elles donnent des r\u00e8glements de protection des donn\u00e9es juridiquement ex\u00e9cutoires dans tous les \u00c9tats membres de l&rsquo;UE.<\/p>\n<p class=\"indent\">Selon le RGPD, les donn\u00e9es personnelles sont toute information relative \u00e0 une personne identifi\u00e9e ou identifiable (sujet des donn\u00e9es). Les \u00e9coles, en plus de s&rsquo;engager aupr\u00e8s des entreprises qui traitent leurs donn\u00e9es, stockent d&rsquo;\u00e9normes quantit\u00e9s d&rsquo;informations personnelles sur les \u00e9tudiants, les parents, le personnel, la direction et les fournisseurs. En tant que responsables du traitement des donn\u00e9es, elles sont tenues de stocker les donn\u00e9es qu&rsquo;elles traitent de mani\u00e8re confidentielle et s\u00e9curis\u00e9e et de mettre en place des proc\u00e9dures pour la protection et l&rsquo;utilisation appropri\u00e9e de toutes les donn\u00e9es personnelles<sup>1<\/sup>.<\/p>\n<p class=\"indent\">Les droits \u00e9tablis par le RGPD comprennent :<\/p>\n<ul>\n<li>Le <strong>Droit d&rsquo;acc\u00e8s<\/strong> qui les oblige,les citoyens, \u00e0 savoir(facilement) quelles donn\u00e9es sont collect\u00e9es sur eux<\/li>\n<li>Le <strong>Droit d&rsquo;\u00eatre inform\u00e9<\/strong> de l&rsquo;utilisation faite de leurs donn\u00e9es<\/li>\n<li>Le <strong>Droit \u00e0 l&rsquo;effacement<\/strong> qui permet \u00e0 un citoyen dont les donn\u00e9es ont \u00e9t\u00e9 collect\u00e9es par une plateforme de demander que ces donn\u00e9es soient retir\u00e9es du jeu de donn\u00e9es construit par la plateforme (et qui peut \u00eatre vendu \u00e0 d&rsquo;autres personnes)<\/li>\n<li>Le <strong>Droit \u00e0 l&rsquo;explication<\/strong> o\u00f9 une explication doit \u00eatre fournie chaque fois qu&rsquo;ils ont besoin d&rsquo;une clarification sur les processus de d\u00e9cision automatis\u00e9s qui les concernent.<\/li>\n<\/ul>\n<p class=\"indent\">Toutefois, le RGPD permet la collecte de certaines donn\u00e9es au titre de \u201cl&rsquo;int\u00e9r\u00eat l\u00e9gitime\u201d<sup>7<\/sup> et l&rsquo;utilisation de donn\u00e9es d\u00e9riv\u00e9es, agr\u00e9g\u00e9es ou anonymis\u00e9es ind\u00e9finiment et sans consentement<sup>5<\/sup>. La nouvelle l\u00e9gislation sur les services num\u00e9riques (<em>Digital Services Act<\/em>) restreint l&rsquo;utilisation des donn\u00e9es personnelles dans le cadre de la publicit\u00e9 cibl\u00e9e<sup>7<\/sup>. En outre, le bouclier de protection de la vie priv\u00e9e UE-USA renforce les droits de protection des donn\u00e9es des citoyens de l&rsquo;UE dans le contexte o\u00f9 leurs donn\u00e9es ont \u00e9t\u00e9 d\u00e9plac\u00e9es en dehors de l&rsquo;UE<sup>5<\/sup>.<\/p>\n<p>Il est possible de se r\u00e9f\u00e9rer \u00e0 ce <a href=\"https:\/\/www.liberties.eu\/en\/stories\/gdpr-for-dummies\/44076\" target=\"_blank\" rel=\"noopener\">RGPD pour les nuls<\/a> pour l&rsquo;analyse faite par des experts ind\u00e9pendants de l&rsquo;Union des libert\u00e9s civiles pour l&rsquo;Europe (Liberties), une ONG qui prot\u00e8ge les droits de l&rsquo;homme de chacun dans l&rsquo;Union europ\u00e9enne.<\/p>\n<hr \/>\n<p class=\"hanging-indent\"><sup>1 <\/sup><em><a href=\"https:\/\/education.ec.europa.eu\/news\/ethical-guidelines-on-the-use-of-artificial-intelligence-and-data-in-teaching-and-learning-for-educators\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/education.ec.europa.eu\/news\/ethical-guidelines-on-the-use-of-artificial-intelligence-and-data-in-teaching-and-learning-for-educators\">Ethical guidelines on the use of artificial intelligence and data in teaching and learning for educators<\/a><\/em>, European Commission, Octobre 2022.<\/p>\n<p class=\"hanging-indent\"><sup>2<\/sup> du Boulay, B., Poulovasillis, A., Holmes, W., Mavrikis, M., <em>Artificial Intelligence And Big Data Technologies To Close The Achievement Gap,<\/em>in Luckin, R., ed. Enhancing Learning and Teaching with Technology, London: UCL Institute of Education Press, pp. 256\u2013285, 2018.<\/p>\n<p class=\"hanging-indent\"><sup>3 <\/sup>Hutchinson, B., Smart, A., Hanna, A., Denton, E., Greer, C., Kjartansson, O., Barnes, P., Mitchell, M., <em><a href=\"https:\/\/doi.org\/10.1145\/3442188.3445918\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/doi.org\/10.1145\/3442188.3445918\">Towards Accountability for Machine Learning Datasets: Practices from Software Engineering and Infrastructure<\/a><\/em>, Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, Association for Computing Machinery, New York, 2021.<\/p>\n<p class=\"hanging-indent\"><sup>4 <\/sup>Barocas, S.,\u00a0 Hardt, M., Narayanan, A., <em><a href=\"https:\/\/fairmlbook.org\/\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"https:\/\/fairmlbook.org\/\">Fairness and machine learning Limitations and Opportunities<\/a>, <\/em>2022.<\/p>\n<p class=\"hanging-indent\"><sup>5 <\/sup>Kelleher, J.D, Tierney, B, <em>Data Science<\/em>, MIT Press, London, 2018.<\/p>\n<p class=\"hanging-indent\"><sup>6<\/sup> Schneier, B., Data and Goliath: The Hidden Battles to Capture Your Data and Control Your World, W. W. Norton &amp; Company, 2015.<\/p>\n<p class=\"hanging-indent\"><sup>7<\/sup> Kant, T., <em>Identity, Advertising, and Algorithmic Targeting: Or How (Not) to Target Your \u201cIdeal User.\u201d<\/em>, MIT Case Studies in Social and Ethical Responsibilities of Computing, 2021.<\/p>\n","protected":false},"author":1,"menu_order":3,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":82,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/92"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/92\/revisions"}],"predecessor-version":[{"id":93,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/92\/revisions\/93"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/parts\/82"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/92\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/media?parent=92"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapter-type?post=92"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/contributor?post=92"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/license?post=92"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}