{"id":60,"date":"2023-11-30T16:29:21","date_gmt":"2023-11-30T16:29:21","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/ai-speak-machine-learning\/"},"modified":"2024-01-31T11:50:16","modified_gmt":"2024-01-31T11:50:16","slug":"ai-speak-machine-learning","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/ai-speak-machine-learning\/","title":{"raw":"Parlons IA : Apprentissage automatique","rendered":"Parlons IA : Apprentissage automatique"},"content":{"raw":"<p class=\"no-indent\">Un <strong>algorithme<\/strong> est une s\u00e9quence fixe d'instructions pour l'ex\u00e9cution d'une t\u00e2che. Il d\u00e9compose la t\u00e2che en \u00e9tapes simples et sans ambigu\u00eft\u00e9 : comme une recette bien \u00e9crite.<\/p>\n<p class=\"indent\">Les langages de programmation sont des langages qu'un ordinateur peut suivre et ex\u00e9cuter. Ils servent de pont entre ce que nous pouvons comprendre et ce qu'une machine peut - en d\u00e9finitive, des interrupteurs qui s'allument et s'\u00e9teignent. Pour un ordinateur, les images, les vid\u00e9os, les instructions sont toutes des 1 (interrupteur allum\u00e9) et des 0 (interrupteur \u00e9teint).<\/p>\n<p class=\"indent\">Une fois \u00e9crit dans un langage de programmation, un algorithme devient un <strong>programme<\/strong>. Les <strong>applications<\/strong> sont des programmes \u00e9crits pour un usager.<\/p>\n<p class=\"indent\">Les programmes classiques prennent des donn\u00e9es et suivent les instructions pour g\u00e9n\u00e9rer une sortie. De nombreux premiers programmes d'IA \u00e9taient des programmes classiques. Comme les instructions ne peuvent pas s'adapter aux donn\u00e9es, ces programmes n'\u00e9taient pas tr\u00e8s performants pour certaines t\u00e2ches comme la pr\u00e9diction sur la base d'informations incompl\u00e8tes et le <strong>traitement automatique de la langue naturelle<\/strong> (<strong>TALN<\/strong>).<\/p>\n<p class=\"indent\"><img class=\" wp-image-55 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1.png\" alt=\"\" width=\"458\" height=\"258\">Un moteur de recherche est aliment\u00e9 \u00e0 la fois par des algorithmes classiques et des algorithmes d'<strong>apprentissage automatique.<\/strong> Contrairement aux logiciels classiques, les algorithmes ML analysent les donn\u00e9es afin de d\u00e9couvrir des tendances et utilisent ces tendances ou r\u00e8gles pour prendre des d\u00e9cisions ou faire des pr\u00e9dictions. C'est-\u00e0-dire qu'en se basant sur des donn\u00e9es - de bons et de mauvais exemplaires, ils trouvent leur propre recette.<\/p>\n<p class=\"indent\">De tels algorithmes sont bien adapt\u00e9s aux situations tr\u00e8s complexes et aux donn\u00e9es manquantes. Ils peuvent \u00e9galement surveiller leurs performances et utiliser ce retour pour s'am\u00e9liorer \u00e0 l'usage.<\/p>\n<p class=\"indent\">Ce n'est pas tr\u00e8s \u00e9loign\u00e9 de ce que font les \u00eatres humains, notamment les b\u00e9b\u00e9s qui d\u00e9veloppent des comp\u00e9tences en dehors du syst\u00e8me \u00e9ducatif conventionnel. Les b\u00e9b\u00e9s observent, r\u00e9p\u00e8tent, apprennent, mettent en pratique leurs connaissances et s'am\u00e9liorent. Si n\u00e9cessaire, ils improvisent.<\/p>\n<p class=\"indent\">Mais la similarit\u00e9 entre les machines et les humains est tr\u00e8s peu profonde. \"Apprendre\" d'un point de vue humain est bien diff\u00e9rent, et bien plus nuanc\u00e9 et compliqu\u00e9 que \"l'apprentissage\" pour la machine.<\/p>\nhttps:\/\/www.youtube.com\/watch?v=MsE5ogbfWrE&amp;list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma&amp;index=4&amp;pp=iAQB\n<h3 style=\"text-align: left\">Un probl\u00e8me de classement<\/h3>\n<p class=\"no-indent\">Une des t\u00e2ches courantes d'une application ML est le classement - Est-ce la photo d'un chien ou d'un chat ? Cet \u00e9tudiant a-t-il des difficult\u00e9s ou a-t-il r\u00e9ussi son examen ? Il y a deux ou plusieurs groupes. Et l'application doit classer les nouvelles donn\u00e9es dans l'un de ces groupes.<\/p>\n\n\n[caption id=\"attachment_59\" align=\"alignright\" width=\"430\"]<img class=\"wp-image-166\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card1.jpg\" alt=\"\" width=\"430\" height=\"242\"> \"Playing Card\" par aquarianinsight.com\/free-readings\/ est sous licence CC BY-SA 2.0. Pour une copie de la licence, visitez <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a>.[\/caption]\n<p class=\"indent\">Prenons l'exemple des cartes \u00e0 jouer divis\u00e9es en deux piles - Groupe A et Groupe B, suivant un certain mod\u00e8le. Nous devons classer une nouvelle carte, l'as de carreau, dans le groupe A ou le groupe B.<\/p>\n<p class=\"indent\">Tout d'abord, nous devons comprendre comment les groupes sont r\u00e9partis - nous avons besoin des exemples. Tirons quatre cartes du groupe A et quatre du groupe B. Ces huit exemples constituent notre <strong>ensemble d'apprentissage<\/strong> - des donn\u00e9es qui nous aident \u00e0 percevoir le sch\u00e9ma - ce qui nous \"apprend\" \u00e0 constater le r\u00e9sultat.<\/p>\n<p class=\"indent\">D\u00e8s qu'on nous montre la r\u00e9partition \u00e0 droite, la plupart d'entre nous devinent que l'As de carreau appartient au groupe B. Nous n'avons pas besoin d'instructions, le cerveau humain est une merveille de d\u00e9tection de mod\u00e8les. Comment une machine ferait-elle cela ?<\/p>\n<p class=\"indent\">Les algorithmes d'apprentissage automatique reposent sur de puissantes th\u00e9ories statistiques. Les diff\u00e9rents algorithmes sont bas\u00e9s sur diff\u00e9rentes \u00e9quations math\u00e9matiques qui doivent \u00eatre choisies avec soin pour s'adapter \u00e0 la t\u00e2che \u00e0 effectuer. C'est le travail du programmeur de choisir les donn\u00e9es, d'analyser quelles caract\u00e9ristiques des donn\u00e9es sont pertinentes pour le probl\u00e8me particulier et de choisir l'algorithme appropri\u00e9.<\/p>\n\n<h3 style=\"text-align: left\">L'importance des donn\u00e9es<\/h3>\n[caption id=\"attachment_59\" align=\"alignright\" width=\"442\"]<img class=\"wp-image-57 \" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2.jpg\" alt=\"\" width=\"442\" height=\"249\"> \"Playing Card\" par aquarianinsight.com\/free-readings\/ est sous licence CC BY-SA 2.0. Pour voir une copie de cette licence, visitez <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse.\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse.<\/a>[\/caption]\n<p class=\"no-indent\">Le tirage de la carte ci-dessus aurait pu \u00e9chouer de plusieurs fa\u00e7ons. Veuillez vous r\u00e9f\u00e9rer \u00e0 l'image. 1 a trop peu de cartes, aucune d\u00e9duction ne serait possible. 2 a plus de cartes mais toutes de la m\u00eame famille - aucun moyen de savoir o\u00f9 irait le carreau. Si les groupes n'\u00e9taient pas de la m\u00eame taille, 3 pourrait tr\u00e8s bien signifier que les cartes de chiffres sont dans le groupe A et les cartes d'image dans le groupe B.<\/p>\n<p class=\"indent\">En g\u00e9n\u00e9ral, les t\u00e2ches d'apprentissage automatique sont plus ouvertes et impliquent des ensembles de donn\u00e9es bien plus importants qu'un jeu de cartes. Les ensembles d'apprentissage doivent \u00eatre choisis \u00e0 l'aide de l'analyse statistique, sinon des erreurs apparaissent. Une meilleure s\u00e9lection des donn\u00e9es est cruciale pour une bonne application d'apprentissage automatique, plus que pour d'autres types de logiciels. L'apprentissage automatique a besoin d'un grand nombre de donn\u00e9es pertinentes. Au minimum absolu, un mod\u00e8le d'apprentissage automatique de base devrait contenir dix fois plus de points de donn\u00e9es que le nombre total de traits<sup>1<\/sup>. Cependant, l'apprentissage automatique est aussi particuli\u00e8rement bien \u00e9quip\u00e9 pour traiter des donn\u00e9es bruyantes, d\u00e9sordonn\u00e9es et contradictoires.<\/p>\n\n<h3 style=\"text-align: left\">Extraction de traits<\/h3>\n<p class=\"no-indent\">Lorsque vous avez vu les exemples du groupe A et du groupe B ci-dessus, la premi\u00e8re chose que vous avez peut-\u00eatre remarqu\u00e9e est la couleur des cartes. Puis le num\u00e9ro ou la lettre et la couleur. Pour un algorithme, toutes ces caract\u00e9ristiques doivent \u00eatre saisies explicitement. Il ne peut pas savoir automatiquement ce qui est important pour le r\u00e9sultat du probl\u00e8me.<\/p>\n<img class=\"aligncenter wp-image-58 \" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-9.2.png\" alt=\"\" width=\"452\" height=\"276\">\n<p class=\"no-indent\">En choisissant les traits d'int\u00e9r\u00eat, les programmeurs doivent se poser de nombreuses questions. <em>Combien de traits sont trop peu nombreux pour \u00eatre utiles ? Combien de traits sont trop nombreux ? Quelles caract\u00e9ristiques sont pertinentes pour la t\u00e2che ? Quelle est la relation entre les \u00e9l\u00e9ments choisis - un aspect d\u00e9pend-il d'un autre ? Avec les traits choisis, est-il possible que la sortie soit pr\u00e9cise ?\n<\/em><\/p>\nhttps:\/\/www.youtube.com\/watch?v=7SX1ZUu_Svk&amp;list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma&amp;index=5&amp;pp=iAQB\n<h3 style=\"text-align: left\">Le Processus<\/h3>\n<div class=\"textbox textbox--sidebar textbox--examples\"><header class=\"textbox__header\">\n<h4>Les donn\u00e9es doivent-elles toujours \u00eatre \u00e9tiquet\u00e9es ?<\/h4>\n<\/header>\n<div class=\"textbox__content\" style=\"text-align: center\">D\u00e9couvrez l'apprentissage supervis\u00e9 et non supervis\u00e9 <a href=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/does-data-always-have-to-be-labeled\/\" target=\"_blank\" rel=\"noopener\">en cliquant ici<\/a>.<\/div>\n<\/div>\n<p class=\"no-indent\">Lorsque le programmeur cr\u00e9e l'application - il prend des donn\u00e9es, en extrait des traits, choisit un algorithme d'apprentissage automatique pertinent (fonction math\u00e9matique qui d\u00e9finit le processus), et l'entra\u00eene en utilisant des donn\u00e9es \u00e9tiquet\u00e9es (dans le cas o\u00f9 la sortie est connue - comme le groupe A ou le groupe B) afin que la machine <em>comprenne <\/em>le mod\u00e8le qui se cache derri\u00e8re le r\u00e9sultat.<\/p>\n<p class=\"indent\">Pour une machine <em>la compr\u00e9hension <\/em>prend la forme d'un ensemble de chiffres - les poids - qu'elle attribue \u00e0 chaque trait. Avec la bonne attribution des poids, elle peut calculer la probabilit\u00e9 qu'une nouvelle carte se trouve dans le groupe A ou le groupe B. G\u00e9n\u00e9ralement, pendant la phase d'apprentissage, le programmeur aide la machine en modifiant manuellement certaines valeurs - c'est ce qu'on appelle le<strong> tuning<\/strong> ou <strong>r\u00e9glage <\/strong>de l'application.<a class=\"inline wrap\" href=\"https:\/\/www.ai4t.eu\/book\/ai-for-teachers-an-open-textbook\/media\/Black%20White%20Fashion%20Boutique%20Simple%20Open%20Closed%20Sign%20Poster%20Landscape.jpg\" name=\"scalar-inline-media\" data-align=\"left\" data-annotations=\"\" data-size=\"medium\" data-caption=\"none\" data-cke-saved-name=\"scalar-inline-media\" data-cke-saved-href=\"https:\/\/www.ai4t.eu\/book\/ai-for-teachers-an-open-textbook\/media\/Black%20White%20Fashion%20Boutique%20Simple%20Open%20Closed%20Sign%20Poster%20Landscape.jpg\"><\/a><\/p>\n<p class=\"indent\">Une fois cela fait, le logiciel doit \u00eatre test\u00e9 avant d'\u00eatre mis en service. Pour cela, les donn\u00e9es \u00e9tiquet\u00e9es qui n'ont pas \u00e9t\u00e9 utilis\u00e9es pour l'apprentissage seront fournies. C'est ce qu'on appelle les <strong>donn\u00e9es de test<\/strong>. La performance de la machine \u00e0 pr\u00e9dire la sortie sera alors \u00e9valu\u00e9e. Une fois qu'il est satisfaisant, le logiciel peut \u00eatre mis en service : il est pr\u00eat \u00e0 prendre de nouvelles donn\u00e9es et \u00e0 en tirer une d\u00e9cision ou une pr\u00e9diction.<\/p>\n<a class=\"inline\" href=\"https:\/\/ai4t.eu\/book\/ai-for-teachers-an-open-textbook\/media\/Black%20White%20Minimalist%20Elegant%20Business%20Thank%20You%20Card%20(1).jpg\" name=\"scalar-inline-media\" data-align=\"center\" data-annotations=\"\" data-size=\"medium\" data-caption=\"none\" data-cke-saved-name=\"scalar-inline-media\" data-cke-saved-href=\"https:\/\/ai4t.eu\/book\/ai-for-teachers-an-open-textbook\/media\/Black%20White%20Minimalist%20Elegant%20Business%20Thank%20You%20Card%20(1).jpg\"><\/a><img class=\"aligncenter wp-image-59 \" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-9.4.png\" alt=\"\" width=\"469\" height=\"223\">\n<p class=\"no-indent\">Un mod\u00e8le peut-il fonctionner diff\u00e9remment sur les ensembles de donn\u00e9es d'apprentissage et de test ? Comment le nombre de caract\u00e9ristiques affecte-t-il les performances dans les deux cas ? <a href=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/how-many-features-are-too-many\/\" target=\"_blank\" rel=\"noopener\">Regardez cette vid\u00e9o pour le savoir.<\/a><\/p>\n<p class=\"indent\">La performance en temps r\u00e9el est ensuite surveill\u00e9e et am\u00e9lior\u00e9e en permanence (les poids des traits sont ajust\u00e9s pour obtenir de meilleurs r\u00e9sultats). Souvent, les performances en temps r\u00e9el donnent des r\u00e9sultats diff\u00e9rents de ceux obtenus lorsque l'apprentissage automatique est test\u00e9 avec des donn\u00e9es d\u00e9j\u00e0 disponibles. \u00c9tant donn\u00e9 que l'exp\u00e9rimentation avec de vrais utilisateurs est co\u00fbteuse, exige un effort important et est souvent risqu\u00e9e, les algorithmes sont toujours test\u00e9s \u00e0 l'aide de donn\u00e9es utilisateurs historiques, qui ne permettent pas toujours d'\u00e9valuer l'impact sur le comportement des utilisateurs<sup>1<\/sup>. C'est pourquoi il est primordial une \u00e9valuation compl\u00e8te des outils d'apprentissage automatique une fois utilis\u00e9s :<\/p>\nhttps:\/\/www.youtube.com\/watch?v=hopnc4Y7ljY&amp;list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma&amp;index=7&amp;pp=iAQB\n<p class=\"no-indent\">Envie de mettre la main \u00e0 la p\u00e2te sur l'apprentissage automatique ? <a href=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/hands-on-machine-learning\/\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"hands-on-machine-learning\">Essayez cette activit\u00e9.<\/a><\/p>\n\n\n<hr>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>1 <\/sup>Theobald, O. <em>Machine Learning For Absolute Beginners: A Plain English Introduction<\/em> (Second Edition) (Machine Learning From Scratch Book 1) (p. 24). Scatterplot Press. Kindle Edition.<\/p>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>2\u00a0<\/sup>Konstan, J., Terveen, L., <em>Human-centered recommender systems: Origins, advances, challenges, and opportunities<\/em>, AI Magazine, 42(3), 31-42, 2021.<\/p>","rendered":"<p class=\"no-indent\">Un <strong>algorithme<\/strong> est une s\u00e9quence fixe d&rsquo;instructions pour l&rsquo;ex\u00e9cution d&rsquo;une t\u00e2che. Il d\u00e9compose la t\u00e2che en \u00e9tapes simples et sans ambigu\u00eft\u00e9 : comme une recette bien \u00e9crite.<\/p>\n<p class=\"indent\">Les langages de programmation sont des langages qu&rsquo;un ordinateur peut suivre et ex\u00e9cuter. Ils servent de pont entre ce que nous pouvons comprendre et ce qu&rsquo;une machine peut &#8211; en d\u00e9finitive, des interrupteurs qui s&rsquo;allument et s&rsquo;\u00e9teignent. Pour un ordinateur, les images, les vid\u00e9os, les instructions sont toutes des 1 (interrupteur allum\u00e9) et des 0 (interrupteur \u00e9teint).<\/p>\n<p class=\"indent\">Une fois \u00e9crit dans un langage de programmation, un algorithme devient un <strong>programme<\/strong>. Les <strong>applications<\/strong> sont des programmes \u00e9crits pour un usager.<\/p>\n<p class=\"indent\">Les programmes classiques prennent des donn\u00e9es et suivent les instructions pour g\u00e9n\u00e9rer une sortie. De nombreux premiers programmes d&rsquo;IA \u00e9taient des programmes classiques. Comme les instructions ne peuvent pas s&rsquo;adapter aux donn\u00e9es, ces programmes n&rsquo;\u00e9taient pas tr\u00e8s performants pour certaines t\u00e2ches comme la pr\u00e9diction sur la base d&rsquo;informations incompl\u00e8tes et le <strong>traitement automatique de la langue naturelle<\/strong> (<strong>TALN<\/strong>).<\/p>\n<p class=\"indent\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-55 alignleft\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1.png\" alt=\"\" width=\"458\" height=\"258\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1.png 1920w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1-300x169.png 300w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1-1024x576.png 1024w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1-768x432.png 768w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1-1536x864.png 1536w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1-65x37.png 65w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1-225x127.png 225w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2023\/11\/FR-9.1-350x197.png 350w\" sizes=\"(max-width: 458px) 100vw, 458px\" \/>Un moteur de recherche est aliment\u00e9 \u00e0 la fois par des algorithmes classiques et des algorithmes d&rsquo;<strong>apprentissage automatique.<\/strong> Contrairement aux logiciels classiques, les algorithmes ML analysent les donn\u00e9es afin de d\u00e9couvrir des tendances et utilisent ces tendances ou r\u00e8gles pour prendre des d\u00e9cisions ou faire des pr\u00e9dictions. C&rsquo;est-\u00e0-dire qu&rsquo;en se basant sur des donn\u00e9es &#8211; de bons et de mauvais exemplaires, ils trouvent leur propre recette.<\/p>\n<p class=\"indent\">De tels algorithmes sont bien adapt\u00e9s aux situations tr\u00e8s complexes et aux donn\u00e9es manquantes. Ils peuvent \u00e9galement surveiller leurs performances et utiliser ce retour pour s&rsquo;am\u00e9liorer \u00e0 l&rsquo;usage.<\/p>\n<p class=\"indent\">Ce n&rsquo;est pas tr\u00e8s \u00e9loign\u00e9 de ce que font les \u00eatres humains, notamment les b\u00e9b\u00e9s qui d\u00e9veloppent des comp\u00e9tences en dehors du syst\u00e8me \u00e9ducatif conventionnel. Les b\u00e9b\u00e9s observent, r\u00e9p\u00e8tent, apprennent, mettent en pratique leurs connaissances et s&rsquo;am\u00e9liorent. Si n\u00e9cessaire, ils improvisent.<\/p>\n<p class=\"indent\">Mais la similarit\u00e9 entre les machines et les humains est tr\u00e8s peu profonde. \u00ab\u00a0Apprendre\u00a0\u00bb d&rsquo;un point de vue humain est bien diff\u00e9rent, et bien plus nuanc\u00e9 et compliqu\u00e9 que \u00ab\u00a0l&rsquo;apprentissage\u00a0\u00bb pour la machine.<\/p>\n<p><iframe loading=\"lazy\" id=\"oembed-1\" title=\"Apprentissage automatique\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/MsE5ogbfWrE?list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h3 style=\"text-align: left\">Un probl\u00e8me de classement<\/h3>\n<p class=\"no-indent\">Une des t\u00e2ches courantes d&rsquo;une application ML est le classement &#8211; Est-ce la photo d&rsquo;un chien ou d&rsquo;un chat ? Cet \u00e9tudiant a-t-il des difficult\u00e9s ou a-t-il r\u00e9ussi son examen ? Il y a deux ou plusieurs groupes. Et l&rsquo;application doit classer les nouvelles donn\u00e9es dans l&rsquo;un de ces groupes.<\/p>\n<figure id=\"attachment_59\" aria-describedby=\"caption-attachment-59\" style=\"width: 430px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-166\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card1.jpg\" alt=\"\" width=\"430\" height=\"242\" \/><figcaption id=\"caption-attachment-59\" class=\"wp-caption-text\">\u00ab\u00a0Playing Card\u00a0\u00bb par aquarianinsight.com\/free-readings\/ est sous licence CC BY-SA 2.0. Pour une copie de la licence, visitez <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse<\/a>.<\/figcaption><\/figure>\n<p class=\"indent\">Prenons l&rsquo;exemple des cartes \u00e0 jouer divis\u00e9es en deux piles &#8211; Groupe A et Groupe B, suivant un certain mod\u00e8le. Nous devons classer une nouvelle carte, l&rsquo;as de carreau, dans le groupe A ou le groupe B.<\/p>\n<p class=\"indent\">Tout d&rsquo;abord, nous devons comprendre comment les groupes sont r\u00e9partis &#8211; nous avons besoin des exemples. Tirons quatre cartes du groupe A et quatre du groupe B. Ces huit exemples constituent notre <strong>ensemble d&rsquo;apprentissage<\/strong> &#8211; des donn\u00e9es qui nous aident \u00e0 percevoir le sch\u00e9ma &#8211; ce qui nous \u00ab\u00a0apprend\u00a0\u00bb \u00e0 constater le r\u00e9sultat.<\/p>\n<p class=\"indent\">D\u00e8s qu&rsquo;on nous montre la r\u00e9partition \u00e0 droite, la plupart d&rsquo;entre nous devinent que l&rsquo;As de carreau appartient au groupe B. Nous n&rsquo;avons pas besoin d&rsquo;instructions, le cerveau humain est une merveille de d\u00e9tection de mod\u00e8les. Comment une machine ferait-elle cela ?<\/p>\n<p class=\"indent\">Les algorithmes d&rsquo;apprentissage automatique reposent sur de puissantes th\u00e9ories statistiques. Les diff\u00e9rents algorithmes sont bas\u00e9s sur diff\u00e9rentes \u00e9quations math\u00e9matiques qui doivent \u00eatre choisies avec soin pour s&rsquo;adapter \u00e0 la t\u00e2che \u00e0 effectuer. C&rsquo;est le travail du programmeur de choisir les donn\u00e9es, d&rsquo;analyser quelles caract\u00e9ristiques des donn\u00e9es sont pertinentes pour le probl\u00e8me particulier et de choisir l&rsquo;algorithme appropri\u00e9.<\/p>\n<h3 style=\"text-align: left\">L&rsquo;importance des donn\u00e9es<\/h3>\n<figure id=\"attachment_59\" aria-describedby=\"caption-attachment-59\" style=\"width: 442px\" class=\"wp-caption alignright\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-57\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2.jpg\" alt=\"\" width=\"442\" height=\"249\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2.jpg 1920w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2-300x169.jpg 300w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2-1024x576.jpg 1024w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2-768x432.jpg 768w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2-1536x864.jpg 1536w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2-65x37.jpg 65w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2-225x127.jpg 225w, https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-content\/uploads\/sites\/15\/2024\/01\/ch2-page-3-card2-2-350x197.jpg 350w\" sizes=\"(max-width: 442px) 100vw, 442px\" \/><figcaption id=\"caption-attachment-59\" class=\"wp-caption-text\">\u00ab\u00a0Playing Card\u00a0\u00bb par aquarianinsight.com\/free-readings\/ est sous licence CC BY-SA 2.0. Pour voir une copie de cette licence, visitez <a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse.\">https:\/\/creativecommons.org\/licenses\/by-sa\/2.0\/?ref=openverse.<\/a><\/figcaption><\/figure>\n<p class=\"no-indent\">Le tirage de la carte ci-dessus aurait pu \u00e9chouer de plusieurs fa\u00e7ons. Veuillez vous r\u00e9f\u00e9rer \u00e0 l&rsquo;image. 1 a trop peu de cartes, aucune d\u00e9duction ne serait possible. 2 a plus de cartes mais toutes de la m\u00eame famille &#8211; aucun moyen de savoir o\u00f9 irait le carreau. Si les groupes n&rsquo;\u00e9taient pas de la m\u00eame taille, 3 pourrait tr\u00e8s bien signifier que les cartes de chiffres sont dans le groupe A et les cartes d&rsquo;image dans le groupe B.<\/p>\n<p class=\"indent\">En g\u00e9n\u00e9ral, les t\u00e2ches d&rsquo;apprentissage automatique sont plus ouvertes et impliquent des ensembles de donn\u00e9es bien plus importants qu&rsquo;un jeu de cartes. Les ensembles d&rsquo;apprentissage doivent \u00eatre choisis \u00e0 l&rsquo;aide de l&rsquo;analyse statistique, sinon des erreurs apparaissent. Une meilleure s\u00e9lection des donn\u00e9es est cruciale pour une bonne application d&rsquo;apprentissage automatique, plus que pour d&rsquo;autres types de logiciels. L&rsquo;apprentissage automatique a besoin d&rsquo;un grand nombre de donn\u00e9es pertinentes. Au minimum absolu, un mod\u00e8le d&rsquo;apprentissage automatique de base devrait contenir dix fois plus de points de donn\u00e9es que le nombre total de traits<sup>1<\/sup>. Cependant, l&rsquo;apprentissage automatique est aussi particuli\u00e8rement bien \u00e9quip\u00e9 pour traiter des donn\u00e9es bruyantes, d\u00e9sordonn\u00e9es et contradictoires.<\/p>\n<h3 style=\"text-align: left\">Extraction de traits<\/h3>\n<p class=\"no-indent\">Lorsque vous avez vu les exemples du groupe A et du groupe B ci-dessus, la premi\u00e8re chose que vous avez peut-\u00eatre remarqu\u00e9e est la couleur des cartes. Puis le num\u00e9ro ou la lettre et la couleur. Pour un algorithme, toutes ces caract\u00e9ristiques doivent \u00eatre saisies explicitement. Il ne peut pas savoir automatiquement ce qui est important pour le r\u00e9sultat du probl\u00e8me.<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-58\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-9.2.png\" alt=\"\" width=\"452\" height=\"276\" \/><\/p>\n<p class=\"no-indent\">En choisissant les traits d&rsquo;int\u00e9r\u00eat, les programmeurs doivent se poser de nombreuses questions. <em>Combien de traits sont trop peu nombreux pour \u00eatre utiles ? Combien de traits sont trop nombreux ? Quelles caract\u00e9ristiques sont pertinentes pour la t\u00e2che ? Quelle est la relation entre les \u00e9l\u00e9ments choisis &#8211; un aspect d\u00e9pend-il d&rsquo;un autre ? Avec les traits choisis, est-il possible que la sortie soit pr\u00e9cise ?<br \/>\n<\/em><\/p>\n<p><iframe loading=\"lazy\" id=\"oembed-2\" title=\"Quel est le r\u00f4le des caract\u00e9ristiques ?\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/7SX1ZUu_Svk?list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<h3 style=\"text-align: left\">Le Processus<\/h3>\n<div class=\"textbox textbox--sidebar textbox--examples\">\n<header class=\"textbox__header\">\n<h4>Les donn\u00e9es doivent-elles toujours \u00eatre \u00e9tiquet\u00e9es ?<\/h4>\n<\/header>\n<div class=\"textbox__content\" style=\"text-align: center\">D\u00e9couvrez l&rsquo;apprentissage supervis\u00e9 et non supervis\u00e9 <a href=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/does-data-always-have-to-be-labeled\/\" target=\"_blank\" rel=\"noopener\">en cliquant ici<\/a>.<\/div>\n<\/div>\n<p class=\"no-indent\">Lorsque le programmeur cr\u00e9e l&rsquo;application &#8211; il prend des donn\u00e9es, en extrait des traits, choisit un algorithme d&rsquo;apprentissage automatique pertinent (fonction math\u00e9matique qui d\u00e9finit le processus), et l&rsquo;entra\u00eene en utilisant des donn\u00e9es \u00e9tiquet\u00e9es (dans le cas o\u00f9 la sortie est connue &#8211; comme le groupe A ou le groupe B) afin que la machine <em>comprenne <\/em>le mod\u00e8le qui se cache derri\u00e8re le r\u00e9sultat.<\/p>\n<p class=\"indent\">Pour une machine <em>la compr\u00e9hension <\/em>prend la forme d&rsquo;un ensemble de chiffres &#8211; les poids &#8211; qu&rsquo;elle attribue \u00e0 chaque trait. Avec la bonne attribution des poids, elle peut calculer la probabilit\u00e9 qu&rsquo;une nouvelle carte se trouve dans le groupe A ou le groupe B. G\u00e9n\u00e9ralement, pendant la phase d&rsquo;apprentissage, le programmeur aide la machine en modifiant manuellement certaines valeurs &#8211; c&rsquo;est ce qu&rsquo;on appelle le<strong> tuning<\/strong> ou <strong>r\u00e9glage <\/strong>de l&rsquo;application.<a class=\"inline wrap\" href=\"https:\/\/www.ai4t.eu\/book\/ai-for-teachers-an-open-textbook\/media\/Black%20White%20Fashion%20Boutique%20Simple%20Open%20Closed%20Sign%20Poster%20Landscape.jpg\" name=\"scalar-inline-media\" data-align=\"left\" data-annotations=\"\" data-size=\"medium\" data-caption=\"none\" data-cke-saved-name=\"scalar-inline-media\" data-cke-saved-href=\"https:\/\/www.ai4t.eu\/book\/ai-for-teachers-an-open-textbook\/media\/Black%20White%20Fashion%20Boutique%20Simple%20Open%20Closed%20Sign%20Poster%20Landscape.jpg\"><\/a><\/p>\n<p class=\"indent\">Une fois cela fait, le logiciel doit \u00eatre test\u00e9 avant d&rsquo;\u00eatre mis en service. Pour cela, les donn\u00e9es \u00e9tiquet\u00e9es qui n&rsquo;ont pas \u00e9t\u00e9 utilis\u00e9es pour l&rsquo;apprentissage seront fournies. C&rsquo;est ce qu&rsquo;on appelle les <strong>donn\u00e9es de test<\/strong>. La performance de la machine \u00e0 pr\u00e9dire la sortie sera alors \u00e9valu\u00e9e. Une fois qu&rsquo;il est satisfaisant, le logiciel peut \u00eatre mis en service : il est pr\u00eat \u00e0 prendre de nouvelles donn\u00e9es et \u00e0 en tirer une d\u00e9cision ou une pr\u00e9diction.<\/p>\n<p><a class=\"inline\" href=\"https:\/\/ai4t.eu\/book\/ai-for-teachers-an-open-textbook\/media\/Black%20White%20Minimalist%20Elegant%20Business%20Thank%20You%20Card%20(1).jpg\" name=\"scalar-inline-media\" data-align=\"center\" data-annotations=\"\" data-size=\"medium\" data-caption=\"none\" data-cke-saved-name=\"scalar-inline-media\" data-cke-saved-href=\"https:\/\/ai4t.eu\/book\/ai-for-teachers-an-open-textbook\/media\/Black%20White%20Minimalist%20Elegant%20Business%20Thank%20You%20Card%20(1).jpg\"><\/a><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-59\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/15\/2024\/01\/FR-9.4.png\" alt=\"\" width=\"469\" height=\"223\" \/><\/p>\n<p class=\"no-indent\">Un mod\u00e8le peut-il fonctionner diff\u00e9remment sur les ensembles de donn\u00e9es d&rsquo;apprentissage et de test ? Comment le nombre de caract\u00e9ristiques affecte-t-il les performances dans les deux cas ? <a href=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/how-many-features-are-too-many\/\" target=\"_blank\" rel=\"noopener\">Regardez cette vid\u00e9o pour le savoir.<\/a><\/p>\n<p class=\"indent\">La performance en temps r\u00e9el est ensuite surveill\u00e9e et am\u00e9lior\u00e9e en permanence (les poids des traits sont ajust\u00e9s pour obtenir de meilleurs r\u00e9sultats). Souvent, les performances en temps r\u00e9el donnent des r\u00e9sultats diff\u00e9rents de ceux obtenus lorsque l&rsquo;apprentissage automatique est test\u00e9 avec des donn\u00e9es d\u00e9j\u00e0 disponibles. \u00c9tant donn\u00e9 que l&rsquo;exp\u00e9rimentation avec de vrais utilisateurs est co\u00fbteuse, exige un effort important et est souvent risqu\u00e9e, les algorithmes sont toujours test\u00e9s \u00e0 l&rsquo;aide de donn\u00e9es utilisateurs historiques, qui ne permettent pas toujours d&rsquo;\u00e9valuer l&rsquo;impact sur le comportement des utilisateurs<sup>1<\/sup>. C&rsquo;est pourquoi il est primordial une \u00e9valuation compl\u00e8te des outils d&rsquo;apprentissage automatique une fois utilis\u00e9s :<\/p>\n<p><iframe loading=\"lazy\" id=\"oembed-3\" title=\"L\u2019\u00e9valuation\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/hopnc4Y7ljY?list=PLkm8ZqYSzE3fQBx8zGr4oONlMSO-Cevma\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<p class=\"no-indent\">Envie de mettre la main \u00e0 la p\u00e2te sur l&rsquo;apprentissage automatique ? <a href=\"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/chapter\/hands-on-machine-learning\/\" target=\"_blank\" rel=\"noopener\" data-cke-saved-href=\"hands-on-machine-learning\">Essayez cette activit\u00e9.<\/a><\/p>\n<hr \/>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>1 <\/sup>Theobald, O. <em>Machine Learning For Absolute Beginners: A Plain English Introduction<\/em> (Second Edition) (Machine Learning From Scratch Book 1) (p. 24). Scatterplot Press. Kindle Edition.<\/p>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>2\u00a0<\/sup>Konstan, J., Terveen, L., <em>Human-centered recommender systems: Origins, advances, challenges, and opportunities<\/em>, AI Magazine, 42(3), 31-42, 2021.<\/p>\n","protected":false},"author":1,"menu_order":3,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[],"contributor":[],"license":[],"part":46,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/60"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/60\/revisions"}],"predecessor-version":[{"id":61,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/60\/revisions\/61"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/parts\/46"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapters\/60\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/media?parent=60"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/pressbooks\/v2\/chapter-type?post=60"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/contributor?post=60"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/iapourlesenseignants\/wp-json\/wp\/v2\/license?post=60"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}