{"id":251,"date":"2023-11-30T17:01:45","date_gmt":"2023-11-30T17:01:45","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/chapter\/machine-learning-ai-through-data-experiments-in-orange\/"},"modified":"2024-01-31T11:44:42","modified_gmt":"2024-01-31T11:44:42","slug":"machine-learning-ai-through-data-experiments-in-orange","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/chapter\/machine-learning-ai-through-data-experiments-in-orange\/","title":{"raw":"Maschinenlernen und KI im Rahmen von Datenexperimenten in Orange","rendered":"Maschinenlernen und KI im Rahmen von Datenexperimenten in Orange"},"content":{"raw":"<p class=\"no-indent\"><em>Sind Delphine S<\/em><em>\u00e4<\/em><em>ugetiere und wenn ja, warum? Zu welcher Tierart geh<\/em><em>\u00f6<\/em><em>rt ein Kiwi? Liegen Athen und Rom in derselben Klimazone?<\/em><\/p>\n<p class=\"no-indent\"><em>Wer hat das ber<\/em><em>\u00fc<\/em><em>hmte Gem<\/em><em>\u00e4<\/em><em>lde mit einer schreienden Dame gemalt? Malt dieser K<\/em><em>\u00fc<\/em><em>nstler den Himmel immer in Orange?<\/em><\/p>\n<p class=\"no-indent\"><em>K\u00f6nnen wir den Verfasser oder die Verfasserin eines Posts auf Social Media durch seinen oder ihren Schreibstil erkennen? Hat Luka Don\u010di\u010d einen Klon in der NBA, was seinen Spielstil angeht?<\/em><\/p>\n<p class=\"no-indent\"><em>Kann man die Art des Baumes anhand seiner Bl<\/em><em>\u00e4<\/em><em>tter erkennen? Oder anhand eines Fotos seiner Rinde?<\/em><\/p>\n<p class=\"no-indent\"><em>Wie lassen sich die L<\/em><em>\u00e4<\/em><em>nder der Welt nach ihren sozio<\/em><em>\u00f6<\/em><em>konomischen Merkmalen gruppieren? Ist die Welt tats<\/em><em>\u00e4<\/em><em>chlich sozio<\/em><em>\u00f6<\/em><em>konomisch nach Norden und S<\/em><em>\u00fc<\/em><em>den aufgeteilt?<\/em><\/p>\n<p class=\"no-indent\"><em>Welches Landeshauptstadt \u00e4hnelt vom Wetter her am ehesten der Hauptstadt Berlin?<\/em><\/p>\n<p class=\"indent\">Die Datenwissenschaft, insbesondere Methoden des maschinellen Lernens, dient als Katalysator f\u00fcr Ver\u00e4nderungen in verschiedenen Bereichen wie Wissenschaft, Ingenieurwesen und Technologie und hat erhebliche Auswirkungen auf unser t\u00e4gliches Leben. Computertechniken, die in der Lage sind, umfangreiche Datens\u00e4tze zu durchk\u00e4mmen, interessante Muster zu erkennen und Vorhersagemodelle zu erstellen, sind allgegenw\u00e4rtig. Allerdings verf\u00fcgen nur wenige Fachleute \u00fcber ein grundlegendes Verst\u00e4ndnis der Datenwissenschaft, und noch weniger sind aktiv an der Erstellung von Modellen aus diesen Daten beteiligt. In einem Zeitalter, in dem KI unsere Welt im Stillen formt, muss sich jeder ihrer F\u00e4higkeiten, Vorteile und potenziellen Risiken bewusst sein. Wir m\u00fcssen Methoden entwickeln, um die Konzepte der Datenwissenschaft einer breiten \u00d6ffentlichkeit wirksam zu vermitteln und zu lehren. Die Grunds\u00e4tze und Techniken des maschinellen Lernens, der Datenwissenschaft und der k\u00fcnstlichen Intelligenz sollten zum Allgemeinwissen werden.<\/p>\n<p class=\"indent\">Jede Frage, die zu Beginn dieses Kapitels gestellt wurde, kann durch die Analyse relevanter Daten beantwortet werden. Wir schlagen einen Ansatz f\u00fcr das Training des maschinellen Lernens vor, bei dem wir mit der Frage beginnen, relevante Daten finden und dann die Frage durch das Finden relevanter Datenmuster und Modelle beantworten. Im Projekt <a href=\"https:\/\/pumice.si\/en\/\">Pumice<\/a> entwickeln wir p\u00e4dagogische Aktivit\u00e4ten, die zur Erg\u00e4nzung verschiedener Schulf\u00e4cher eingesetzt werden k\u00f6nnen. Wir nutzen Daten, die mit dem Thema in Verbindung stehen und untersuchen sie mit Hilfe von KI und maschinellem Lernen. In Zusammenarbeit mit p\u00e4dagogischen Fachkr\u00e4ften haben wir Lernvorlagen und Hintergrunderkl\u00e4rungen f\u00fcr Lehrende und Lernende entwickelt.<\/p>\n<p class=\"indent\">Die Aktivit\u00e4ten und das Training von Pumice werden von <a href=\"http:\/\/orangedatamining.com\/\">Orange<\/a> unterst\u00fctzt, einem Programm f\u00fcr maschinelles Lernen mit einer intuitiven Benutzeroberfl\u00e4che, interaktiven Visualisierungen und visueller Programmierung. Der Schl\u00fcssel zur Einfachheit, die f\u00fcr das Training erforderlich ist und f\u00fcr die Vielseitigkeit, um die meisten Kernthemen abzudecken und an verschiedene Anwendungsbereiche anzupassen, ist der Legostein-\u00e4hnliche Aufbau der analytischen Pipelines und die Interaktivit\u00e4t aller Komponenten (siehe Abb. 1). Um den Unterricht weiter zu unterst\u00fctzen und sich auf Konzepte statt auf die zugrunde liegende Mechanik zu konzentrieren, implementiert Orange einen einfachen Zugang zu Daten, Reproduzierbarkeit durch das Speichern von Arbeitsabl\u00e4ufen mit all den verschiedenen nutzerbasierten Einstellungen und Auswahlm\u00f6glichkeiten sowie eine einfache Anpassung durch das Design neuer Komponenten. Ein entscheidender Aspekt des Trainings ist das Storytelling durch die Inspektion von Arbeitsabl\u00e4ufen und speziellen Funktionen f\u00fcr Experimente, wie z. B. das Zeichnen von Versuchsdatens\u00e4tzen oder das Lernen \u00fcber die \u00dcberanpassung der polynomialen linearen Regression. Orange ist als Open-Source-Software verf\u00fcgbar und wird durch ein <a href=\"https:\/\/www.youtube.com\/orangedatamining\">kurzes Schulungsvideo<\/a> erg\u00e4nzt.<\/p>\n\n\n[caption id=\"attachment_250\" align=\"aligncenter\" width=\"300\"]<img class=\"wp-image-250 size-medium\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2023\/11\/orange-screenshot-300x289.png\" alt=\"\" width=\"300\" height=\"289\"> Abb.1. Orange Data Mining Software und ein typischer Datenexploration.[\/caption]\n<p class=\"no-indent\">In Abb. 1 zeigen wir einen typischen Workflow der Orange Datenexploration. Der Workflow besteht aus Komponenten, die die Daten laden, die Abst\u00e4nde berechnen, die Daten oder die sich daraus ergebenden Modelle visualisieren oder alle notwendigen Aufgaben durchf\u00fchren, um Datenmuster zu finden und zu visualisieren. In diesem Workflow haben wir die sozio\u00f6konomischen Daten von L\u00e4ndern der Welt verwendet. Der obere Zweig innerhalb des Workflows untersucht zwei Merkmale und zeigt, dass die Lebenserwartung und die Anzahl der Schuljahre miteinander korrelieren. Es zeigt auch, dass es L\u00e4nder wie Cabo Verde und Marokko gibt, in denen die Menschen lange leben, aber nicht allzu viel Zeit in der Schule verbringen. Kinder in Schulen k\u00f6nnen solche Netzwerke entwerfen, um herauszufinden, welche L\u00e4nder sich sozio\u00f6konomisch \u00e4hneln und wo sie feststellen k\u00f6nnen, dass die Welt sozio\u00f6konomisch in Nord, Mitte und S\u00fcd aufgeteilt ist und dass es eine gro\u00dfe Kluft zwischen entwickelten und unterentwickelten Teilen der Welt gibt. Es ist nicht n\u00f6tig, ihnen dies ausdr\u00fccklich zu sagen dank der Auswertung der Daten in Orange k\u00f6nnen sie dies und werden in den oberen Klassen selbstst\u00e4ndig in diese Bereiche eintauchen.<\/p>\n<p class=\"indent\">Die Entwicklung von Orange begann im Jahr 2003 und hat seitdem erheblich an Fahrt zugelegt. Mit \u00fcber 50.000 verschiedenen monatlichen Nutzern hat sich Orange als eine weitverbreitete spezialisierte Softwareanwendung etabliert. Ungef\u00e4hr die H\u00e4lfte der Nutzer kommt aus dem akademischen Bereich. Vor allem im Bildungsbereich hat Orange einen bemerkenswerten Aufschwung erlebt: Mehr als 500 Universit\u00e4ten auf der ganzen Welt haben die Software in ihre Data-Science-Kurse integriert.<\/p>\n<p class=\"indent\">Wenn Sie als Lehrkraft in den Bereich des maschinellen Lernens und der Datenwissenschaft eintauchen m\u00f6chten, finden Sie hier eine Zusammenstellung von Ressourcen, die eine Einf\u00fchrung in diese Disziplinen durch praktische Datenerforschung mit Orange bieten:<\/p>\n\n<ul>\n \t<li>Die <a href=\"http:\/\/orangedatamining.com\/\">Website<\/a> der Toolbox Orange<\/li>\n \t<li><a href=\"http:\/\/youtube.com\/orangedatamining\">Eine Einf\u00fchrung in die Datenwissenschaft<\/a> ist eine Reihe von kurzen Videos, die ausgew\u00e4hlte Visualisierungen und maschinelle Lernmethoden mit Orange vorstellen. Sie finden Videos auf <a href=\"http:\/\/youtube.com\/orangedatamining\">http:\/\/youtube.com\/orangedatamining<\/a> und rufen Sie die Wiedergabeliste \u201eEinf\u00fchrung in die Datenwissenschaft\" auf.<\/li>\n \t<li><a href=\"https:\/\/pumice.si\/en\/\">Pumice <\/a>ist eine Website f\u00fcr Lehrkr\u00e4fte, auf der wir Anwendungsf\u00e4lle sammeln, die Sie in Ihr Trainingsprogramm einbauen k\u00f6nnen.<\/li>\n<\/ul>","rendered":"<p class=\"no-indent\"><em>Sind Delphine S<\/em><em>\u00e4<\/em><em>ugetiere und wenn ja, warum? Zu welcher Tierart geh<\/em><em>\u00f6<\/em><em>rt ein Kiwi? Liegen Athen und Rom in derselben Klimazone?<\/em><\/p>\n<p class=\"no-indent\"><em>Wer hat das ber<\/em><em>\u00fc<\/em><em>hmte Gem<\/em><em>\u00e4<\/em><em>lde mit einer schreienden Dame gemalt? Malt dieser K<\/em><em>\u00fc<\/em><em>nstler den Himmel immer in Orange?<\/em><\/p>\n<p class=\"no-indent\"><em>K\u00f6nnen wir den Verfasser oder die Verfasserin eines Posts auf Social Media durch seinen oder ihren Schreibstil erkennen? Hat Luka Don\u010di\u010d einen Klon in der NBA, was seinen Spielstil angeht?<\/em><\/p>\n<p class=\"no-indent\"><em>Kann man die Art des Baumes anhand seiner Bl<\/em><em>\u00e4<\/em><em>tter erkennen? Oder anhand eines Fotos seiner Rinde?<\/em><\/p>\n<p class=\"no-indent\"><em>Wie lassen sich die L<\/em><em>\u00e4<\/em><em>nder der Welt nach ihren sozio<\/em><em>\u00f6<\/em><em>konomischen Merkmalen gruppieren? Ist die Welt tats<\/em><em>\u00e4<\/em><em>chlich sozio<\/em><em>\u00f6<\/em><em>konomisch nach Norden und S<\/em><em>\u00fc<\/em><em>den aufgeteilt?<\/em><\/p>\n<p class=\"no-indent\"><em>Welches Landeshauptstadt \u00e4hnelt vom Wetter her am ehesten der Hauptstadt Berlin?<\/em><\/p>\n<p class=\"indent\">Die Datenwissenschaft, insbesondere Methoden des maschinellen Lernens, dient als Katalysator f\u00fcr Ver\u00e4nderungen in verschiedenen Bereichen wie Wissenschaft, Ingenieurwesen und Technologie und hat erhebliche Auswirkungen auf unser t\u00e4gliches Leben. Computertechniken, die in der Lage sind, umfangreiche Datens\u00e4tze zu durchk\u00e4mmen, interessante Muster zu erkennen und Vorhersagemodelle zu erstellen, sind allgegenw\u00e4rtig. Allerdings verf\u00fcgen nur wenige Fachleute \u00fcber ein grundlegendes Verst\u00e4ndnis der Datenwissenschaft, und noch weniger sind aktiv an der Erstellung von Modellen aus diesen Daten beteiligt. In einem Zeitalter, in dem KI unsere Welt im Stillen formt, muss sich jeder ihrer F\u00e4higkeiten, Vorteile und potenziellen Risiken bewusst sein. Wir m\u00fcssen Methoden entwickeln, um die Konzepte der Datenwissenschaft einer breiten \u00d6ffentlichkeit wirksam zu vermitteln und zu lehren. Die Grunds\u00e4tze und Techniken des maschinellen Lernens, der Datenwissenschaft und der k\u00fcnstlichen Intelligenz sollten zum Allgemeinwissen werden.<\/p>\n<p class=\"indent\">Jede Frage, die zu Beginn dieses Kapitels gestellt wurde, kann durch die Analyse relevanter Daten beantwortet werden. Wir schlagen einen Ansatz f\u00fcr das Training des maschinellen Lernens vor, bei dem wir mit der Frage beginnen, relevante Daten finden und dann die Frage durch das Finden relevanter Datenmuster und Modelle beantworten. Im Projekt <a href=\"https:\/\/pumice.si\/en\/\">Pumice<\/a> entwickeln wir p\u00e4dagogische Aktivit\u00e4ten, die zur Erg\u00e4nzung verschiedener Schulf\u00e4cher eingesetzt werden k\u00f6nnen. Wir nutzen Daten, die mit dem Thema in Verbindung stehen und untersuchen sie mit Hilfe von KI und maschinellem Lernen. In Zusammenarbeit mit p\u00e4dagogischen Fachkr\u00e4ften haben wir Lernvorlagen und Hintergrunderkl\u00e4rungen f\u00fcr Lehrende und Lernende entwickelt.<\/p>\n<p class=\"indent\">Die Aktivit\u00e4ten und das Training von Pumice werden von <a href=\"http:\/\/orangedatamining.com\/\">Orange<\/a> unterst\u00fctzt, einem Programm f\u00fcr maschinelles Lernen mit einer intuitiven Benutzeroberfl\u00e4che, interaktiven Visualisierungen und visueller Programmierung. Der Schl\u00fcssel zur Einfachheit, die f\u00fcr das Training erforderlich ist und f\u00fcr die Vielseitigkeit, um die meisten Kernthemen abzudecken und an verschiedene Anwendungsbereiche anzupassen, ist der Legostein-\u00e4hnliche Aufbau der analytischen Pipelines und die Interaktivit\u00e4t aller Komponenten (siehe Abb. 1). Um den Unterricht weiter zu unterst\u00fctzen und sich auf Konzepte statt auf die zugrunde liegende Mechanik zu konzentrieren, implementiert Orange einen einfachen Zugang zu Daten, Reproduzierbarkeit durch das Speichern von Arbeitsabl\u00e4ufen mit all den verschiedenen nutzerbasierten Einstellungen und Auswahlm\u00f6glichkeiten sowie eine einfache Anpassung durch das Design neuer Komponenten. Ein entscheidender Aspekt des Trainings ist das Storytelling durch die Inspektion von Arbeitsabl\u00e4ufen und speziellen Funktionen f\u00fcr Experimente, wie z. B. das Zeichnen von Versuchsdatens\u00e4tzen oder das Lernen \u00fcber die \u00dcberanpassung der polynomialen linearen Regression. Orange ist als Open-Source-Software verf\u00fcgbar und wird durch ein <a href=\"https:\/\/www.youtube.com\/orangedatamining\">kurzes Schulungsvideo<\/a> erg\u00e4nzt.<\/p>\n<figure id=\"attachment_250\" aria-describedby=\"caption-attachment-250\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-250 size-medium\" src=\"http:\/\/aiopentext.itd.cnr.it\/wp-content\/uploads\/sites\/13\/2023\/11\/orange-screenshot-300x289.png\" alt=\"\" width=\"300\" height=\"289\" srcset=\"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2023\/11\/orange-screenshot-300x289.png 300w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2023\/11\/orange-screenshot-65x63.png 65w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2023\/11\/orange-screenshot-225x217.png 225w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2023\/11\/orange-screenshot-350x337.png 350w, https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-content\/uploads\/sites\/13\/2023\/11\/orange-screenshot.png 742w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><figcaption id=\"caption-attachment-250\" class=\"wp-caption-text\">Abb.1. Orange Data Mining Software und ein typischer Datenexploration.<\/figcaption><\/figure>\n<p class=\"no-indent\">In Abb. 1 zeigen wir einen typischen Workflow der Orange Datenexploration. Der Workflow besteht aus Komponenten, die die Daten laden, die Abst\u00e4nde berechnen, die Daten oder die sich daraus ergebenden Modelle visualisieren oder alle notwendigen Aufgaben durchf\u00fchren, um Datenmuster zu finden und zu visualisieren. In diesem Workflow haben wir die sozio\u00f6konomischen Daten von L\u00e4ndern der Welt verwendet. Der obere Zweig innerhalb des Workflows untersucht zwei Merkmale und zeigt, dass die Lebenserwartung und die Anzahl der Schuljahre miteinander korrelieren. Es zeigt auch, dass es L\u00e4nder wie Cabo Verde und Marokko gibt, in denen die Menschen lange leben, aber nicht allzu viel Zeit in der Schule verbringen. Kinder in Schulen k\u00f6nnen solche Netzwerke entwerfen, um herauszufinden, welche L\u00e4nder sich sozio\u00f6konomisch \u00e4hneln und wo sie feststellen k\u00f6nnen, dass die Welt sozio\u00f6konomisch in Nord, Mitte und S\u00fcd aufgeteilt ist und dass es eine gro\u00dfe Kluft zwischen entwickelten und unterentwickelten Teilen der Welt gibt. Es ist nicht n\u00f6tig, ihnen dies ausdr\u00fccklich zu sagen dank der Auswertung der Daten in Orange k\u00f6nnen sie dies und werden in den oberen Klassen selbstst\u00e4ndig in diese Bereiche eintauchen.<\/p>\n<p class=\"indent\">Die Entwicklung von Orange begann im Jahr 2003 und hat seitdem erheblich an Fahrt zugelegt. Mit \u00fcber 50.000 verschiedenen monatlichen Nutzern hat sich Orange als eine weitverbreitete spezialisierte Softwareanwendung etabliert. Ungef\u00e4hr die H\u00e4lfte der Nutzer kommt aus dem akademischen Bereich. Vor allem im Bildungsbereich hat Orange einen bemerkenswerten Aufschwung erlebt: Mehr als 500 Universit\u00e4ten auf der ganzen Welt haben die Software in ihre Data-Science-Kurse integriert.<\/p>\n<p class=\"indent\">Wenn Sie als Lehrkraft in den Bereich des maschinellen Lernens und der Datenwissenschaft eintauchen m\u00f6chten, finden Sie hier eine Zusammenstellung von Ressourcen, die eine Einf\u00fchrung in diese Disziplinen durch praktische Datenerforschung mit Orange bieten:<\/p>\n<ul>\n<li>Die <a href=\"http:\/\/orangedatamining.com\/\">Website<\/a> der Toolbox Orange<\/li>\n<li><a href=\"http:\/\/youtube.com\/orangedatamining\">Eine Einf\u00fchrung in die Datenwissenschaft<\/a> ist eine Reihe von kurzen Videos, die ausgew\u00e4hlte Visualisierungen und maschinelle Lernmethoden mit Orange vorstellen. Sie finden Videos auf <a href=\"http:\/\/youtube.com\/orangedatamining\">http:\/\/youtube.com\/orangedatamining<\/a> und rufen Sie die Wiedergabeliste \u201eEinf\u00fchrung in die Datenwissenschaft&#8221; auf.<\/li>\n<li><a href=\"https:\/\/pumice.si\/en\/\">Pumice <\/a>ist eine Website f\u00fcr Lehrkr\u00e4fte, auf der wir Anwendungsf\u00e4lle sammeln, die Sie in Ihr Trainingsprogramm einbauen k\u00f6nnen.<\/li>\n<\/ul>\n","protected":false},"author":1,"menu_order":19,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":["blaz-zupan"],"pb_section_license":""},"chapter-type":[49],"contributor":[73],"license":[],"part":205,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters\/251"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters\/251\/revisions"}],"predecessor-version":[{"id":252,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters\/251\/revisions\/252"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/parts\/205"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapters\/251\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/media?parent=251"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/pressbooks\/v2\/chapter-type?post=251"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/contributor?post=251"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/aifurlehrer\/wp-json\/wp\/v2\/license?post=251"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}