{"id":221,"date":"2023-11-30T17:20:01","date_gmt":"2023-11-30T17:20:01","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/chapter\/does-data-always-have-to-be-labeled\/"},"modified":"2024-01-31T11:39:41","modified_gmt":"2024-01-31T11:39:41","slug":"does-data-always-have-to-be-labeled","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/chapter\/does-data-always-have-to-be-labeled\/","title":{"raw":"I dati devono sempre essere etichettati?","rendered":"I dati devono sempre essere etichettati?"},"content":{"raw":"<h3>I dati devono sempre essere etichettati?<\/h3>\n<p class=\"no-indent\">No, non sempre. Una buona parte degli algoritmi di apprendimento automatico sono o algoritmi di apprendimento supervisionato o algoritmi di apprendimento non supervisionato.<\/p>\n<p class=\"indent\">Quando si vuole classificare una foto come quella di un cane, di un gatto o di un gorilla, si possono inserire nella macchina delle foto etichettate come quelle di un cane, di un gatto o di un gorilla. Quando si vuole valutare un tema, si potrebbero inserire molti temi corretti, etichettati con le rispettive valutazioni. In ciascun caso, sapremmo quale sarebbe l\u2019output: cane, gatto, gorilla, A+, A, A-, D\u2026<\/p>\n<p class=\"indent\">Inseriti i dati etichettati durante l\u2019addestramento, l\u2019algoritmo cerca di trovare una funzione o un\u2019equazione matematica se preferite, che combini output e input. Ci\u00f2 spesso significa anche che il programmatore sperimenta diversi algoritmi per vedere quale si combina al meglio con una determinata funzione. Ma fintanto che i dati hanno delle etichette, esse funzionano come un \u201csupervisore\u201d o una guida che verifica che la funzione selezionata dall\u2019algoritmo funzioni effettivamente1. Se la funzione produce un output diverso da quello dell\u2019etichetta, l\u2019algoritmo ne deve trovare una migliore.<\/p>\n<p class=\"indent\">Etichettare i dati per\u00f2 \u00e8 un processo che richiede tempo e denaro e spesso comporta anche l\u2019assunzione di operatori umani. Inoltre, se stiamo solo cercando schemi nei dati e non abbiamo un\u2019idea chiara di quale schema troveremo, nemmeno l\u2019output ci \u00e8 noto. Pertanto, i dati non possono essere etichettati. \u00c8 a questo punto che interviene un algoritmo di apprendimento non supervisionato.<\/p>\n<p class=\"indent\">Invece di cercare di combinare input e output, questi algoritmi cercano di individuare regolarit\u00e0 nei dati che aiuteranno a raggruppare gli input in categorie<sup>1<\/sup>. Le banche ricorrono all\u2019apprendimento automatico non supervisionato per individuare attivit\u00e0 fraudolente nelle transazioni con le carte di credito. Dal momento che avvengono moltissime transazioni ogni minuto e non sappiamo come individuare gli schemi ed etichettare un\u2019attivit\u00e0 come fraudolenta, facciamo affidamento sull\u2019apprendimento automatico per individuare in automatico lo schema. Raggruppare un determinato gruppo di studenti in un numero prefissato di gruppi \u00e8 un altro problema a cui spesso si fa fronte con l\u2019apprendimento non supervisionato. Lo stesso principio si applica per individuare attivit\u00e0 terroristica considerando l\u2019attivit\u00e0 delle cellule in una rete.<\/p>\n\n\n<hr>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>1 <\/sup>Kelleher, J.D, Tierney, B, <em>Data Science<\/em>, London, 2018.<\/p>","rendered":"<h3>I dati devono sempre essere etichettati?<\/h3>\n<p class=\"no-indent\">No, non sempre. Una buona parte degli algoritmi di apprendimento automatico sono o algoritmi di apprendimento supervisionato o algoritmi di apprendimento non supervisionato.<\/p>\n<p class=\"indent\">Quando si vuole classificare una foto come quella di un cane, di un gatto o di un gorilla, si possono inserire nella macchina delle foto etichettate come quelle di un cane, di un gatto o di un gorilla. Quando si vuole valutare un tema, si potrebbero inserire molti temi corretti, etichettati con le rispettive valutazioni. In ciascun caso, sapremmo quale sarebbe l\u2019output: cane, gatto, gorilla, A+, A, A-, D\u2026<\/p>\n<p class=\"indent\">Inseriti i dati etichettati durante l\u2019addestramento, l\u2019algoritmo cerca di trovare una funzione o un\u2019equazione matematica se preferite, che combini output e input. Ci\u00f2 spesso significa anche che il programmatore sperimenta diversi algoritmi per vedere quale si combina al meglio con una determinata funzione. Ma fintanto che i dati hanno delle etichette, esse funzionano come un \u201csupervisore\u201d o una guida che verifica che la funzione selezionata dall\u2019algoritmo funzioni effettivamente1. Se la funzione produce un output diverso da quello dell\u2019etichetta, l\u2019algoritmo ne deve trovare una migliore.<\/p>\n<p class=\"indent\">Etichettare i dati per\u00f2 \u00e8 un processo che richiede tempo e denaro e spesso comporta anche l\u2019assunzione di operatori umani. Inoltre, se stiamo solo cercando schemi nei dati e non abbiamo un\u2019idea chiara di quale schema troveremo, nemmeno l\u2019output ci \u00e8 noto. Pertanto, i dati non possono essere etichettati. \u00c8 a questo punto che interviene un algoritmo di apprendimento non supervisionato.<\/p>\n<p class=\"indent\">Invece di cercare di combinare input e output, questi algoritmi cercano di individuare regolarit\u00e0 nei dati che aiuteranno a raggruppare gli input in categorie<sup>1<\/sup>. Le banche ricorrono all\u2019apprendimento automatico non supervisionato per individuare attivit\u00e0 fraudolente nelle transazioni con le carte di credito. Dal momento che avvengono moltissime transazioni ogni minuto e non sappiamo come individuare gli schemi ed etichettare un\u2019attivit\u00e0 come fraudolenta, facciamo affidamento sull\u2019apprendimento automatico per individuare in automatico lo schema. Raggruppare un determinato gruppo di studenti in un numero prefissato di gruppi \u00e8 un altro problema a cui spesso si fa fronte con l\u2019apprendimento non supervisionato. Lo stesso principio si applica per individuare attivit\u00e0 terroristica considerando l\u2019attivit\u00e0 delle cellule in una rete.<\/p>\n<hr \/>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>1 <\/sup>Kelleher, J.D, Tierney, B, <em>Data Science<\/em>, London, 2018.<\/p>\n","protected":false},"author":1,"menu_order":6,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[49],"contributor":[],"license":[],"part":207,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/221"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/221\/revisions"}],"predecessor-version":[{"id":222,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/221\/revisions\/222"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/parts\/207"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapters\/221\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/media?parent=221"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/pressbooks\/v2\/chapter-type?post=221"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/contributor?post=221"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/intelligenzaartificiale\/wp-json\/wp\/v2\/license?post=221"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}