{"id":218,"date":"2023-11-30T17:32:06","date_gmt":"2023-11-30T17:32:06","guid":{"rendered":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/chapter\/does-data-always-have-to-be-labeled\/"},"modified":"2024-01-31T11:49:02","modified_gmt":"2024-01-31T11:49:02","slug":"does-data-always-have-to-be-labeled","status":"publish","type":"chapter","link":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/chapter\/does-data-always-have-to-be-labeled\/","title":{"raw":"Ali morajo biti podatki vedno ozna\u010deni?","rendered":"Ali morajo biti podatki vedno ozna\u010deni?"},"content":{"raw":"<h3>Ali morajo biti podatki vedno ozna\u010deni?<\/h3>\n<p class=\"no-indent\">Ne, ne vedno. Velik del algoritmov strojnega u\u010denja so algoritmi za nadzorovano u\u010denje ali algoritmi za nenadzorovano u\u010denje.<\/p>\n<p class=\"indent\">\u010ce \u017eelite fotografijo razvrstiti kot fotografijo psa, ma\u010dke ali gorile, lahko stroj napolnite s fotografijami, ozna\u010denimi kot pes, ma\u010dka ali gorila. Ko \u017eelite oceniti esej, lahko dodate veliko popravljenih esejev, ozna\u010denih z njihovimi ocenami. V vsakem primeru smo vedeli, kak\u0161en bo rezultat: pes, ma\u010dka, gorila, A+, A, A-, D ...<\/p>\n<p class=\"indent\">Glede na ozna\u010dene podatke med usposabljanjem posku\u0161a algoritem najti funkcijo ali matemati\u010dni recept, \u010de \u017eelite, da se ujema z rezultatom in vlo\u017ekom. To pogosto pomeni tudi, da programer preizku\u0161a razli\u010dne algoritme, da bi ugotovil, kateri se najbolje ujema s funkcijo. Toda dokler imajo podatki oznake, te oznake delujejo kot \"nadzornik\" ali vodnik, ki preverja, ali funkcija, ki jo izbere algoritem, res deluje<sup>1<\/sup>. \u010ce funkcija daje rezultat, ki se razlikuje od rezultata oznake, mora algoritem najti bolj\u0161ega.<\/p>\n<p class=\"indent\">Toda ozna\u010devanje podatkov je dolgotrajen in drag proces, ki pogosto vklju\u010duje najemanje ljudi. Poleg tega, \u010de le i\u0161\u010demo vzorce v podatkih in nimamo jasne predstave o tem, kak\u0161en vzorec bomo na\u0161li, nam rezultat niti ni znan. Tako podatkov ni mogo\u010de ozna\u010diti. Tu nastopijo nenadzorovani algoritmi.<\/p>\n<p class=\"indent\">Namesto da bi posku\u0161ali uskladiti vlo\u017eek z rezultatom, ti algoritmi posku\u0161ajo najti pravilnosti v podatkih, ki bodo pomagale razvrstiti vlo\u017eek v kategorije1. Banke uporabljajo nenadzorovano strojno u\u010denje za odkrivanje goljufive aktivnosti pri transakcijah s kreditnimi karticami. Ker je vsako minuto ogromno transakcij in ne bomo vedeli, kako odkriti vzorce in ozna\u010diti aktivnost kot goljufijo, se zana\u0161amo na strojno u\u010denje, da najde vzorec samodejno. Zdru\u017eevanje katere koli dane skupine u\u010dencev v dolo\u010deno \u0161tevilo skupin je prav tako problem, ki pogosto uporablja nenadzorovano u\u010denje. Enako velja za iskanje teroristi\u010dne aktivnosti glede na celi\u010dno aktivnost v mre\u017ei.<\/p>\n&nbsp;\n\n<hr>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>1 <\/sup>Kelleher, J.D, Tierney, B, <em>Data Science<\/em>, London, 2018.<\/p>","rendered":"<h3>Ali morajo biti podatki vedno ozna\u010deni?<\/h3>\n<p class=\"no-indent\">Ne, ne vedno. Velik del algoritmov strojnega u\u010denja so algoritmi za nadzorovano u\u010denje ali algoritmi za nenadzorovano u\u010denje.<\/p>\n<p class=\"indent\">\u010ce \u017eelite fotografijo razvrstiti kot fotografijo psa, ma\u010dke ali gorile, lahko stroj napolnite s fotografijami, ozna\u010denimi kot pes, ma\u010dka ali gorila. Ko \u017eelite oceniti esej, lahko dodate veliko popravljenih esejev, ozna\u010denih z njihovimi ocenami. V vsakem primeru smo vedeli, kak\u0161en bo rezultat: pes, ma\u010dka, gorila, A+, A, A-, D &#8230;<\/p>\n<p class=\"indent\">Glede na ozna\u010dene podatke med usposabljanjem posku\u0161a algoritem najti funkcijo ali matemati\u010dni recept, \u010de \u017eelite, da se ujema z rezultatom in vlo\u017ekom. To pogosto pomeni tudi, da programer preizku\u0161a razli\u010dne algoritme, da bi ugotovil, kateri se najbolje ujema s funkcijo. Toda dokler imajo podatki oznake, te oznake delujejo kot &#8220;nadzornik&#8221; ali vodnik, ki preverja, ali funkcija, ki jo izbere algoritem, res deluje<sup>1<\/sup>. \u010ce funkcija daje rezultat, ki se razlikuje od rezultata oznake, mora algoritem najti bolj\u0161ega.<\/p>\n<p class=\"indent\">Toda ozna\u010devanje podatkov je dolgotrajen in drag proces, ki pogosto vklju\u010duje najemanje ljudi. Poleg tega, \u010de le i\u0161\u010demo vzorce v podatkih in nimamo jasne predstave o tem, kak\u0161en vzorec bomo na\u0161li, nam rezultat niti ni znan. Tako podatkov ni mogo\u010de ozna\u010diti. Tu nastopijo nenadzorovani algoritmi.<\/p>\n<p class=\"indent\">Namesto da bi posku\u0161ali uskladiti vlo\u017eek z rezultatom, ti algoritmi posku\u0161ajo najti pravilnosti v podatkih, ki bodo pomagale razvrstiti vlo\u017eek v kategorije1. Banke uporabljajo nenadzorovano strojno u\u010denje za odkrivanje goljufive aktivnosti pri transakcijah s kreditnimi karticami. Ker je vsako minuto ogromno transakcij in ne bomo vedeli, kako odkriti vzorce in ozna\u010diti aktivnost kot goljufijo, se zana\u0161amo na strojno u\u010denje, da najde vzorec samodejno. Zdru\u017eevanje katere koli dane skupine u\u010dencev v dolo\u010deno \u0161tevilo skupin je prav tako problem, ki pogosto uporablja nenadzorovano u\u010denje. Enako velja za iskanje teroristi\u010dne aktivnosti glede na celi\u010dno aktivnost v mre\u017ei.<\/p>\n<p>&nbsp;<\/p>\n<hr \/>\n<p class=\"hanging-indent\" style=\"text-align: left\"><sup>1 <\/sup>Kelleher, J.D, Tierney, B, <em>Data Science<\/em>, London, 2018.<\/p>\n","protected":false},"author":1,"menu_order":6,"template":"","meta":{"pb_show_title":"","pb_short_title":"","pb_subtitle":"","pb_authors":[],"pb_section_license":""},"chapter-type":[49],"contributor":[],"license":[],"part":204,"_links":{"self":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters\/218"}],"collection":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters"}],"about":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/types\/chapter"}],"author":[{"embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/users\/1"}],"version-history":[{"count":1,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters\/218\/revisions"}],"predecessor-version":[{"id":219,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters\/218\/revisions\/219"}],"part":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/parts\/204"}],"metadata":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapters\/218\/metadata\/"}],"wp:attachment":[{"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/media?parent=218"}],"wp:term":[{"taxonomy":"chapter-type","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/pressbooks\/v2\/chapter-type?post=218"},{"taxonomy":"contributor","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/contributor?post=218"},{"taxonomy":"license","embeddable":true,"href":"https:\/\/aiopentext.itd.cnr.it\/umetnainteligenca\/wp-json\/wp\/v2\/license?post=218"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}