Tietotiede ja koneoppiminen
Koneoppimistekniikoita tarvitaan ennustemallien tarkkuuden parantamiseen. Riippuen käsiteltävän liiketoimintaongelman luonteesta on olemassa erilaisia lähestymistapoja, jotka perustuvat datan tyyppiin ja määrään. Tässä osiossa käsitellään koneoppimisen luokkia.
Valvottu oppiminen
Valvottu oppiminen alkaa tyypillisesti vakiintuneesta datajoukosta ja tietystä ymmärryksestä siitä, miten tämä data luokitellaan. Valvotun oppimisen tarkoituksena on löytää datasta malleja, joita voidaan soveltaa analytiikkaprosessiin. Tässä datassa on merkittyjä piirteitä, jotka määrittelevät datan merkityksen. Voit esimerkiksi luoda koneoppimissovelluksen, joka erottaa miljoonat eläimet toisistaan kuvien ja kirjallisten kuvausten perusteella.
Valvomaton oppiminen
Valvomatonta oppimista käytetään, kun ongelma vaatii valtavan määrän merkitsemätöntä dataa. Esimerkiksi sosiaalisen median sovelluksissa, kuten Twitterissä, Instagramissa ja Snapchatissa, on suuria määriä merkitsemätöntä dataa. Tämän datan merkityksen ymmärtäminen edellyttää algoritmeja, jotka luokittelevat datan löytämiensä mallien tai klustereiden perusteella.
Ylivalvomaton oppiminen suorittaa iteratiivisen prosessin, jossa dataa analysoidaan ilman ihmisen väliintuloa. Sitä käytetään sähköpostin roskapostia havaitsevassa teknologiassa. Laillisissa ja roskapostiviesteissä on aivan liian paljon muuttujia, jotta analyytikko voisi merkitä ei-toivotut massasähköpostiviestit. Sen sijaan ei-toivottujen sähköpostiviestien tunnistamiseen käytetään klusterointiin ja assosiaatioon perustuvia koneoppimisen luokittelijoita.
Vahvistusoppiminen
Vahvistusoppiminen on käyttäytymiseen perustuva oppimismalli. Algoritmi saa palautetta tietojen analysoinnista ja ohjaa käyttäjää parhaaseen lopputulokseen. Vahvistusoppiminen eroaa muista valvotun oppimisen tyypeistä, koska järjestelmää ei kouluteta esimerkkitietoaineistolla. Pikemminkin järjestelmä oppii kokeilun ja erehdyksen kautta. Siksi onnistuneiden päätösten sarja johtaa siihen, että prosessi vahvistuu, koska se ratkaisee parhaiten käsillä olevan ongelman.
Syväoppiminen
Syväoppiminen on erityinen koneoppimismenetelmä, joka sisältää neuroverkkoja peräkkäisissä kerroksissa oppimaan datasta iteratiivisesti. Syväoppiminen on erityisen hyödyllistä, kun yritetään oppia kuvioita jäsentymättömästä datasta.
Syväoppiminen Monimutkaiset neuroverkot on suunniteltu jäljittelemään ihmisaivojen toimintaa, joten tietokoneita voidaan kouluttaa käsittelemään huonosti määriteltyjä abstraktioita ja ongelmia. Keskiverto viisivuotias lapsi tunnistaa helposti eron opettajansa kasvojen ja risteyksenvartijan kasvojen välillä. Sen sijaan tietokoneen on tehtävä paljon työtä selvittääkseen, kuka on kuka. Neuroverkkoja ja syväoppimista käytetään usein kuvantunnistus-, puhe- ja tietokonenäön sovelluksissa.