Adattudomány és gépi tanulás
A prediktív modellek pontosságának javításához gépi tanulási technikákra van szükség. A kezelendő üzleti probléma jellegétől függően az adatok típusa és mennyisége alapján különböző megközelítések léteznek. Ebben a szakaszban a gépi tanulás kategóriáit tárgyaljuk.
Felügyelt tanulás
A felügyelt tanulás jellemzően egy meghatározott adathalmazzal és az adatok osztályozásának bizonyos fokú megértésével kezdődik. A felügyelt tanulás célja, hogy olyan mintákat találjon az adatokban, amelyeket egy elemzési folyamathoz lehet alkalmazni. Ezek az adatok címkézett jellemzőkkel rendelkeznek, amelyek meghatározzák az adatok jelentését. Például létrehozhat egy olyan gépi tanulási alkalmazást, amely állatok millióit különbözteti meg képek és írásos leírások alapján.
Felügyelet nélküli tanulás
A felügyelet nélküli tanulást akkor használják, amikor a probléma hatalmas mennyiségű címkézetlen adatot igényel. Például a közösségi médiaalkalmazások, például a Twitter, az Instagram és a Snapchat mind nagy mennyiségű címkézetlen adatot tartalmaznak. Az ezen adatok mögött rejlő jelentés megértéséhez olyan algoritmusokra van szükség, amelyek a megtalált minták vagy klaszterek alapján osztályozzák az adatokat.
A felügyelet nélküli tanulás iteratív folyamatot végez, emberi beavatkozás nélkül elemzi az adatokat. Ezt használják az e-mail spam-felismerő technológiánál. A törvényes és a spam e-mailekben túl sok változó van ahhoz, hogy egy elemző megjelölhesse a kéretlen tömeges e-maileket. Ehelyett gépi tanuláson alapuló, klaszterezésen és asszociáción alapuló osztályozókat alkalmaznak a nem kívánt e-mailek azonosítására.
Kényszerítő tanulás
A kényszerítő tanulás egy viselkedéses tanulási modell. Az algoritmus visszajelzést kap az adatelemzésből, és a legjobb eredményhez vezeti a felhasználót. Az erősítéses tanulás különbözik a felügyelt tanulás más típusaitól, mivel a rendszert nem a mintaadathalmazzal képzik ki. A rendszer inkább próba és hiba útján tanul. Ezért a sikeres döntések sorozata azt eredményezi, hogy a folyamat megerősítést kap, mert az oldja meg legjobban az adott problémát.
Mélytanulás
A mélytanulás a gépi tanulás egy speciális módszere, amely egymást követő rétegekben neurális hálózatokat épít be, hogy az adatokból iteratív módon tanuljon. A mélytanulás különösen akkor hasznos, ha strukturálatlan adatokból próbálunk mintákat tanulni.
A mélytanulás komplex neurális hálózatokat úgy tervezték, hogy utánozzák az emberi agy működését, így a számítógépek betaníthatók a rosszul definiált absztrakciók és problémák kezelésére. Egy átlagos ötéves gyermek könnyen felismeri a különbséget a tanára és a zebraőr arca között. Ezzel szemben a számítógépnek rengeteg munkát kell végeznie ahhoz, hogy rájöjjön, ki kicsoda. A neurális hálózatokat és a mély tanulást gyakran használják képfelismerő, beszéd és számítógépes látás alkalmazásokban.