Datavidenskab og maskinlæring
Maskinlæringsteknikker er nødvendige for at forbedre nøjagtigheden af forudsigelsesmodeller. Afhængigt af arten af det forretningsproblem, der skal løses, er der forskellige tilgange baseret på datatype og -mængde. I dette afsnit diskuterer vi kategorierne af maskinlæring.
Supervised learning
Supervised learning starter typisk med et etableret datasæt og en vis forståelse af, hvordan disse data klassificeres. Overvåget læring har til formål at finde mønstre i data, som kan anvendes i en analyseproces. Disse data har mærkede funktioner, der definerer dataenes betydning. Du kan f.eks. oprette et program til maskinlæring, der skelner mellem millioner af dyr på grundlag af billeder og skriftlige beskrivelser.
Uovervåget læring
Uovervåget læring anvendes, når problemet kræver en massiv mængde umærkede data. F.eks. har sociale medieapplikationer, såsom Twitter, Instagram og Snapchat, alle store mængder af umærkede data. For at forstå betydningen bag disse data kræves algoritmer, der klassificerer dataene ud fra de mønstre eller klynger, de finder.
Usupervised learning udfører en iterativ proces, hvor data analyseres uden menneskelig indgriben. Den anvendes i forbindelse med teknologi til registrering af e-mailspam. Der er alt for mange variabler i legitime og spam-e-mails til, at en analytiker kan mærke uopfordrede masse-e-mails. I stedet anvendes maskinlæringsklassifikatorer baseret på clustering og association til at identificere uønsket e-mail.
Reinforcement learning
Reinforcement learning er en adfærdsmæssig læringsmodel. Algoritmen modtager feedback fra dataanalysen og vejleder brugeren til det bedste resultat. Reinforcement learning adskiller sig fra andre typer superviseret læring, fordi systemet ikke trænes med prøvedatasættet. I stedet lærer systemet gennem forsøg og fejl. Derfor vil en sekvens af vellykkede beslutninger resultere i, at processen forstærkes, fordi den bedst løser det pågældende problem.
Dyb indlæring
Dyb indlæring er en specifik metode til maskinindlæring, der inkorporerer neurale netværk i på hinanden følgende lag for at lære af data på en iterativ måde. Dyb indlæring er især nyttig, når man forsøger at lære mønstre fra ustrukturerede data.
Dyb indlæring komplekse neurale netværk er designet til at efterligne, hvordan den menneskelige hjerne fungerer, så computere kan trænes til at håndtere dårligt definerede abstraktioner og problemer. Det gennemsnitlige femårige barn kan let genkende forskellen mellem sin lærers ansigt og overgangsvagtens ansigt. I modsætning hertil skal computeren gøre et stort stykke arbejde for at finde ud af, hvem der er hvem. Neurale netværk og deep learning anvendes ofte i applikationer til billedgenkendelse, tale og computervision.