Datenwissenschaft und maschinelles Lernen
Maschinelle Lerntechniken sind erforderlich, um die Genauigkeit von Vorhersagemodellen zu verbessern. Je nach Art des zu lösenden Geschäftsproblems gibt es verschiedene Ansätze, die auf der Art und dem Volumen der Daten basieren. In diesem Abschnitt werden die Kategorien des maschinellen Lernens erörtert.
Überwachtes Lernen
Überwachtes Lernen beginnt in der Regel mit einem bestehenden Datensatz und einem gewissen Verständnis dafür, wie diese Daten klassifiziert werden. Beim überwachten Lernen geht es darum, Muster in den Daten zu finden, die auf einen Analyseprozess angewendet werden können. Diese Daten haben markierte Merkmale, die die Bedeutung der Daten definieren. So kann man beispielsweise eine Anwendung für maschinelles Lernen erstellen, die auf der Grundlage von Bildern und schriftlichen Beschreibungen zwischen Millionen von Tieren unterscheidet.
Unüberwachtes Lernen
Unüberwachtes Lernen wird verwendet, wenn das Problem eine große Menge an nicht beschrifteten Daten erfordert. Zum Beispiel haben Social-Media-Anwendungen wie Twitter, Instagram und Snapchat alle große Mengen an unbeschrifteten Daten. Um die Bedeutung dieser Daten zu verstehen, sind Algorithmen erforderlich, die die Daten auf der Grundlage der gefundenen Muster oder Cluster klassifizieren.
Unüberwachtes Lernen führt einen iterativen Prozess durch, bei dem Daten ohne menschliches Eingreifen analysiert werden. Es wird bei der Technologie zur Erkennung von E-Mail-Spam eingesetzt. Es gibt viel zu viele Variablen in legitimen und Spam-E-Mails, als dass ein Analytiker unerwünschte Massen-E-Mails kennzeichnen könnte. Stattdessen werden maschinelle Klassifizierungsverfahren auf der Grundlage von Clustering und Assoziation angewandt, um unerwünschte E-Mails zu identifizieren.
Reinforcement Learning
Reinforcement Learning ist ein verhaltensbasiertes Lernmodell. Der Algorithmus erhält Rückmeldungen aus der Datenanalyse und führt den Benutzer zum besten Ergebnis. Verstärkungslernen unterscheidet sich von anderen Arten des überwachten Lernens, da das System nicht mit einem Beispieldatensatz trainiert wird. Vielmehr lernt das System durch Versuch und Irrtum. Daher führt eine Folge erfolgreicher Entscheidungen dazu, dass der Prozess verstärkt wird, weil er das jeweilige Problem am besten löst.
Deep Learning
Deep Learning ist eine spezielle Methode des maschinellen Lernens, bei der neuronale Netze in aufeinander folgenden Schichten eingesetzt werden, um iterativ aus Daten zu lernen. Deep Learning ist besonders nützlich, wenn man versucht, Muster aus unstrukturierten Daten zu lernen.
Die komplexen neuronalen Netze des Deep Learning sind so konzipiert, dass sie die Arbeitsweise des menschlichen Gehirns nachahmen, so dass Computer darauf trainiert werden können, mit schlecht definierten Abstraktionen und Problemen umzugehen. Ein durchschnittliches fünfjähriges Kind kann leicht den Unterschied zwischen dem Gesicht seines Lehrers und dem Gesicht des Schülerlotsen erkennen. Im Gegensatz dazu muss der Computer eine Menge Arbeit leisten, um herauszufinden, wer wer ist. Neuronale Netze und Deep Learning werden häufig in der Bilderkennung, bei der Spracherkennung und bei Computer Vision-Anwendungen eingesetzt.