Ciencia de los datos y aprendizaje automático
Las técnicas de aprendizaje automático son necesarias para mejorar la precisión de los modelos predictivos. Dependiendo de la naturaleza del problema de negocio que se aborda, hay diferentes enfoques basados en el tipo y el volumen de los datos. En esta sección, discutimos las categorías de aprendizaje automático.
Aprendizaje supervisado
El aprendizaje supervisado suele comenzar con un conjunto de datos establecido y una cierta comprensión de cómo se clasifican esos datos. El aprendizaje supervisado pretende encontrar patrones en los datos que puedan aplicarse a un proceso de análisis. Estos datos tienen características etiquetadas que definen el significado de los datos. Por ejemplo, se puede crear una aplicación de aprendizaje automático que distinga entre millones de animales, basándose en imágenes y descripciones escritas.
El aprendizaje no supervisado
Se utiliza cuando el problema requiere una cantidad masiva de datos no etiquetados. Por ejemplo, las aplicaciones de las redes sociales, como Twitter, Instagram y Snapchat, tienen grandes cantidades de datos sin etiquetar. Entender el significado de estos datos requiere algoritmos que clasifiquen los datos basándose en los patrones o grupos que encuentre.
El aprendizaje no supervisado lleva a cabo un proceso iterativo, analizando los datos sin intervención humana. Se utiliza con la tecnología de detección de spam en el correo electrónico. Hay demasiadas variables en los correos electrónicos legítimos y en los de spam para que un analista pueda etiquetar los correos masivos no solicitados. En su lugar, se aplican clasificadores de aprendizaje automático, basados en la agrupación y la asociación, para identificar el correo electrónico no deseado.
Aprendizaje por refuerzo
El aprendizaje por refuerzo es un modelo de aprendizaje conductual. El algoritmo recibe retroalimentación del análisis de datos, guiando al usuario hacia el mejor resultado. El aprendizaje por refuerzo se diferencia de otros tipos de aprendizaje supervisado, porque el sistema no se entrena con el conjunto de datos de muestra. En cambio, el sistema aprende a través de la prueba y el error. Por lo tanto, una secuencia de decisiones exitosas dará lugar a que el proceso se refuerce, porque resuelve mejor el problema en cuestión.
El aprendizaje profundo
El aprendizaje profundo es un método específico de aprendizaje automático que incorpora redes neuronales en capas sucesivas para aprender de los datos de manera iterativa. El aprendizaje profundo es especialmente útil cuando se trata de aprender patrones a partir de datos no estructurados.
Las redes neuronales complejas de aprendizaje profundo están diseñadas para emular el funcionamiento del cerebro humano, por lo que los ordenadores pueden ser entrenados para hacer frente a abstracciones y problemas poco definidos. El niño medio de cinco años puede reconocer fácilmente la diferencia entre la cara de su profesor y la del guardia de tráfico. En cambio, el ordenador debe hacer mucho trabajo para averiguar quién es quién. Las redes neuronales y el aprendizaje profundo se utilizan a menudo en aplicaciones de reconocimiento de imágenes, habla y visión por ordenador.