El Machine Learning hace que un modelo aprenda a partir del estudio de datos y estadísticas. Puedes utilizar Python para realizar este tipo de modelos
El aprendizaje automático es un paso en la dirección de la inteligencia artificial (IA). Machine Learning es un programa que analiza datos y aprende a predecir el resultado.
¿Dónde empezar?
En este tutorial volveremos a las matemáticas y estudiaremos estadísticas, y cómo calcular números importantes basados en conjuntos de datos.
También aprenderemos a usar varios módulos de Python para obtener los resultados que necesitamos.
Aprenderás a crear funciones que puedan predecir el resultado en función de lo que hemos aprendido.
Data Set
En la mente de una computadora, un conjunto de datos es cualquier colección de datos. Puede ser cualquier cosa, desde una matriz hasta una base de datos completa.
Ejemplo de una matriz:
[99, 86, 87, 88, 111, 86, 103, 87, 94, 78, 77, 85, 86]
Ejemplo de una base de datos:
Nombre_Coche | Color | Años | Velocidad | Automatico_Si_No |
BMW | Rojo | 5 | 99 | Sí |
Volvo | Negro | 7 | 86 | Sí |
VW | Gris | 8 | 87 | No |
VW | Blanco | 7 | 88 | Sí |
Ford | Blanco | 2 | 111 | Sí |
VW | Blanco | 17 | 86 | Sí |
Tesla | Rojo | 2 | 103 | Sí |
BMW | Negro | 9 | 87 | Sí |
Volvo | Gris | 4 | 94 | No |
Ford | Blanco | 11 | 78 | No |
Toyota | Gris | 12 | 77 | No |
VW | Blanco | 9 | 85 | No |
Toyota | Azul | 6 | 86 | Sí |
Al observar la matriz, podemos adivinar que el valor promedio es probablemente alrededor de 80 o 90, y también podemos determinar el valor más alto y el valor más bajo, pero ¿qué más podemos hacer?
Y al mirar la base de datos podemos ver que el color más popular es el blanco y que el automóvil más antiguo tiene 17 años, pero ¿y si pudiéramos predecir si un automóvil tiene el cambio automático o manual con solo mirar los otros valores?
¡Para eso está el machine learning! ¡Analizar datos y predecir el resultado!
En Machine Learning es común trabajar con conjuntos de datos muy grandes. En este tutorial intentaremos que sea lo más fácil posible entender los diferentes conceptos de aprendizaje automático y trabajaremos con pequeños conjuntos de datos fáciles de entender.
Tipos de datos
Para analizar datos, es importante saber qué tipo de datos estamos tratando.
Podemos dividir los tipos de datos en tres categorías principales:
- Numérico
- Categórico
- Ordinal
Los datos numéricos son números y se pueden dividir en dos categorías numéricas:
- Datos discretos: Números que están limitados a enteros. Ejemplo: El número de coches que pasan.
- Datos continuos: Números que tienen un valor infinito. Ejemplo: el precio de un artículo o el tamaño de un artículo.
Los datos categóricos son valores que no se pueden comparar entre sí. Ejemplo: un valor de color, o cualquier valor sí/no.
Los datos ordinales son como datos categóricos, pero se pueden comparar entre sí. Ejemplo: calificaciones escolares donde A es mejor que B y así sucesivamente.
Al conocer el tipo de datos de su fuente de datos, podrá saber qué técnica utilizar al analizarlos.
Aprenderá más sobre estadísticas y análisis de datos en las próximas lecciones.