Introducción
Este curso tiene como objetivo equipar a los participantes con un entendimiento sólido de los principios del aprendizaje automático (supervisado y no supervisado), su evaluación y puesta en práctica con código Python; así como enseñar a usar ChatGPT como asistente para acelerar prototipos, generar explicaciones, revisar código, explorar ideas o documentación. El enfoque combina teoría de ML + hands-on en Python + uso pragmático de IA conversacional para facilitar el aprendizaje, la experimentación y la productividad.
Objetivos
Al finalizar el curso, los participantes podrán:
- Comprender los fundamentos teóricos de Machine Learning: tipos de aprendizaje, algoritmos, evaluación, validación, sobreajuste, generalización.
- Implementar en Python modelos ML básicos y avanzados (regresión, clasificación, clustering, árboles, etc.), usando bibliotecas estándar.
- Evaluar, comparar y seleccionar modelos conforme a criterios de métrica, validación y generalización.
- Usar ChatGPT como herramienta de soporte: ayuda para escribir y corregir código, comprensión de conceptos, generación de ideas de transformación de datos, ejemplos de uso, documentación automática, debugging.
- Integrar buenas prácticas de desarrollo reproducible: estructura de código, modularidad, manejo de datos, documentación.
- Aplicar lo aprendido a datos reales (empresariales, de negocio, operativos), obteniendo resultados interpretables y útiles para la organización.
Índice de Contenidos
Módulo 1: Fundamentos de Machine Learning
- Qué es Machine Learning: definición, tipos (supervisado, no supervisado, semisupervisado).
- Flujo del ML: obtención de datos, preprocesado, entrenamiento, evaluación, despliegue.
- Métricas de evaluación: precisión, recall, F1, error, R², validación cruzada, sobreajuste / regularización.
- Preprocesado de datos: limpieza, normalización/estandarización, tratamiento de valores perdidos, codificación de variables categóricas.
Módulo 2: Entorno Python y librerías esenciales
- Configuración del entorno: Python, Jupyter Notebook / IDE, gestión de entornos virtuales.
- Librerías clave: NumPy, pandas, Matplotlib / Seaborn.
- Estructura de datos, manipulación y visualización de datos.
- Exploración de datos (EDA – Exploratory Data Analysis), detección de outliers, análisis exploratorio.
Módulo 3: Modelos supervisados – regresión y clasificación
- Regresión lineal y regresión logística: teoría, hipótesis, estimación, interpretación de coeficientes.
- Árboles de decisión, bosques aleatorios (Random Forest), K-Nearest Neighbors, Support Vector Machines — teoría básica, ventajas/desventajas, cuándo usar cada algoritmo.
- Validación de modelos: entrenamiento/test, validación cruzada, ajuste de hiperparámetros.
- Métricas concretas de evaluación según tipo de problema (regresión vs clasificación).
Módulo 4: Modelos no supervisados y clustering / reducción de dimensionalidad
- Clustering: K-Means, DBSCAN, clustering jerárquico — fundamentos, aplicación, visualización de clusters.
- Análisis de componentes principales (PCA) y otras técnicas de reducción de dimensionalidad.
- Escenarios de uso: segmentación de clientes, análisis exploratorio, detección de patrones, análisis de outliers.
Módulo 5: Uso de ChatGPT como asistente en el ciclo ML
- Cómo utilizar ChatGPT para generar y revisar código: transformación de ideas en código Python, boilerplate, docstrings, snippets de preprocesado.
- Usar ChatGPT para interpretar resultados, generar explicaciones de modelos, documentar decisiones.
- ChatGPT como ayuda en exploración de datos: ideas para feature engineering, limpieza, visualización, preguntas de negocio ↔ ML.
- Buenas prácticas cuando se usa IA: verificación, revisión crítica, validación de resultados, no depender ciegamente, ética y calidad de resultados.
Módulo 6: Buenas prácticas, mantenimiento y puesta en producción sencilla
- Organización de proyectos ML: estructura de carpetas, modularización, control de versiones.
- Reproducibilidad: random seed, pipelines, documentación, tests.
- Introducción a técnicas de persistencia de modelos y serialización (guardar / cargar modelos).
- Consideraciones de interpretación, sesgos, calidad de datos.
Módulo 7: Aplicación práctica — Casos reales en contexto empresarial
- Traducción de un problema de negocio a un problema ML: planteamiento, objetivos, métricas de éxito.
- Pipeline completo: datos → preprocesado → modelado → evaluación → interpretación.
- Uso de ChatGPT como asistente en todo el pipeline: desde idea hasta código y documentación.
- Análisis y presentación de resultados: cómo comunicar hallazgos a stakeholders no técnicos.