Introducción
Este curso proporciona a profesionales y equipos técnicos las competencias para explotar herramientas de IA generativa y modelos modernos con el fin de analizar datos de múltiples formatos: desde datos tabulares o JSON hasta datos no estructurados como texto, imágenes, audio o vídeo. El enfoque es práctico: se enseña a usar soluciones reales hoy en día — como asistentes conversacionales, modelos de visión, audio o vídeo — integrándolas en pipelines de análisis de datos. El objetivo es que la empresa pueda extraer insight, automatizar tareas de análisis y enriquecer sus capacidades de inteligencia de negocio con IA.
Objetivos
Al completar el curso, los participantes podrán:
- Utilizar herramientas de IA generativa (asistentes LLM, modelos multimodales, generadores/analizadores de audio) para procesar y analizar datos de diversos formatos.
- Generar código automáticamente (por ejemplo en Python) para análisis de datos tabulados o semiestructurados con ayuda de modelos de lenguaje.
- Emplear modelos de visión, audio o vídeo para extraer información de contenido multimedia (imágenes, vídeos, audio).
- Combinar resultados de distintos tipos de datos (tabular, texto, imagen, audio, vídeo) en análisis integrados.
- Crear pipelines reproducibles que integren preprocesado, análisis con IA, y presentación de resultados.
- Interpretar y comunicar insights de forma clara, usando resultados generados por IA.
Índice de Contenidos
Módulo 1 — Panorama y fundamentos de IA generativa aplicada a datos
- Qué es la IA generativa y modelos multimodales.
- Principales herramientas: asistentes LLM, plataformas de modelos (visión, audio, vídeo).
- Ventajas y retos de usar IA generativa para análisis de datos.
Módulo 2 — Uso de LLMs para análisis de datos tabulares y JSON
- Cómo pedir a asistentes basados en LLM (por ejemplo, un chatbot) que generen código Python para análisis de DataFrames o JSON.
- Buenas prácticas para prompt-engineering orientado a generación de scripts de análisis.
- Automatización de consultas, agrupaciones, agregaciones, limpieza y transformación de datos.
Módulo 3 — Procesamiento de texto con IA generativa
- Uso de LLMs para análisis de texto: extracción de entidades, clasificación, resumen, insights.
- Técnicas de prompt: prompts para análisis de grandes volúmenes de texto, generación de reportes narrativos.
- Integración con datos tabulares: enriquecer análisis con datos estructurados + resultados de texto.
Módulo 4 — Modelos para visión, imagen y vídeo
- Introducción a plataformas de modelos (por ejemplo Hugging Face) para visión por IA: reconocimiento de objetos, análisis de imágenes.
- Cómo aplicar modelos de visión para analizar catálogos de imágenes, extraer metadatos, clasificaciones, etiquetas.
- Uso de modelos multimodales/LLMs que aceptan entradas de imagen (o vídeo) + texto para generar análisis. (Contexto: modelos de tipo LLM multimodal)
- Procesamiento de vídeo: extracción de frames, análisis visual + temporal, resumen de contenido audiovisual.
Módulo 5 — Procesamiento y análisis de audio
- Uso de herramientas de IA para análisis o generación de audio (por ejemplo ElevenLabs como referencia de tecnología de audio generativa)
- Transcripción automática, análisis de contenido, clasificación, generación de metadata.
- Integración de audio con texto o datos estructurados: por ejemplo, etiquetas de audio + datos tabulados para análisis combinados.
Módulo 6 — Integración multimodal: pipelines de análisis combinados
- Diseño de flujos de trabajo que integran varios tipos de datos: tabular + texto + imagen/audio/vídeo.
- Uso de APIs y herramientas para orquestar el flujo: ingestión, preprocesado, análisis, agregación de resultados.
- Buenas prácticas: reproducibilidad, documentación, modularidad.
Módulo 7 — Interpretación y presentación de resultados generados por IA
- Análisis de salidas de IA: cómo validar resultados, detectar errores o sesgos.
- Visualización y reporting combinado (tabular, texto, multimedia) — cómo presentar insights extraídos de múltiples fuentes.
- Consideraciones éticas y de privacidad al trabajar con datos sensibles o multimedia.