Descripción del curso
Las bases de datos vectoriales son una pieza clave en el desarrollo de soluciones basadas en modelos de lenguaje (LLMs), ya que permiten realizar búsquedas semánticas eficientes sobre representaciones vectorizadas de texto, imágenes o código. Estas tecnologías son fundamentales para arquitecturas de recuperación aumentada (RAG), donde los modelos acceden a datos externos para generar respuestas más precisas y contextualizadas. Este curso ofrece una formación integral en las principales bases vectoriales del mercado (Pinecone, FAISS, pgvector, MongoDB, Elasticsearch) y su integración con LLMs para construir soluciones RAG reales.
Objetivos
-
Comprender los fundamentos de las bases de datos vectoriales y su papel en la IA moderna.
-
Generar representaciones vectoriales (embeddings) de texto utilizando APIs y modelos preentrenados.
-
Implementar consultas semánticas y búsquedas de similitud en bases de datos vectoriales.
-
Diseñar e implementar una arquitectura RAG que conecte un LLM con una fuente de conocimiento.
-
Integrar LLMs con bases vectoriales (como FAISS, Chroma, Pinecone o pgvector) mediante LangChain o LlamaIndex.
-
Evaluar el rendimiento, relevancia y coste de un sistema de recuperación aumentada.
-
Desplegar un prototipo funcional de asistente inteligente con memoria y conocimiento propio.
Metodología
- Formación 100% práctica, basada en la construcción progresiva de un proyecto real de RAG.
- Cada módulo incluye laboratorios con código Python, ejecución en entornos como Google Colab o VS Code, e integración con APIs de OpenAI, Hugging Face o Azure OpenAI.
- El enfoque combina teoría aplicada y ejercicios de implementación guiados paso a paso.