Explicador en lenguaje claro
RAG, explicado de forma interactiva
¿Qué es la generación aumentada por recuperación (RAG)?
RAG es la forma en que una IA responde a partir de tus documentos en vez de solo su entrenamiento. Cuando haces una pregunta, el sistema busca en tu contenido los pasajes más relevantes, los pega en el context del modelo y le pide que responda usándolos. El modelo nunca memorizó tus datos. Lee el texto recuperado en el momento de responder. Por eso RAG puede citar fuentes y mantenerse al día, y por eso casi todos los fallos de RAG son en realidad fallos de recuperación: si el pasaje correcto no se trajo, el modelo no puede usarlo.
No te quedes en leerlo. Opera tú mismo el mecanismo en una lección interactiva corta.
Míralo funcionar: RAG: la recuperación como retorno a la similitud →Gratis, sin código, sin registro.
Lo que la gente entiende mal
- RAG significa que el modelo se entrenó con tus datos. No es así; lee el texto recuperado en el momento de responder.
- Una respuesta mala de RAG significa un modelo débil. Mucho más a menudo la recuperación se saltó el pasaje correcto.
- RAG reemplaza al fine-tuning. Resuelven cosas distintas: RAG añade conocimiento, el fine-tuning moldea el comportamiento.
Dónde lo ves en productos reales
- Los bots de soporte responden desde un centro de ayuda con RAG.
- Las herramientas internas de 'chatea con tus docs' recuperan de una base de conocimiento privada.
- Los buscadores con IA traen páginas web y luego escriben una respuesta que las cita.
Explicadores relacionados
Parte de See How AI Works, un curso interactivo gratuito, donde aprendes cómo funciona la IA moderna operándola, no viendo videos.