Lexicon Redes Neuronales

Generación aumentada con recuperación (RAG)

Definición breve

La generación aumentada con recuperación (RAG) es una técnica que combina modelos de lenguaje con sistemas de recuperación de información para generar respuestas basadas en conocimiento externo actualizado.

Explicación del concepto

Los modelos de lenguaje tradicionales dependen únicamente de la información aprendida durante el entrenamiento.

RAG introduce un cambio fundamental:

👉 el modelo puede consultar fuentes externas en tiempo de inferencia

Esto permite:

acceder a información actualizada
incorporar conocimiento específico
mejorar la precisión de las respuestas

En lugar de confiar solo en su “memoria interna”, el modelo utiliza una memoria externa.

Cómo funciona

El pipeline de RAG incluye:

Consulta del usuario
Entrada inicial (prompt).
Búsqueda semántica
Se recuperan documentos relevantes mediante embeddings.
Construcción del contexto
Los documentos se integran en el prompt.
Generación de respuesta
El modelo produce una salida informada.

Representación conceptual

$y = f(x, D(x))$ y=f(x,D(x))

Donde:

$x$ x es la consulta
$D(x)$ D(x) es la información recuperada

Componentes clave

1. Sistema de recuperación

búsqueda vectorial
similitud semántica

2. Base de conocimiento

documentos
bases de datos
contenido estructurado

3. Embeddings

representación vectorial del texto
base para la recuperación

4. Modelo generativo

combina contexto y consulta
genera la respuesta final

Tipos de RAG

1. RAG básico

Recuperación simple + generación2. RAG con re-ranking

Ordena resultados por relevancia.

3. RAG multi-hop

Recupera información en múltiples pasos.

4. RAG con memoria

Mantiene contexto a lo largo del tiempo.

Por qué es importante

RAG resuelve limitaciones clave de los LLM:

reduce alucinaciones
mejora precisión factual
permite personalización
evita reentrenamiento constante

Ejemplo conceptual

Un asistente empresarial responde preguntas utilizando:

documentos internos
bases de conocimiento actualizadas

en lugar de depender solo del modelo entrenado.

Ejemplo en PyTorch (conceptual)

			
docs = retriever.search(query_embedding)
context = build_prompt(query, docs)
response = model.generate(context)

Conceptos relacionados

Resumen

La generación aumentada con recuperación (RAG) combina modelos de lenguaje con sistemas de búsqueda para producir respuestas más precisas, actualizadas y contextuales. Es una técnica fundamental en aplicaciones modernas de IA como chatbots, asistentes inteligentes y sistemas de conocimiento empresarial.