Definición breve
El entorno es el sistema o contexto en el que un agente interactúa, toma decisiones y recibe retroalimentación en forma de recompensas.
Explicación del concepto
En aprendizaje por refuerzo, el entorno representa todo aquello con lo que el agente interactúa.
Incluye:
- el estado actual del sistema
- las reglas del mundo
- las respuestas a las acciones del agente
El entorno define:
👉 qué puede hacer el agente y qué consecuencias tienen sus acciones
Es una parte fundamental del ciclo de aprendizaje.
Cómo funciona
El proceso de interacción entre agente y entorno incluye:
- El agente observa el estado del entorno.
- El agente selecciona una acción.
- El entorno responde con:
- un nuevo estado
- una recompensa
- El ciclo se repite continuamente.
Este bucle permite al agente aprender de la experiencia.
Fórmula conceptual
st+1,rt=E(st,at)
Donde:
- st es el estado actual
- at es la acción
- st+1 es el nuevo estado
- rt es la recompensa
Tipos de entornos
1. Deterministas
Las acciones producen siempre el mismo resultado.
2. Estocásticos
Las acciones pueden tener resultados variables.
3. Observables
El agente puede ver completamente el estado
4. Parcialmente observables
El agente solo ve parte del estado.
Por qué es importante
El entorno define el contexto del aprendizaje.
Impacta en:
- comportamiento del agente
- complejidad del problema
- tipo de algoritmo utilizado
- capacidad de generalización
Ejemplo conceptual
En un videojuego:
- el agente es el jugador
- el entorno es el mundo del juego
- las acciones afectan el estado del juego
Ejemplo en PyTorch
Interacción básica con un entorno:
next_state, reward = environment.step(action)
Conceptos relacionados
Resumen
El entorno es el sistema en el que un agente interactúa y aprende mediante acciones y recompensas. Es un componente esencial en el aprendizaje por refuerzo, ya que define las reglas y condiciones del proceso de aprendizaje.