Entorno

Definición breve

El entorno es el sistema o contexto en el que un agente interactúa, toma decisiones y recibe retroalimentación en forma de recompensas.

Explicación del concepto

En aprendizaje por refuerzo, el entorno representa todo aquello con lo que el agente interactúa.

Incluye:

  • el estado actual del sistema
  • las reglas del mundo
  • las respuestas a las acciones del agente

El entorno define:

👉 qué puede hacer el agente y qué consecuencias tienen sus acciones

Es una parte fundamental del ciclo de aprendizaje.

Cómo funciona

El proceso de interacción entre agente y entorno incluye:

  1. El agente observa el estado del entorno.
  2. El agente selecciona una acción.
  3. El entorno responde con:
    • un nuevo estado
    • una recompensa
  4. El ciclo se repite continuamente.

Este bucle permite al agente aprender de la experiencia.

Fórmula conceptual

st+1,rt=E(st,at)s_{t+1}, r_t = E(s_t, a_t)st+1​,rt​=E(st​,at​)

Donde:

  • sts_tst​ es el estado actual
  • ata_tat​ es la acción
  • st+1s_{t+1}st+1​ es el nuevo estado
  • rtr_trt​ es la recompensa

Tipos de entornos

1. Deterministas

Las acciones producen siempre el mismo resultado.

2. Estocásticos

Las acciones pueden tener resultados variables.

3. Observables

El agente puede ver completamente el estado

4. Parcialmente observables

El agente solo ve parte del estado.

Por qué es importante

El entorno define el contexto del aprendizaje.

Impacta en:

  • comportamiento del agente
  • complejidad del problema
  • tipo de algoritmo utilizado
  • capacidad de generalización

Ejemplo conceptual

En un videojuego:

  • el agente es el jugador
  • el entorno es el mundo del juego
  • las acciones afectan el estado del juego

Ejemplo en PyTorch

Interacción básica con un entorno:

next_state, reward = environment.step(action)

Conceptos relacionados

Resumen

El entorno es el sistema en el que un agente interactúa y aprende mediante acciones y recompensas. Es un componente esencial en el aprendizaje por refuerzo, ya que define las reglas y condiciones del proceso de aprendizaje.