Sumários

Semana 3

22 Outubro 2024, 18:00 Diana Aldea Mendes


Equação de Bellman. Iteração de valor, iteração de política. Q-learning.

Semana 2

17 Outubro 2024, 19:30 Diana Aldea Mendes


Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).

Semana 2

17 Outubro 2024, 18:00 Diana Aldea Mendes


Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).

Semana 2

15 Outubro 2024, 19:30 Diana Aldea Mendes


Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).

Semana 2

15 Outubro 2024, 18:00 Diana Aldea Mendes


Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).