Sumários
Semana 3
22 Outubro 2024, 18:00 • Diana Aldea Mendes
Equação de Bellman. Iteração de valor, iteração de política. Q-learning.
Semana 2
17 Outubro 2024, 19:30 • Diana Aldea Mendes
Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).
Semana 2
17 Outubro 2024, 18:00 • Diana Aldea Mendes
Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).
Semana 2
15 Outubro 2024, 19:30 • Diana Aldea Mendes
Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).
Semana 2
15 Outubro 2024, 18:00 • Diana Aldea Mendes
Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).