Sumários
Semana 2
17 Outubro 2024, 18:00 • Diana Aldea Mendes
Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).
Semana 2
15 Outubro 2024, 19:30 • Diana Aldea Mendes
Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).
Semana 2
15 Outubro 2024, 18:00 • Diana Aldea Mendes
Ambiente, agentes, ações, estados, recompensa, função valor. Formalismo matemátivo do problema de RL: processo de decisão de Markov (MDP).