Sumários
Semana 2 Aula 2
26 Setembro 2023, 19:30 • Diana Aldea Mendes
MDP - Markov Decision process
Função valor (utilidade), Função Q
Semana 2 Aula 1
26 Setembro 2023, 18:00 • Diana Aldea Mendes
Ambiente, Agentes, Estados, Ações, Recompensa