Sumários
Aula 20 - Prático-Laboratorial
9 Dezembro 2024, 14:30 • Jorge Miguel da Rocha
Programação dinâmica: melhoramento e iteração de políticas.
Aula 19 - Prático-Laboratorial
9 Dezembro 2024, 13:00 • Jorge Miguel da Rocha
Programação dinâmica: métodos iterativos para a avaliação do valor políticas.
Aula 18
2 Dezembro 2024, 14:30 • Jorge Miguel da Rocha
Processos de decisão Markovianos: Relação recursiva para o retorno descontado. Equação de Bellman para a função de valor. Política optimal e a condição de optimalidade de Bellman.
Aula 17
2 Dezembro 2024, 13:00 • Jorge Miguel da Rocha
Introdução à Aprendizagem por Reforço. Características principais e utilidade. Processos de Markov. Reforço através de recompensas. Retorno descontado.
Aula 16 - Prático-Laboratorial
25 Novembro 2024, 14:30 • Jorge Miguel da Rocha