Sumários
Aula 20 - Laboratorial
5 Dezembro 2025, 19:30 • Jorge Miguel Cruz Pereira Varelas da Rocha
Implementação em Python de um "gridworld" com dois estados terminais para o qual se determinou a função de valor satisfazendo as equações de Bellman, sem fator de desconto, e seguindo uma política equiprovável. Determinação da política melhorada e da função de valor correspondente.
Aula 19 - Laboratorial
5 Dezembro 2025, 18:00 • Jorge Miguel Cruz Pereira Varelas da Rocha
Implementação das equações de Bellman em Python, convertendo-as numa relação de recorrência. Iterações de melhoramento de políticas.
Aula 20 - Laboratorial
5 Dezembro 2025, 11:00 • Jorge Miguel Cruz Pereira Varelas da Rocha
Implementação em Python de um "gridworld" com dois estados terminais para o qual se determinou a função de valor satisfazendo as equações de Bellman, sem fator de desconto, e seguindo uma política equiprovável. Determinação da política melhorada e da função de valor correspondente.
Aula 19 - Laboratorial
5 Dezembro 2025, 09:30 • Jorge Miguel Cruz Pereira Varelas da Rocha
Implementação das equações de Bellman em Python, convertendo-as numa relação de recorrência. Iterações de melhoramento de políticas.
Aula 18
4 Dezembro 2025, 15:30 • Jorge Miguel Cruz Pereira Varelas da Rocha
Introdução à Programação Dinâmica. Equações de Bellman e exemplos de aplicação. Condição de Bellman para a política optimal.