Sumários

Aula 20 - Laboratorial

5 Dezembro 2025, 19:30 Jorge Miguel Cruz Pereira Varelas da Rocha


Implementação em Python de um "gridworld" com dois estados terminais para o qual se determinou a função de valor satisfazendo as equações de Bellman, sem fator de desconto, e seguindo uma política equiprovável. Determinação da política melhorada e da função de valor correspondente.

Aula 19 - Laboratorial

5 Dezembro 2025, 18:00 Jorge Miguel Cruz Pereira Varelas da Rocha


Implementação das equações de Bellman em Python, convertendo-as numa relação de recorrência. Iterações de melhoramento de políticas.

Aula 20 - Laboratorial

5 Dezembro 2025, 11:00 Jorge Miguel Cruz Pereira Varelas da Rocha


Implementação em Python de um "gridworld" com dois estados terminais para o qual se determinou a função de valor satisfazendo as equações de Bellman, sem fator de desconto, e seguindo uma política equiprovável. Determinação da política melhorada e da função de valor correspondente.

Aula 19 - Laboratorial

5 Dezembro 2025, 09:30 Jorge Miguel Cruz Pereira Varelas da Rocha


Implementação das equações de Bellman em Python, convertendo-as numa relação de recorrência. Iterações de melhoramento de políticas.

Aula 18

4 Dezembro 2025, 15:30 Jorge Miguel Cruz Pereira Varelas da Rocha


Introdução à Programação Dinâmica. Equações de Bellman e exemplos de aplicação. Condição de Bellman para a política optimal.