Sumários

Open AI Gymnasium

24 Março 2025, 09:30 António Jorge Filipe Fonseca


Tutorial Gymnasium

Aprendizagem por Reforço

17 Março 2025, 09:30 António Jorge Filipe Fonseca


Aprendizagem por Reforço
Aprendizagem Automática e Agentes
Processos Decisão de Markov
Aprendizagem por Reforço versus Planeamento
Modelos do ambiente
Aprendizagem por Reforço Passiva
Aprendizagem por Reforço Ativa

Planeamento Probabilístico

10 Março 2025, 09:30 António Jorge Filipe Fonseca


Problemas de Planeamento
Planeamento Probabilístico
Resultados Estocásticos
Planeamento Probabilístico/Estocástico
Problemas de decisão sequencial
Porquê o fator de desconto γ ?
Planeamento não clássico
Políticas e planos
Políticas ótimas
Ganhos
Função de valor dos estados
Relação entre V(s) e Q(s,a)
Estimativa de Monte Carlo (MC)
Propriedade fundamental
Programação Dinâmica
Iteração de Valor
Algoritmo da Iteração de Valor
Algoritmo de Iteração de Política

Planeamento Clássico

24 Fevereiro 2025, 09:30 António Jorge Filipe Fonseca


Tipos de Planeamento
Definição de Planeamento Clássico 
Algoritmos para o Planeamento 
Heurísticas para o Planeamento 
Planeamento Hierárquico 
Tempo, horários e recursos 
Análise das abordagens do planeamento
Laboratório de Lógica e Planeamento

Arquitecturas de Agentes

17 Fevereiro 2025, 09:30 António Jorge Filipe Fonseca


Arquiteturas de Agentes
Um pouco de história
Agentes de raciocínio simbólico
Problemas na representação simbólica
Agentes Dedutivos
Mundo dos aspiradores
PROLOG
Agentes Dedutivos
Agentes Reativos
Linguagens comportamentais
Agentes Puramente Reactivos
Arquitetura de Subsumção
Desenvolvimento do agente reativo
Mars Explorer