Sumários

Open AI Gymnasium

24 Março 2025, 09:30 • António Jorge Filipe Fonseca

Tutorial Gymnasium

Aprendizagem por Reforço

17 Março 2025, 09:30 • António Jorge Filipe Fonseca

Aprendizagem por Reforço

Aprendizagem Automática e Agentes

Processos Decisão de Markov

Aprendizagem por Reforço versus Planeamento

Modelos do ambiente

Aprendizagem por Reforço Passiva

Aprendizagem por Reforço Ativa

Planeamento Probabilístico

10 Março 2025, 09:30 • António Jorge Filipe Fonseca

Problemas de Planeamento

Planeamento Probabilístico

Resultados Estocásticos

Planeamento Probabilístico/Estocástico

Problemas de decisão sequencial

Porquê o fator de desconto γ ?

Planeamento não clássico

Políticas e planos

Políticas ótimas

Ganhos

Função de valor dos estados

Relação entre V(s) e Q(s,a)

Estimativa de Monte Carlo (MC)

Propriedade fundamental

Programação Dinâmica

Iteração de Valor

Algoritmo da Iteração de Valor

Algoritmo de Iteração de Política

Planeamento Clássico

24 Fevereiro 2025, 09:30 • António Jorge Filipe Fonseca

Tipos de Planeamento

Definição de Planeamento Clássico

Algoritmos para o Planeamento

Heurísticas para o Planeamento

Planeamento Hierárquico

Tempo, horários e recursos

Análise das abordagens do planeamento

Laboratório de Lógica e Planeamento

Arquitecturas de Agentes

17 Fevereiro 2025, 09:30 • António Jorge Filipe Fonseca

Arquiteturas de Agentes

Um pouco de história

Agentes de raciocínio simbólico

Problemas na representação simbólica

Agentes Dedutivos

Mundo dos aspiradores

PROLOG

Agentes Dedutivos

Agentes Reativos

Linguagens comportamentais

Agentes Puramente Reactivos

Arquitetura de Subsumção

Desenvolvimento do agente reativo

Mars Explorer