Sumários
Aprendizagem por Reforço
17 Março 2025, 09:30 • António Jorge Filipe Fonseca
Aprendizagem por Reforço
Aprendizagem Automática e Agentes
Processos Decisão de Markov
Aprendizagem por Reforço versus Planeamento
Modelos do ambiente
Aprendizagem por Reforço Passiva
Aprendizagem por Reforço Ativa
Planeamento Probabilístico
10 Março 2025, 09:30 • António Jorge Filipe Fonseca
Problemas de Planeamento
Planeamento Probabilístico
Resultados Estocásticos
Planeamento Probabilístico/Estocástico
Problemas de decisão sequencial
Porquê o fator de desconto γ ?
Planeamento não clássico
Políticas e planos
Políticas ótimas
Ganhos
Função de valor dos estados
Relação entre V(s) e Q(s,a)
Estimativa de Monte Carlo (MC)
Propriedade fundamental
Programação Dinâmica
Iteração de Valor
Algoritmo da Iteração de Valor
Algoritmo de Iteração de Política
Planeamento Clássico
24 Fevereiro 2025, 09:30 • António Jorge Filipe Fonseca
Tipos de Planeamento
Definição de Planeamento Clássico
Algoritmos para o Planeamento
Heurísticas para o Planeamento
Planeamento Hierárquico
Tempo, horários e recursos
Análise das abordagens do planeamento
Laboratório de Lógica e Planeamento
Arquitecturas de Agentes
17 Fevereiro 2025, 09:30 • António Jorge Filipe Fonseca
Arquiteturas de Agentes
Um pouco de história
Agentes de raciocínio simbólico
Problemas na representação simbólica
Agentes Dedutivos
Mundo dos aspiradores
PROLOG
Agentes Dedutivos
Agentes Reativos
Linguagens comportamentais
Agentes Puramente Reactivos
Arquitetura de Subsumção
Desenvolvimento do agente reativo
Mars Explorer