Currículo
Otimização de Estratégias Orientada por Dados OEOD
Contextos
Groupo: Ciência de Dados - 2023 > 2º Ciclo > Parte Escolar > Tronco Comum
ECTS
6.0 (para cálculo da média)
Objectivos
OA1. Compreender a tomada de decisão dirigida por dados OA2. Conhecer algoritmos de otimização dinâmica e de aprendizagem reforçada e sua utilização adequada OA3. Aplicar e avaliar os algoritmos de aprendizagem reforçado para situações reais OA4. Adiquirir novos conhecimentos em Python
Programa
1. Estratégias orientadas por dados e sua implementação numa empresa/organização 2. Revisão de conceitos base de estatística 3. Processos de Markov, Otimização dinâmica e Equação de Bellman 4. Ambiente, agentes, estratégias, ações, ganhos e perdas, aprendizagem baseada na experiência 5. Algoritmos de Aprendizagem Reforçada: Q-learning, Multi-Armed Bandits, value and Policy Iteration 6. Exemplos e casos de estudo
Método de Avaliação
A avaliação da primeira época pode ser uma das duas possibilidades: 1. Avaliação ao longo do semestre, que consta em: a). Quiz individual no meio-semestre 20% da nota final (min. 10 valores) b). Trabalho de grupo /projeto com apresentação oral individual, 80% (70%+10%) da nota final (min. 10 valores) 2). Trabalho individual (100% da nota final) (min. 10 valores). A avaliação da segunda época consta num trabalho individual (100% da nota final) (min. 10 valores).
Carga Horária
Carga Horária de Contacto -
Trabalho Autónomo - 125.0
Carga Total -
Bibliografia
Principal
- (1). Diana Mendes, (2024), Slides e Notebooks (Moodle) (2). Richard S. Sutton and Andrew G. Barto, (2018), Reinforcement Learning. An Introduction, The MIT Press. (3). Osborne, P., Singh, K., Taylor, M., (2022), Applying Reinforcement Learning on Real-World Data with Practical Examples in Python, Springer.:
Secundária
- (1). Enes Bilgin, (2020), Mastering Reinforcement Learning with Python, Packt. (2). Chan, L., Hogaboam, L., Cao, R., (2022), Applied Artificial Intelligence in Business, Springer.: