Ficha Unidade Curricular (FUC)

Informação Geral / General Information

Código :

05234

Acrónimo :

05234

Ciclo :

2.º ciclo

Língua(s) de Ensino :

Português (pt)

Língua(s) amigável(eis) :

Carga Horária / Course Load

Semestre :

Créditos ECTS :

6.0

Aula Teórica (T) :

0.0h/sem

Aula Teórico-Prática (TP) :

24.0h/sem

- Síncrono à distância (TP) :

8.0h/sem

- Assíncrono à distância (TP) :

16.0h/sem

Aula Prática e Laboratorial (PL) :

0.0h/sem

Trabalho de Campo (TC) :

0.0h/sem

Seminario (S) :

0.0h/sem

Estágio (E) :

0.0h/sem

Orientação Tutorial (OT) :

1.0h/sem

- Síncrono à distância (OT) :

1.0h/sem

Outras (O) :

0.0h/sem

Horas de Contacto :

25.0h/sem

Trabalho Autónomo :

125.0

Horas de Trabalho Total :

150.0h/sem

Área científica / Scientific area

480 - Informática

Departamento / Department

Departamento de Tecnologias Digitais

Ano letivo / Execution Year

2025/2026

Pré-requisitos / Pre-Requisites

É esperado que os estudantes tenham alguns conhecimentos de: - Programação; - Aprendizagem Automática Supervisionada; - Processamento de Linguagem Natural

Objetivos Gerais / Objectives

A Unidade Curricular (UC) Técnicas Avançadas para Modelos de Linguagem tem como objetivo dotar os estudantes de competências avançadas no estudo, implementação e avaliação de modelos de linguagem de última geração, explorando arquiteturas modernas, técnicas de treino contemporâneas e metodologias robustas de avaliação. A UC aprofunda conceitos fundamentais da engenharia de LLMs, recorrendo a modelos open-source amplamente utilizados na comunidade, permitindo um contacto direto com pipelines reais de fine-tuning, alinhamento e inferência otimizada. Pretende-se ainda desenvolver competências críticas sobre segurança, limitações, governança e alinhamento internacional, incentivando a capacidade de análise ética e responsável na criação e aplicação de sistemas baseados em modelos de linguagem. A UC procura garantir uma formação aplicada, com forte foco em implementação prática, com atividades síncronas e assíncronas orientadas para o desenvolvimento autónomo e colaborativo.

Objetivos de Aprendizagem e a sua compatibilidade com o método de ensino (conhecimentos, aptidões e competências a desenvolver pelos estudantes) / Learning outcomes

No final da UC, o estudante deve ser capaz de: OA1. Analisar e explicar arquiteturas avançadas de LLMs, incluindo Transformers modernos, Mixture-of-Experts e modelos multimodais. OA2. Implementar técnicas contemporâneas de treino e alinhamento, tais como SFT, RLHF, DPO, RLAIF e métodos de self-improvement. OA3. Utilizar modelos open-source de última geração (LLaMA, Mistral, Qwen) para construir pipelines completos de pré-processamento, fine-tuning e inferência. OA4. Avaliar modelos com métricas apropriadas (perplexidade, robustez, diversidade) e suites de avaliação avançada. OA5. Diagnosticar limitações, identificar riscos e aplicar boas práticas de segurança, alignment e governança internacional. OA6. Desenvolver soluções práticas baseadas em LLMs que respondam a desafios reais, integrando conhecimento técnico com pensamento crítico e ético.

Conteúdos Programáticos / Syllabus

CP1: Arquiteturas modernas de LLMs, tais como Transformers; Mixture-of-Experts; arquiteturas multimodais; trade-offs entre performance, custo e escalabilidade. CP2: Técnicas avançadas de treino e alinhamento: SFT; Reinforcement Learning from Human Feedback (RLHF); Direct Preference Optimization (DPO); RLAIF; self-improvement e reflexão iterativa. CP3: Avaliação da performance dos modelos: Perplexidade; robustness testing; adversarial evaluation; evaluation suites (MMLU, MT-Bench, TruthfulQA, etc.). CP4: Pipelines com modelos open-source (LLaMA, Mistral, Qwen; LoRA/QLoRA); quantização; CP5: Segurança, limitações e alignment internacional: Taxonomias de riscos; mitigação de alucinações; alignment internacional (OECD, NIST, AI Act, UNESCO); governança e documentação.

Demonstração da coerência dos conteúdos programáticos com os objetivos de aprendizagem da UC / Evidence that the curricular unit's content dovetails with the specified learning outcomes

O CP1 suporta diretamente o OA1, ao introduzir e analisar arquiteturas avançadas de LLMs e componentes essenciais para compreender o estado da arte. O CP2 relaciona-se com o OA2, permitindo o domínio das técnicas modernas de treino e alinhamento que definem o desempenho dos modelos contemporâneos. O CP3 contribui para o OA4, fornecendo métodos robustos de avaliação e métricas adequadas para análise comparativa de modelos. O CP4 suporta o OA3 e o OA6, ao permitir que os estudantes desenvolvam pipelines completos utilizando modelos reais e técnicas práticas de fine-tuning e otimização. O CP5 dá resposta ao OA5, aprofundando limitações, riscos e práticas de segurança e alignment internacional. A integração de todos os CPs reforça o OA6, permitindo a criação de soluções aplicadas e críticas no domínio dos LLMs.

Avaliação / Assessment

Nesta UC, e devido ao seu caráter eminentemente prático, apenas é possível obter aprovação por avaliação ao longo do semestre, não sendo contemplada a modalidade de avaliação por exame. A avaliação consiste em 3 componentes: 1. Mini-trabalho 1 (30%): Implementação de um exercício orientado de pré-treino parcial com arquiteturas modernas de LLMs. 2. Mini-trabalho 2 (30%): Aplicação prática de RLHF, DPO ou RLAIF num modelo open-source, e análise de performance com métricas. 3. Projeto Final (40%): Construção de uma solução avançada baseada em LLMs que integre uma ou mais técnicas exploradas na UC. A avaliação inclui código, relatório técnico e apresentação oral. Para aprovação é necessária uma classificação final mínima de 10 valores, considerando a ponderação das três componentes. Em caso de reprovação, o estudante deverá repetir a UC no ano letivo seguinte. A 1.ª e 2.ª épocas servem apenas para agendamento formal de apresentações ou entregas. A presença nas aulas não é obrigatória, mas recomenda-se fortemente a participação ativa nas sessões síncronas devido ao caráter avançado dos conteúdos. Aplicam-se o RGACC, o REEE e o Código de Conduta Académica.

Metodologias de Ensino / Teaching methodologies

A UC adota uma abordagem centrada no estudante e alinhada com o modelo pedagógico do ensino a distância, combinando momentos síncronos e assíncronos para maximizar flexibilidade, autonomia e profundidade de aprendizagem. As sessões síncronas online apresentam e discutem conceitos avançados sobre arquiteturas modernas, técnicas de treino e alinhamento, promovendo um ambiente interativo onde os estudantes colocam questões e exploram diferentes perspetivas. Em paralelo, os materiais assíncronos, vídeos, notebooks configurados, tutoriais técnicos e leituras curadas, permitem ao estudante aprofundar os temas ao seu ritmo, reforçando a autonomia e a capacidade de autoaprendizagem. A aprendizagem baseada em tarefas é estruturada através de pequenos desafios que envolvem a experimentação prática com modelos open-source, pipelines reais de fine-tuning, análise de métricas e execução de benchmarks, permitindo consolidar gradualmente os conteúdos apresentados. A aprendizagem baseada em projetos assume particular relevância, culminando no desenvolvimento de um mini-projeto aplicado, orientado para a construção de uma solução baseada em LLMs. Esta componente fomenta o pensamento crítico, a capacidade de resolução de problemas e a integração de técnicas avançadas. Os fóruns de discussão e espaços colaborativos servem como suporte contínuo, promovendo o debate, a partilha de dificuldades e a construção coletiva do conhecimento. O docente garante acompanhamento próximo, fornecendo feedback formativo e orientado para a melhoria contínua. Assim, a metodologia combina rigor técnico, flexibilidade pedagógica e forte orientação prática, assegurando uma aprendizagem profunda e alinhada com os objetivos da UC.

Demonstração da coerência das metodologias de ensino e avaliação com os objetivos de aprendizagem da UC / Evidence that the teaching and assessment methodologies are appropriate for the learning outcomes

As metodologias de ensino adotadas articulam-se de forma direta e fundamentada com os objetivos de aprendizagem definidos para a UC, assegurando que cada atividade, recurso e abordagem pedagógica contribui para o desenvolvimento das competências previstas. A componente síncrona online, estruturada em sessões interativas centradas na apresentação, decomposição e discussão de arquiteturas modernas de modelos de linguagem, promove a concretização do OA1, permitindo aos estudantes compreenderem o funcionamento dos Transformers contemporâneos, dos sistemas Mixture-of-Experts e dos modelos multimodais. As atividades assíncronas, compostas por tutoriais técnicos, notebooks preparados, exercícios orientados e desafios incrementais, dão suporte ao OA2 e OA3, permitindo a experimentação autónoma e progressiva de técnicas de treino e alinhamento. A implementação prática de SFT, RLHF, DPO e RLAIF, bem como a construção de pipelines reais com modelos open-source como LLaMA, Mistral ou Qwen, garante que o estudante adquire competências operacionais essenciais para atuar em contextos profissionais de engenharia de LLMs. Os mini-trabalhos orientados para avaliação rigorosa de modelos, com recurso a métricas como perplexidade, robustness testing e suites como MT-Bench ou MMLU, asseguram o cumprimento do OA4. Estas metodologias reforçam a capacidade analítica e o pensamento crítico, permitindo ao estudante não só aplicar métricas, mas também interpretar resultados, reconhecer limitações e propor melhorias técnicas. O OA5, focado em limitações, segurança e alignment internacional, é concretizado através de momentos de debate orientado, análise crítica de guidelines internacionais (AI Act, OECD, NIST, UNESCO) e estudo de casos reais de riscos, enviesamentos e alucinações. Por fim, o OA6 é plenamente operacionalizado no Projeto Final, que integra todas as metodologias anteriores numa componente prática complexa. Esta etapa consolidada permite ao estudante demonstrar autonomia na conceção e implementação de soluções avançadas baseadas em LLMs, mobilizando conhecimentos sobre arquiteturas, treino, alinhamento, avaliação, segurança e implantação. O acompanhamento do docente, através de feedback contínuo, reforça a aprendizagem iterativa e a capacidade de justificar decisões técnicas. Desta forma, a combinação equilibrada entre sessões síncronas interativas, conteúdos assíncronos estruturados, tarefas práticas orientadas, mini-trabalhos aplicados e projeto final garante uma forte coerência pedagógica com os objetivos definidos. O modelo EaD adotado não só reforça a flexibilidade e autonomia, como também potencia a aprendizagem ativa, colaborativa e prática, assegurando que cada estudante desenvolve as competências críticas e avançadas necessárias ao domínio técnico e ético dos modelos de linguagem modernos.

Observações / Observations

Bibliografia Principal / Main Bibliography

1. Burkov, A. (2025). The hundred-page language models book. True Positive. 2. Elixir, C. (2025). Mastering open source LLMs: Customize, deploy, and fine-tune LLaMA, Mistral. 3. Alammar, J., & Grootendorst, M. (2024). Hands-on large language models: Language understanding and generation. O’Reilly Media.

Bibliografia Secundária / Secondary Bibliography

Data da última atualização / Last Update Date

2026-05-18