Sumários

Avaliação

17 Março 2026, 09:00 Ana Catarina dos Santos Martins


Realização do 1º mini-teste.

Modelos Vetoriais e Modelação de Tópicos

10 Março 2026, 14:00 Ana Catarina dos Santos Martins


Distância vetoriais;
Modelação de tópicos;
SVD, NMF, SVD truncado.

Introdução a representações vetoriais ou Feature Engineering e métodos de filtragem da informação

10 Março 2026, 09:00 Ana Catarina dos Santos Martins


- Introdução a representações vetoriais, nomeadamente, binária e bag of words;
- Introdução às estruturas de dados índice invertido e posicional;
- Processamento de Queries simples e com frases;
- Modelos Booleanos;
- Ponderação de matrizes: TF-IDF;
- Ranking utilizando TF-IDF;
- Medidas de similaridade: distância euclidiana e cosseno.

Pré-processamento, Normalização de dados e Distância entre palavras

24 Fevereiro 2026, 09:00 Ana Catarina dos Santos Martins


- Pré-processamento de texto: Tokenização e normalização dos dados;
- Reconhecimento de padrões e filtragem da informação com expressões regulares (concatenação, disjunção, intervalos, caracteres especiais, ancoras, agrupamento, precedência, greedy, quantificadores);
- Métricas para calcular a distância entre palavras; exemplo prático de um corretor automático utilizando a distância de Levenshtein.
- Introdução à biblioteca NLTK: exploração e análise dos corpora;

Apresentação da UC

10 Fevereiro 2026, 09:00 Ana Catarina dos Santos Martins


- Introdução a Text Mining: o que é; que áreas intersecta; tipos de dados; tarefas envolvidas; principais aplicações.

- Apresentação do conteúdo da UC, o que será abordado ao longo do semestre, assim como o que será avaliado em cada momento de avaliação.

- Planificação da UC;
- Momentos de avaliação: marcação de datas para testes de avaliação e da entrega do projeto final;
- Apresentação do enunciado do projeto final;
- Apresentação de casos de sucesso que utilizaram técnicas de Text Mining para o desenvolvimento dos seus produtos.