Sumários

Introdução a Recuperação da Informação

30 Setembro 2025, 14:00 Ana Catarina dos Santos Martins


1. Matriz termo-documento;

2. Índice Invertido;
3. Processamento de Queries;
4. Modelo Booleano;
5. Queries com frases;
6. Algoritmos para obter diferentes matrizes termo-documento: bag of words, representação binária e ponderação de matrizes (tf-idf).

Pré-processamento, Normalização de dados e Distância entre palavras

23 Setembro 2025, 14:00 Ana Catarina dos Santos Martins


- Recapitulação da matéria dada durante a aula anterior;

- Reconhecimento de padrões e filtragem da informação com expressões regulares (concatenação, disjunção, intervalos, caracteres especiais, ancoras, agrupamento, precedência, greedy, quantificadores);

Métricas para calcular a distância entre palavras; exemplo prático de um corretor automático utilizando a distância de Levenshtein;

- Tarefa prática com um Jupyter Notebook para demonstrar os conteúdos lecionados e como aplicá-los num problema real de Text Mining.

Introdução a Text Mining

16 Setembro 2025, 14:00 Ana Catarina dos Santos Martins


- Apresentação do conteúdo da UC, o que será abordado ao longo do semestre, assim como o que será avaliado em cada momento de avaliação.
- Planificação da UC;
- Momentos de avaliação: marcação de datas para testes de avaliação e da entrega do projeto final;
- Apresentação do enunciado do projeto final;
- Apresentação de casos de sucesso que utilizaram técnicas de Text Mining para o desenvolvimento dos seus produtos.
- Introdução a técnicas de pré-processamento: tokenização e normalização.