Sumários

1º Teste de avaliação

29 Outubro 2024, 14:00 Ana Catarina dos Santos Martins


Teste de avaliação sobre os conteúdos abordados até à data, nomeadamente:

- definição de corpora, normalização, tokenização, expressões regulares, distância de edição, part of speech tagging, named entity recognition e Naive Bayes para classificação de sentimentos.

Continuação de Naive Bayes, representação Vetorial e introdução a modelação de tópicos utilizando fatorização de matrizes

22 Outubro 2024, 14:00 Ana Catarina dos Santos Martins


- Sumário da teoria sobre Naive Bayes;

- Exemplo de aplicação para análise de sentimento;
- Introdução a modelação de tópicos utilizando Singular Value Decomposition e Non-negative Matrix Factorization;
- Exemplos práticos sobre modelação de tópicos utilizando um dataset da Usenet.

Part of Speech Tagging com Hidden Markov Models e Naive Bayes para análise de sentimentos

15 Outubro 2024, 14:00 Ana Catarina dos Santos Martins


- Aplicações de Cadeias de Markov e Hidden Markov Models;

- Demonstração das bases matemáticas de Hidden Markov Models;
- Explicação de matrizes de transição, emissão, observáveis e estados ocultos;
- Exercícios de aplicação;
- Introdução a Naive Bayes e exercícios aplicados a análise de sentimentos.

Aplicação de regex e distância de edição, Introduçãoa web scraping, Part of Speech Tagging e Named Entity Recognition

8 Outubro 2024, 14:00 Ana Catarina dos Santos Martins


- Desenvolvimento dum chatbot utilizando regex;

- Utilização dum dicionário de português para sugerir a correção automática de palavras utilizando a distância de edição;
- Introdução a Part of Speech Tagging e Named Entity Recognition.

Continuação de técnicas de pré-processamento

1 Outubro 2024, 14:00 Ana Catarina dos Santos Martins


- Rever conceitos sobre segmentação, tokenização e stemização;

- Rever expressões regulares abordadas na aula anterior;
- Explicar os níveis em que o processamento de texto podem acontecer;
- Distância mínima de edição: Levenshtein;
- Introdução a webscraping utilizando newspaper3k. 
- Exercícios de aplicação.