Sumários

Representação de documentos e similaridade entre documentos

19 Fevereiro 2025, 19:30 Fernando Batista


Modelos de espaços vectoriais
Estratégias de pesagem de termos: TF-IDF
Medidas de similaridade e similaridade entre documentos

Preparação de dados e representação de Documentos

19 Fevereiro 2025, 18:00 Fernando Batista


Obtenção e filtragem de informação, extração de informação e Data Mining
Preparação e limpeza de documentos: tokenização, normalização, extração de features

Representação de documentos e similaridade entre documentos

17 Fevereiro 2025, 19:30 Fernando Batista


Modelos de espaços vectoriais
Estratégias de pesagem de termos: TF-IDF
Medidas de similaridade e similaridade entre documentos

Preparação de dados e representação de Documentos

17 Fevereiro 2025, 18:00 Fernando Batista


Obtenção e filtragem de informação, extração de informação e Data Mining
Preparação e limpeza de documentos: tokenização, normalização, extração de features

Preparação e limpeza de documentos

12 Fevereiro 2025, 19:30 Fernando Batista


Preparação e limpeza de documentos: expressões regulares

Introdução ao Python
Jupyter Notebbooks e Google Colab
Exercícios práticos