Sumários

Preparação de dados, representação de documentos e similaridade entre documentos

5 Março 2026, 18:00 Fernando Batista


Preparação e limpeza de documentos: expressões regulares
Introdução ao Python, Jupyter Notebooks e Google Colab
Exercícios práticos

Obtenção e filtragem de informação, extração de informação e Data Mining
Preparação e limpeza de documentos: tokenização, normalização, extração de features

Representação de documentos e similaridade entre documentos
Modelos de espaços vectoriais
Estratégias de pesagem de termos: TF-IDF
Medidas de similaridade e similaridade entre documentos

Preparação de dados, representação de documentos e similaridade entre documentos

4 Março 2026, 18:00 Fernando Batista


Preparação e limpeza de documentos: expressões regulares
Introdução ao Python, Jupyter Notebooks e Google Colab
Exercícios práticos

Obtenção e filtragem de informação, extração de informação e Data Mining
Preparação e limpeza de documentos: tokenização, normalização, extração de features

Representação de documentos e similaridade entre documentos
Modelos de espaços vectoriais
Estratégias de pesagem de termos: TF-IDF
Medidas de similaridade e similaridade entre documentos

Introdução a Text Mining. Etapas de um processo de Text Mining

26 Fevereiro 2026, 18:00 Fernando Batista


Utilidade de grandes quantidades de texto, desafios e métodos atuais
Informação não estruturada vs. (semi-)estruturada
Obtenção e filtragem de informação, extração de informação e Data Mining
Etapas de um processo de Text Mining

Introdução a Text Mining

25 Fevereiro 2026, 18:00 Fernando Batista


Utilidade de grandes quantidades de texto, desafios e métodos atuais
Informação não estruturada vs. (semi-)estruturada
Obtenção e filtragem de informação, extração de informação e Data Mining
Etapas de um processo de Text Mining