Sumários

Exercícios: TF-IDF, similaridade entre documentos

19 Fevereiro 2024, 19:30 Fernando Batista


Exercícios
  • Estratégias de pesagem de termos
  • similaridade entre documentos

Preparação de dados e Representação de Documentos

19 Fevereiro 2024, 18:00 Ricardo Ribeiro


Obtenção e filtragem de informação, extração de informação e Data Mining
Preparação e limpeza de documentos
  • tokenization, normalization
  • extração de features
Representação de documentos
  • Estratégias de pesagem de termos
  • Modelos de espaços vectoriais
  • Medidas de similaridade

Preparação de dados e Representação de Documentos

19 Fevereiro 2024, 18:00 Fernando Batista


Obtenção e filtragem de informação, extração de informação e Data Mining
Preparação e limpeza de documentos
  • tokenization, normalization
  • extração de features
Representação de documentos
  • Estratégias de pesagem de termos
  • Modelos de espaços vectoriais
  • Medidas de similaridade

Introdução ao Python, Jupyter notebooks e Orange3

5 Fevereiro 2024, 19:30 Ricardo Ribeiro


  • Introdução ao ambiente Jupyter Notebook
  • Revisão sobre o Python: tipos de dados, estruturas de controlo, Tipos estruturados de informação, leitura de ficheiros e pandas.
  • Orange3 como ferramenta de processamento de textos

Introdução ao Python, Jupyter notebooks

5 Fevereiro 2024, 19:30 Fernando Batista


  • Introdução ao ambiente Jupyter Notebook
  • Revisão sobre o Python: tipos de dados, estruturas de controlo, Tipos estruturados de informação, leitura de ficheiros e pandas.