Planeamento

Aulas

Apresentação e Introdução

Apresentação da unidade curricular:

  • Equipa docente e contactos
  • Objectivos
  • Tópicos a cobrir
  • Assiduidade
  • Processo de Avaliação
  • Logística: plataformas eletrónicas

Introdução à Descoberta e Extração de Conhecimento de Dados:

  • Definições e conceitos importantes em Data Mining, Data Science e Machine Learning
  • Definição e conceitos importantes sobre dados
  • Tarefas comuns



Dados

  • Ciência de dados: fases
  • Dados vs informação vs conhecimento
  • Dados estruturados vs não-estruturados
  • Dados heterogéneos
  • Bias
  • Privacidade


Resolução de problemas baseada em dados: compreensão de dados

Metodologia CRISP-DM:
  • O ciclo de dados
  • Etapas

Compreensão de dados:
  • Definições e conceitos importantes
  • Tipos de conjuntos de dados
  • Atributos e objetos
  • Tipos de dados
  • Qualidade dos dados


Resolução de problemas baseada em dados: preparação de dados

Tarefas comuns de preparação
  • Dados ruidosos
  • Outliers
  • Missing values
  • Dados duplicados
  • Similaridade e distância

Pré-processamento
  • Agregação
  • Amostragem
  • Discretização e binarização
  • Transformação de atributos


Análise e manipulação de dados em Python

Python

  • Conceitos básicos
  • Computação numérica (numpy)
  • Gráficos (matplotlin e seaborn)

Análise e manipulação de dados (pandas)


Compreensão e preparação de dados: exercícios

Exercícios sobre compreensão e preparação de dados


Aprendizagem não supervisionada

Abordagens não supervisionadas


Clustering 
  • Conceitos
  • Métodos 
    • k-Means
    • Clustering hierárquico
    • DBSCAN
  • Avaliação


Clustering (cont.)

  • Conceitos
  • Métodos 
    • k-Means
    • Clustering hierárquico
    • DBSCAN
  • Avaliação


Aprendizagem automática em Python

A biblioteca scikit-learn

  • Pré-processamento de dados
  • Clustering
  • Redução de dimensionalidade


Clustering: exercícios

Exercícios sobre clustering


Aprendizagem supervisionada: classificação

Abordagens supervisionadas
  • Classificação
  • Regressão

Avaliação

Métodos
  • k-NN
  • Naïve Bayes
  • Árvores de decisão
  • Regressão logística
  • SVMs
  • Redes neuronais


Aprendizagem supervisionada: classificação (cont.)

Métodos

  • k-NN
  • Naïve Bayes
  • Árvores de decisão
  • Regressão logística
  • SVMs
  • Redes neuronais


Aprendizagem supervisionada: classificação (cont.)

Métodos
  • k-NN
  • Naïve Bayes
  • Árvores de decisão
  • Regressão logística
  • SVMs
  • Redes neuronais


Classificação: exercícios

Exercícios sobre classificação


Aprendizagem supervisionada: regressão

  • Motivação e definição
  • Regressão linear
  • Qualidade do modelo
  • Regressão linear múltipla
  • Relações não lineares
  • Regressão com k-NN
  • Regressão com árvores de decisão


Regressão: exercícios

Exercícios sobre regressão


Text Mining

Breve introdução ao Text Mining


Apoio ao Projeto

Aula dedicada ao caso prático final


Sistemas de Recomendação

Estratégias comuns para a construção de sistemas de recomendação


Apoio ao Projeto

Aula dedicada ao caso prático final


Apoio ao Projeto

Aula dedicada ao caso prático final


Apoio ao Projeto

Aula dedicada ao caso prático final


Apresentação dos projetos

Apresentação do trabalho desenvolvido no caso prático final


Apresentação dos projetos

Apresentação do trabalho desenvolvido no caso prático final