Currículo
Extração de Padrões e Conhecimento Guiada por Dados EPCGD
Contextos
Groupo: Sistemas Integrados de Apoio à Decisão - 2020 > 2º Ciclo > Parte Escolar > Unidades Curriculares Obrigatórias
ECTS
6.0 (para cálculo da média)
Objectivos
Para obter sucesso nesta UC o aluno deverá ser capaz de: OA1. Aplicar técnicas de preparação e análise exploratória de dados OA2. Aplicar técnicas de regressão linear, não linear e logística OA3. Entender a aplicação de técnicas de classificação como Support Vector Machine e Redes Neuronais e Classificação Bayesiana OA4. Aplicar técnicas de indução de regras a problemas de extração de conhecimento OA5. Aplicar técnicas de análise de grupos a problemas de extração de conhecimento OA6. Perceber como conseguir uma boa modelação OA7. Conceber modelos de data mining com dados reais
Programa
CP1. Introdução ao Data Mining, problemas de decisão e aplicações CP2. O Processo do ciclo de dados CP3. Revisão de Estatística descritiva e exploratória CP4. Revisão das principais técnicas de Regressão linear, não-linear e logística CP5. Análise de grupos (clustering): técnicas principais e aplicações CP6. Tree based emsembles CP7. Técnicas de inferência Bayesianas CP8. Support Vector Machines (SVM) CP9. Redes Neuronais
Método de Avaliação
O aluno dispõe de dois métodos de avaliação: avaliação ao longo do semestre e avaliação por exame (para 100% da nota). Dado o carácter prático desta UC, recomenda-se o método de avaliação ao longo do semestre que inclui o desenvolvimento de um trabalho prático. A avaliação ao longo do semestre é composta pelas seguintes componentes: - Trabalho prático (em grupo, com nota individual): 60% - Revisão por pares (em grupo, com nota individual): 10% - Teste individual: 30% Nota mínima de 10 em todas as componentes. Os grupos de trabalho são de 2 a 3 elementos. Não há possibilidade de realização de trabalhos práticos individuais. A entrega do trabalho prático decorre após a última de aulas da UC, no período letivo. Esta UC é dada em regime intensivo, no início do semestre, terminando a meio do período letivo. As orais para a discussão dos trabalhos práticos serão realizadas com dois grupos em simultâneo, onde cada grupo apresenta a revisão por pares do outro trabalho. O relatório da revisão por pares é entregue no momento da oral. O teste individual será realizado em período letivo, após a última aula da UC. Alternativamente o aluno pode ser avaliado por um exame final que vale 100% da nota, em 1ª época, 2ª época e época especial de avaliação. Passam a ser avaliados por exame em 1ª época (contando 100% da nota) os alunos que não cumprirem a nota mínima do trabalho de grupo ou da revisão por pares. O exame de 2ª época constitui sempre 100% da nota e pode ser realizado: (a) por quem em 1ª época não obteve nota positiva ou não foi avaliado; (b) para melhoria de nota (requer inscrição na secretaria).
Carga Horária
Carga Horária de Contacto -
Trabalho Autónomo - 113.0
Carga Total -
Bibliografia
Principal
- - Materiais diversos fornecidos pelos docentes da UC. - Pang-Ning Tan, Michael Steinbach, Anuj Karpatne and Vipin Kumar (2018) Introduction to Data Mining (2nd ed.). Addison-Wesley. - VanderPlas, J. (2023) Python Data Science Handbook: Essential Tools for Working with Data (2nd ed.) OReilly Media. - Webb, A. & Copsey, K. (2011) Statistical Pattern Recognition (3rd ed.). Wiley.:
Secundária
- - Géron, A. (2022) Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems (3rd ed.). OReilly Media. - Cady, F. (2017) The Data Science Handbook (1st ed.). Wiley. - Foster Provost, Tom Fawcett (2013) Data Science for Business. What you need to know about data mining and data-analytic thinking (1st ed.). OReilly.: