Currículo

Aplicações Computacionais em Ciência de Dados ACCD

Contextos

Groupo: Matemática Computacional Aplicada > 2º Ciclo > Parte Escolar > Unidades Curriculares Obrigatórias

ECTS

6.0 (para cálculo da média)

Objectivos

OA1. Conhecer os principais métodos de aprendizagem não supervisionada OA2: Avaliar, validar e interpretar os resultados de modelos não supervisionados OA3: Desenvolver projetos partir de dados utilizando modelos de aprendizagem não supervisionada OA4. Aplicar os algoritmos não supervisionados em casos de estudo práticos OA5: Utilizar um software (R ou Python) no contexto dos métodos não supervisionados

Programa

CP1: Introdução aos métodos de aprendizagem não supervisionada: conceitos fundamentais, tipos de algoritmos e aplicações práticas; CP2: Análise em componentes principais (ACP): conceitos fundamentais, etapas e aplicações práticas; CP3: Técnicas de clustering: clustering hierárquico e clustering probabilístico, exploração de algoritmos e aplicações práticas; CP4: Regras de associação: frequência de items e regras de associação, algoritmo Apriori e aplicações práticas.

Método de Avaliação

A aprovação na UC decorre da obtenção de 10 valores (escala 0-20) em qualquer uma das modalidades de avaliação. Avaliação ao longo do semestre: - trabalho de grupo com nota mínima de 8 valores (30%) - trabalho(s) individual(is) com nota mínima de 8 valores (30%) - teste individual presencial com nota mínima 8 valores (30%) - trabalho autónomo ao longo do semestre (10%) Todas as componentes (trabalhos e teste) são obrigatórias. A aprovação requer uma nota mínima de 10 (escala 0-20). EXAME (1ª Época, em caso de escolha do estudante, 2ª Época e Época Especial): O Exame Final corresponde a um exame presencial escrito (100% da nota final). Os estudantes devem obter uma nota mínima de 10 para passar.

Carga Horária

Carga Horária de Contacto -

Trabalho Autónomo - 125.0

Carga Total -

Bibliografia

Principal

  • "Berry, M. W., Mohamed, A., & Yap, B. W. (Eds.). (2019). Supervised and unsupervised learning for data science. Springer Nature. Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E. (2014), Multivariate Data Analysis, 7th Edition, Essex, UK: Pearson Education. Hastie, T., Tibshirani, R., Friedman, J. (2009), The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed. New York: Springer. James, G., Witten, D., Hastie, T., Tibshirani, R. (2013), An introduction to statistical learning: with applications in R, New York: Springer. Reddy, C. K. (2018). Data Clustering: Algorithms and Applications. Chapman and Hall/CRC. Vidal, R., Ma, Y., & Sastry, S. S. (2016). Generalized principal component analysis (Vol. 5). New York: Springer." : . .

Secundária

  • "Aggarwal, C. C., Reddy, C. K. (eds.) (2014), Data Clustering: Algorithms and Applications. Boca Raton: CRC Press. Contreras, P., & Murtagh, F. (2015). Hierarchical clustering. In Handbook of cluster analysis (pp. 124-145). Chapman and Hall/CRC. Hennig, C., Meila, M., Murtagh, F., Rocci, R. (eds.) (2016), Handbook of Cluster Analysis, Handbooks of Modern Statistical Methods. Boca Raton: Chapman & Hall/CRC. Jolliffe, I. (1986), Principal Component Analysis. New York: Springer-Verlag. Kassambara, A. (2017). Practical guide to cluster analysis in R: Unsupervised machine learning (Vol. 1). Sthda. McLachlan, G. J., Peel, D.(2000), Finite Mixture Models. New York: John Wiley & Sons. Lattin, J., D. Carroll e P. Green (2003), Analyzing Multivariate Data, Pacific Grove, CA: Thomson Learning. Sutton, R. S., & Barto, A. G. (2018). Reinforcement Learning, second edition: An Introduction (2.a ed.). MIT Press. Verdhan, V. (2020). Models and Algorithms for Unlabelled Data. Springer. Wedel, M., Kamakura, W. A. (2000), Market Segmentation. Conceptual and Methodological Foundations (2nd edition), International Series in Quantitative Marketing. Boston: Kluwer Academic Publishers." : . .

Disciplinas de Execução