Currículo

Programação para Análise de Dados PAD

Contextos

Groupo: Inovação de Produtos Digitais > Unidades Curriculares Obrigatórias

ECTS

6.0 (para cálculo da média)

Objectivos

OA1 Introdução à linguagem de programação Python. OA2 Compreender os princípios da ciência de dados e da mineração de dados e compreender e saber aplicar o modelo Cross-Industry Standard Process for Data Mining (CRISP-DM) em casos práticos, incluindo a compreensão do negócio e dos dados e a preparação dos dados para modelação. OA3 Saber executar e depurar aplicações em Python e utilizar as bibliotecas fundamentais em casos práticos de preparação, exploração, visualização e análise de características dos dados. OA4 Compreender os algoritmos de aprendizagem automática, em problemas supervisionados de previsão (classificação, regressão, séries temporais) e problemas não supervisionados de agrupamento, e saber aplicá-los e avaliar o seu desempenho em problemas práticos, usando a linguagem Pyhton, no contexto da metodologia CRISP-DM. OA5 Compreender e saber aplicar considerações éticas e de privacidade na análise de dados e discutir as tendências futuras neste domínio.

Programa

P1 Introdução à linguagem de programação (Python 3) P2 Ambientes de desenvolvimento em Python P3 Primitivas de controlo, variáveis, expressões e declarações. Objetos e classes de objetos. Funções, módulos e pacotes P4 Operações sobre ficheiros. Interpretação de dados JSON, XML. Operações sobre bases de dados. Web scrapping P5 Introdução à ciência dos dados, ao ciclo dos dados e à mineração de dados. Modelo CRISP-DM P6 Técnicas de preparação e limpeza de dados P7 Análise exploratória e visualização de dados P8 Seleção e engenharia de características relevantes dos dados P9 Métodos de previsão em aprendizagem automática (classificação, regressão, séries temporais). Algoritmos essenciais, incluindo a sua avaliação com métricas de desempenho P10 Métodos de agrupamento em aprendizagem automática. Algoritmos essenciais P11 Considerações éticas: privacidade, segurança e tratamento responsável de dados P12 Tecnologias emergentes e seu impacto na análise de dados

Método de Avaliação

UC com Avaliação Periódica, não contemplando Exame Final. Pesos da avaliação: Trabalhos individuais, 80% obrigatórios (25%) Projeto laboratorial (grupo de 2), com discussão oral individual (50%) 2 mini-testes de resposta múltipla (25%) Se reprova na época normal (< 10 val) o aluno acede ao exame de 1º ou 2ª épocas, valendo 50% da nota, sendo obrigatória a aprovação no Projeto em grupo ou a realização de um projeto individual (50%).

Carga Horária

Carga Horária de Contacto -

Trabalho Autónomo - 125.0

Carga Total -

Bibliografia

Principal

  • Larose, D., Larose, C., Data Mining and Predictive Analytics, 2015, 2nd Edition, John Wiley & Sons Hastie, T.; Tibshirani, R., Friedman, J., The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2017, 2nd ed. New York: Springer Ethem Alpaydin, Introduction to Machine Learning, 2010, MIT Press.ISBN 026201243X Reitz. K., Schlusser, T., The Hitchhiker's Guide to Python: Best Practices for Development,, 2016, 1st Edition, ISBN-13: 978-1491933176, https://docs.python-guide.org/ Martins, J. P., Programação em Python: Introdução à programação utilizando múltiplos paradigmas, 2015, IST Press, ISBN: 9789898481474:

Secundária

  • Zelle, J., Python Programming: An Introduction to Computer Science, 2016, Franklin, Beedle & Associates Inc, ISBN-13 ‏ : ‎ 978-1590282755 Matthes, E., Python Crash Course, 2Nd Edition: A Hands-On, Project-Based Introduction To Programming, 2019, No Starch Press,US, ISBN-13 ‏ : ‎ 978-1593279288 Beazley, D., Jones, B., Python Cookbook: Recipes for Mastering Python 3, 2013, O'Reilly Media, ISBN-13 ‏ : ‎ 978-1449340377 Neto, J. P., Programação, Algoritmos e Estruturas de Dados, 2016, Escolar Ed., 3ª Edição. ISBN: 9789725924242:

Disciplinas de Execução

2024/2025 - 1º Semestre