Currículo
Projeto Aplicado em Ciência de Dados II 03603
Contextos
Groupo: Ciência de Dados - PL > 1º Ciclo > Unidades Curriculares Obrigatórias
ECTS
6.0 (para cálculo da média)
Objectivos
Pretende-se prover os estudantes de experiência na aplicação de soluções a problemas concretos, baseados em dados e em variados contextos e domínios. Os estudantes aprenderão a desenvolver um projeto em ciência de dados, em ambiente académico e científico, identificando necessidades, manipulando dados, e identificando as metodologias apropriadas para o problema a resolver. Serão reforçados um conjunto de aspetos, potencialmente relevantes para um projeto com dados (reais) de dimensão considerável, tais como: visualização (geoespacial), métodos de classificação automáticos, balanceamento de dados e overfitting, séries temporais, realçando também a forma correta de comunicação dos resultados. Dá-se preferência ao acolhimento de problemas de docentes/investigadores do Iscte com projetos reais e delimitados.
Programa
CP1: Introdução de elementos potencialmente relevantes para o desenvolvimento de um projeto CP2: Introdução aos projetos aplicados em Data Science CP3: Enquadramento e escolha de metodologia adequada CP4: Desenvolvimento do projeto com dados de dimensão considerável e preferencialmente reais CP5: Templates de divulgação de resultados obtidos
Método de Avaliação
Dada a sua natureza, esta UC é feita apenas por avaliação ao longo do semestre, não contemplando a modalidade de avaliação por exame. A avaliação consiste em duas componentes: a) Questionários (40%): 2 questionários feitos em grupo, com consulta e realizados em aula (5% cada) + 1 questionário feito em grupo e com consulta (30%); b) Trabalho de grupo (60%): acompanhamento semanal (10%) + escrita de relatório e apresentação oral (50%). Os alunos devem obter uma nota mínima de 9 valores em cada componente. Escala 0-20
Carga Horária
Carga Horária de Contacto -
Trabalho Autónomo - 113.0
Carga Total -
Bibliografia
Principal
- Field Cady, The Data Science Handbook, 2017, DOI:10.1002/9781119092919, https://onlinelibrary.wiley.com/doi/book/10.1002/9781119092919 Bradley Boehmke & Brandon Greenwell, Hands-On Machine Learning with R, 2020, https://bradleyboehmke.github.io/HOML/, https://bradleyboehmke.github.io/HOML/ Jake VanderPlas, Python Data Science Handbook, 2016, O'Reilly Media, Inc., https://jakevdp.github.io/PythonDataScienceHandbook/ José Braga de Vasconcelos e Alexandre Barão, Ciência Dos Dados Nas Organizações - Aplicações Em Python, 2017, FCA Editora, Trevor Hastie , Robert Tibshirani , Jerome Friedman, The Elements of Statistical Learning: Data Mining, Inference and Prediction, 2016, https://link.springer.com/book/10.1007/978-0-387-84858-7, https://hastie.su.domains/Papers/ESLII.pdf James, G., Witten, D., Hastie, T., and Tibshirani, R., An Introduction to Statistical Learning with Applications in R (1st Ed.), 2013, Springer,:
Secundária
- Glenn J. Myatt and Wayne P. Johnson, Making Sense of Data I: A Practical Guide to Exploratory Data Analysis and Data Mining", Second Edition, 2014, John Wiley & Sons, Inc., :