Currículo
Projeto Aplicado em Ciência de Dados 03603
Contextos
Groupo: Ciência de Dados - PL 2025 > 1º Ciclo > Unidades Curriculares Obrigatórias
ECTS
6.0 (para cálculo da média)
Objectivos
OA1: Aplicar metodologias adequadas ao desafio em causa OA2: Desenvolver competências em limpeza, pré-processamento e integração de dados reais OA3: Transformar, sumarizar e visualizar dados de forma eficaz OA4: Analisar dados e interpretar resultados de forma crítica OA5: Comunicar resultados de forma clara e estruturada
Programa
CP1: Análise preliminar de dados. Exploração de bibliotecas para manipulação, limpeza, visualização e tratamento de dados reais, com foco na preparação dos dados para análise. CP2: Análise de Variáveis e Engenharia de Atributos. Identificação de variáveis-chave e aplicação de técnicas de seleção e transformação eficazes para melhorar a precisão do modelo e a qualidade global da análise. CP3: Visualização de dados univariados e multivariados. CP4: Análise, interpretação e comunicação eficaz dos resultados para apoiar a tomada de decisões baseada em dados. CP5: Desenvolvimento de um projeto aplicado utilizando dados do mundo real, abrangendo todas as etapas do processo analítico — desde a definição do problema até à apresentação e defesa de soluções baseadas em dados.
Método de Avaliação
Considerando a natureza prática do curso, a avaliação é realizada continuamente ao longo do semestre e não inclui exame final. A avaliação baseia-se em dois componentes principais: a) Quizzes online de grupo, com consulta a.1) Dois quizzes online, de grupo, realizados em aula (5% cada); a.2) Um quiz online, de grupo, abrangendo os conteúdos do curso (30%); b) Projeto de grupo (60%); b.1) Progresso e participação no Projecto de grupo decorrente de acompanhemento semanal (10%); b.2) Relatório final escrito e apresentação oral (50%); Requisito mínimo: Os alunos devem obter uma nota mínima de 9 (escala de 0 a 20) em cada componente para serem aprovados no curso.
Carga Horária
Carga Horária de Contacto -
Trabalho Autónomo - 113.0
Carga Total -
Bibliografia
Principal
- (1) Hastie, T., Tibshirani, R., Friedman, J. H., & Friedman, J. H. (2009). The elements of statistical learning: data mining, inference, and prediction (Vol. 2, pp. 1-758). New York: Springer. https://link.springer.com/book/10.1007/978-0-387-84858-7 (2) James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning: with applications in R (Vol. 103). New York: Springer. https://link.springer.com/book/10.1007/978-1-0716-1418-1 (3) Cady, F. (2024). The data science handbook. John Wiley & Sons. https://www.wiley.com/en-us/The+Data+Science+Handbook%2C+2nd+Edition-p-9781394234493 (4) Boehmke, B., & Greenwell, B. M. (2019). Hands-on machine learning with R. Chapman and Hall/CRC. https://bradleyboehmke.github.io/HOML/, https://bradleyboehmke.github.io/HOML/ (5) Wes McKinney (2022), Python for Data Analysis, 3rd Edition, O'Reilly Media, Inc. (https://wesmckinney.com/book/, https://github.com/wesm/pydata-book):
Secundária
- (1) Harrison, M., & Petrou, T. (2020). Pandas 1. x Cookbook. Packt Publishing. (2) Mukhiya, S. K., & Ahmed, U. (2020). Hands-On Exploratory Data Analysis with Python: Perform EDA techniques to understand, summarize, and investigate your data. Packt Publishing Ltd. https://github.com/PacktPublishing/hands-on-exploratory-data-analysis-with-python (3) Gagolewski, M. (2022). Minimalist Data Wrangling with Python. arXiv preprint arXiv:2211.04630. https://datawranglingpy.gagolewski.com/ (4) Vasconcelos, J. B., & Barão, A. (2017). Ciência dos dados nas organizações. FCA Editora.: