Currículo
Fundamentos de Ciência dos Dados 03209
Contextos
Groupo: Informática e Gestão - 2020 > 2º Ciclo > Parte Escolar > Unidades Curriculares Obrigatórias
ECTS
6.0 (para cálculo da média)
Objectivos
O1. Conhecer e compreender a ciência dos dados O2. Conhecer a história e tipos da aprendizagem automática O3. Aprender e conhecer a linguagem de programação Python O4. Aprender e conhecer os conceitos que permitem realizar uma Análise Exploratória de Dados (EDA) O5. Aprender e conhecer mecanismos de Data Wrangling O6. Aprender e conhecer mecanismos de Data Visualization O7. Conhecer e compreender os algoritmos do tipo supervisionado: árvores de decisão, regressão linear e logística, support vector machines (SVM), naive bayes classification. Conhecer e compreender os algoritmos do tipo não-supervisionado: K-means; O8. Conhecer a utilização de variáveis contínuas e categóricas; distinguir classificação e regressão O9. Compreender os algoritmos do tipo por reforço: Q-learning O10. Compreender as Redes Neuronais Artificiais (RNA) O11. Compreender as Redes Neuronais Recorrentes (RNR) e Redes Neuronais Convolucionais (RNC) O12. Compreender as aplicações das séries temporais
Programa
CP1. Introdução à Ciência dos Dados CP2. Introdução à Aprendizagem Automática: A história, fundamentos e conceitos base CP3. Introdução à linguagem de programação Python CP4. Análise Exploratória de Dados (EDA): Parte 1 - Data Wrangling com Pandas CP5. Análise Exploratória de Dados (EDA): Parte 2 - Data Visualization com Matplotlib / Seaborn CP6. Aprendizagem Supervisionada: SVM, Árvores de Decisão, Regressões Linear e Logística, Florestas Aleatórias; CP7. Aprendizagem Não-Supervisionada: K-means clustering; Aprendizagem por Reforço: Q-Learning CP8. Classificação e Regressão; Variáveis Numéricas / Contínuas e Categóricas / Discretas CP9. Redes Neuronais Artificiais CP10. Deep Learning: Redes Neuronais Recorrentes (RNNs) e Convolucionais (CNNs); Visão computacional CP11. Séries Temporais
Método de Avaliação
Dada a natureza prática dos conteúdos lecionados, a avaliação será realizada por projeto. O seu tema deverá estar alinhado com a totalidade ou parte do programa da UC. Proposta do tema do projeto (5%). Projeto (95%, incluindo trabalho de grupo (relatório e software) ? 40% e prova oral individual ? 55%). Todas as componentes do projeto ? proposta, relatório, software e prova oral, são obrigatórias. A classificação mínima para cada componente é de 10 numa escala de 0 a 20. Haverá apenas uma data limite para a entrega do projeto, com exceção dos alunos inscritos em época especial que poderão entregar durante esse período. A presença nas aulas não é obrigatória. Não existe exame final. A melhoria de nota pode ser realizada através de entrega de novo projeto no ano letivo seguinte.
Carga Horária
Carga Horária de Contacto -
Trabalho Autónomo - 113.0
Carga Total -
Bibliografia
Principal
- Mueller, J. P. (2019). Python for Data Science for Dummies, 2nd Edition (2.a ed.). John Wiley & Sons. Grus, J. (2019). Data science from scratch: First principles with python (2.a ed.). O?Reilly Media. Raschka, S. & Mirjalili, V. (2019). Python Machine Learning : Machine Learning and Deep Learning With Python, Scikit-Learn, And Tensorflow. Birmingham: Packt Publishing, Limited. Avila, J. (2017). Scikit-Learn Cookbook - Second Edition. Birmingham: Packt Publishing. Theobald, O. (2017). Machine Learning for Absolute Beginners: A Plain English Introduction. United States. Ller, A. & Guido, S. (2017). Introduction To Machine Learning with Python: A Guide for Data Scientists. Sebastopol, CA: O'Reilly Media, Inc. VanderPlas, J. (2016). Python Data Science Handbook. O?Reilly Media.:
Secundária
- McKinney, W. (2022). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and Jupyter (3.a ed.). O?Reilly Media. Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, And Tensorflow : Concepts, Tools, And Techniques to Build Intelligent Systems. Sebastopol, CA: O'Reilly Media, Inc.: