Ficha Unidade Curricular (FUC)
Informação Geral / General Information
Carga Horária / Course Load
Área científica / Scientific area
Ciências e Tecnologias da Programação
Departamento / Department
Departamento de Ciências e Tecnologias da Informação
Ano letivo / Execution Year
2024/2025
Pré-requisitos / Pre-Requisites
Conhecimentos básicos de programação, probabilidades e estatística, e álgebra linear.
Objetivos Gerais / Objectives
O objetivo geral desta UC é dar formação nas tecnologias, técnicas e algoritmos que permitem extrair modelos e conhecimento a partir de grandes quantidades de dados.
Objetivos de Aprendizagem e a sua compatibilidade com o método de ensino (conhecimentos, aptidões e competências a desenvolver pelos estudantes) / Learning outcomes
No final da UC os alunos deverão ser capazes de: OA1: compreender e conhecer as principais plataformas para processamento de grandes quantidades de informação OA2: compreender e saber aplicar os modelos de programação/computação distribuídos OA3: compreender as etapas associadas a um projeto de machine learning para grandes quantidades de informação OA4: saber aplicar técnicas de redução de dimensionalidade OA5: aplicar técnicas de aprendizagem supervisionada ou não supervisionada em problemas de grande dimensão
Conteúdos Programáticos / Syllabus
CP1: Plataformas computacionais para big data CP2: Pipeline de machine learning para big data CP3: Redução de dimensionalidade CP4: Aprendizagem supervisionada/não supervisionada para larga escala CP5: Casos de estudo: PageRank e Sistemas de Recomendação
Demonstração da coerência dos conteúdos programáticos com os objetivos de aprendizagem da UC / Evidence that the curricular units content dovetails with the specified learning outcomes
A interligação entre os conteúdos programáticos (CP) e os objetivos de aprendizagem (OA) realiza-se da seguinte forma: CP1 Plataformas computacionais para big data: OA1 e OA2 CP2 Pipeline de machine learning para big data: OA3 CP3: Redução de dimensionalidade: OA4 CP4: Aprendizagem supervisionada/não supervisionada para larga escala: OA5 CP5: Casos de estudo: PageRank e Sistemas de Recomendação: todos os objectivos de aprendizagem
Avaliação / Assessment
Esta UC contempla as seguintes modalidades de avaliação: (1) avaliação ao longo do semestre; (2) avaliação por exame. (1) Avaliação ao longo do semestre A nota final é composta por: • Teste escrito individual (70%), com nota mínima de 8,0; • Trabalho de grupo (30%). O trabalho de grupo tem uma entrega intercalar que contará 30% e uma entrega no final do semestre que contará 70%. Quem não entregar a parte correspondente à entrega intercalar passa automaticamente para a modalidade de avaliação por exame. O trabalho terá uma apresentação/discussão oral sendo a nota final individual. (2) avaliação por exame A nota final será a obtida num único exame escrito, incluindo o exame de época especial.
Metodologias de Ensino / Teaching methodologies
As aulas são teórico-práticas, alternando entre a exposição dos assuntos de cariz teórico e a realização de exercícios.
Demonstração da coerência das metodologias de ensino e avaliação com os objetivos de aprendizagem da UC / Evidence that the teaching and assessment methodologies are appropriate for the learning outcomes
Esta unidade curricular requer conceitos teóricos que serão abordados nas aulas teórico-práticas e avaliados na parte escrita da avalição, correspondendo a todos os objectivos de aprendizagem. Em complemento, os conceitos teóricos são aplicados com recurso às técnicas de programação estudadas, correspondendo igualmente a todos os objectivos de aprendizagem. Isso é feito nas aulas práticas e a avaliação mediante a realização de um trabalho de grupo ou em exame final, consoante a modalidade de avaliação escolhida.
Observações / Observations
Bibliografia Principal / Main Bibliography
- Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale, Ofer Mendelevitch, Casey Stella and Douglas Eadline, Addison-wesley, 2016. - Advanced Analytics with Spark: Patterns for Learning from Data at Scale, Sandy Ryza et al., O'Reilly Media, 2017. - Learning Spark: Lightning-Fast Big Data Analysis, Holden Karau, A. Konwinski, P. Wendell and M. Zaharia, O'Reilly Media, 2015. - Big Data: Algorithms, Analytics, and Applications, Kuan-Ching Li et al., Chapman and Hall/CRC, 2015. - Mining of Massive Datasets, A. Rajaraman, J. Ullman, 2011, Cambridge University Press.
Bibliografia Secundária / Secondary Bibliography
- The elements of statistical learning, Trevor Hastie, Robert Tibshirani, and Jerome Friedman. Springer, 2001 - All of Statistics: A concise course in Statistical Inference, L.Wasserman, Springer, 2003.
Data da última atualização / Last Update Date
2024-07-31