Ficha Unidade Curricular (FUC)
Informação Geral / General Information
Carga Horária / Course Load
Área científica / Scientific area
Ciência de Dados
Departamento / Department
ISCTE
Ano letivo / Execution Year
2024/2025
Pré-requisitos / Pre-Requisites
Conhecimentos básicos de programação, probabilidades e estatística, e álgebra linear.
Objetivos Gerais / Objectives
O objetivo geral desta UC é dar formação nas tecnologias, técnicas e algoritmos que permitem extrair modelos e conhecimento a partir de grandes quantidades de informação.
Objetivos de Aprendizagem e a sua compatibilidade com o método de ensino (conhecimentos, aptidões e competências a desenvolver pelos estudantes) / Learning outcomes
No final da UC os alunos deverão ser capazes de: OA1: compreender e conhecer as principais plataformas para processamento de grandes quantidades de informação OA2: compreender e saber aplicar os modelos de programação/computação distribuídos OA3: compreender as etapas associadas a um projeto de machine learning para grandes quantidades de informação OA4: saber aplicar técnicas de redução de dimensionalidade OA5: aplicar técnicas de aprendizagem supervisionada ou não supervisionada em problemas de grande dimensão OA6: saber como realizar a análise de dados a partir de sequências
Conteúdos Programáticos / Syllabus
CP1: Plataformas computacionais para big data CP2: Pipeline de machine learning para big data CP3: Redução de dimensionalidade CP4: Aprendizagem supervisionada/não supervisionada para larga escala CP5: Aprendizagem a partir de sequências CP6: Casos de estudo: PageRank e Sistemas de Recomendação
Demonstração da coerência dos conteúdos programáticos com os objetivos de aprendizagem da UC / Evidence that the curricular units content dovetails with the specified learning outcomes
OA1: CP1 OA2: CP1 OA3: CP2 OA4: CP2 e CP3 OA5: CP4 e CP6 OA6: CP5
Avaliação / Assessment
Esta UC contempla as seguintes modalidades de avaliação: (1) avaliação ao longo do semestre; (2) avaliação por exame. (1) Avaliação ao longo do semestre A nota final é composta por: • Teste escrito individual (70%), com nota mínima de 8,0; • Trabalho de grupo (30%). O trabalho de grupo tem uma entrega intercalar que contará 30% e uma entrega no final do semestre que contará 70%. Quem não entregar a parte correspondente à entrega intercalar passa automaticamente para a modalidade de avaliação por exame. O trabalho terá uma apresentação/discussão oral sendo a nota final individual. (2) avaliação por exame A nota final será a obtida num único exame escrito.
Metodologias de Ensino / Teaching methodologies
As aulas são teórico-práticas, alternando entre a exposição dos assuntos teóricos e a realização de exercícios.
Demonstração da coerência das metodologias de ensino e avaliação com os objetivos de aprendizagem da UC / Evidence that the teaching and assessment methodologies are appropriate for the learning outcomes
O alinhamento entre cada instrumento de avaliação e os objectivos definidos para a UC é realizado da seguinte forma: Teste: todos os objetivos; Trabalho: todos os objectivos ou Exame: todos os objectivos
Observações / Observations
Bibliografia Principal / Main Bibliography
- Mining of Massive Datasets, A. Rajaraman, J. Ullman, 2011, Cambridge University Press. - Big Data: Algorithms, Analytics, and Applications, Kuan-Ching Li et al., Chapman and Hall/CRC, 2015. - Learning Spark: Lightning-Fast Big Data Analysis, Holden Karau, A. Konwinski, P. Wendell and M. Zaharia, O'Reilly Media, 2015. - Understanding Deep Learning, Prince, Simon JD., MIT press, 2023. - Advanced Analytics with Spark: Patterns for Learning from Data at Scale, Sandy Ryza et al., O'Reilly Media, 2017. - Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale, Ofer Mendelevitch, Casey Stella and Douglas Eadline, Addison-wesley, 2016.
Bibliografia Secundária / Secondary Bibliography
- All of Statistics: A concise course in Statistical Inference, L.Wasserman, Springer, 2003. - The elements of statistical learning, Trevor Hastie, Robert Tibshirani, and Jerome Friedman. Springer, 2001. -- Deep Learning, Ian Goodfellow and Yoshua Bengio, 2016, MIT Press.
Data da última atualização / Last Update Date
2024-07-29