Sumários
AulaTP03 - PySpark
10 Março 2026, 19:30 • Alexandre Manuel de Castro Passos de Almeida
PySpark (Data Processing - exercícios 5 a 16)
Proposta de TPC (para realizar em casa)
AulaT03 - Spark
10 Março 2026, 18:00 • Alexandre Manuel de Castro Passos de Almeida
- Contexto
- DataFrames
- Arquitectura
- Transformações/Acções
AulaTP02 - MapReduce
3 Março 2026, 19:30 • Alexandre Manuel de Castro Passos de Almeida
Parte A - Aplicação do MapReduce
Resolução apoiada dos exercícios 1 a 3
Resolução proposta dos 'divisores'
Parte B - Frontend do pipeline
Ingestão e limpeza dos dados com PySpark
Proposta de TPC
Aplicação do MapReduce
3 Março 2026, 19:30 • Gabriela Eleutério Soares
Parte A - Aplicação do MapReduce
- Resolução apoiada dos exercícios 1 a 3
- Resolução proposta dos 'divisores'
Parte B - Frontend do pipeline
- Ingestão e limpeza dos dados com PySpark
- Proposta de TPC
AulaT02 - Hadoop
3 Março 2026, 18:00 • Alexandre Manuel de Castro Passos de Almeida
Ecosistema Hadoop:
Armazenamento distribuído (HDFS)
Negociador de recursos (YARN)
Computação (MapReduce)