Sumários

AulaTP03 - PySpark

10 Março 2026, 19:30 Alexandre Manuel de Castro Passos de Almeida


PySpark (Data Processing - exercícios 5 a 16)

Proposta de TPC (para realizar em casa)

AulaT03 - Spark

10 Março 2026, 18:00 Alexandre Manuel de Castro Passos de Almeida


  • Contexto
  • DataFrames
  • Arquitectura
  • Transformações/Acções



AulaTP02 - MapReduce

3 Março 2026, 19:30 Alexandre Manuel de Castro Passos de Almeida


Parte A - Aplicação do MapReduce

Resolução apoiada dos exercícios 1 a 3

Resolução proposta dos 'divisores'

Parte B - Frontend do pipeline

Ingestão e limpeza dos dados com PySpark

Proposta de TPC


Aplicação do MapReduce

3 Março 2026, 19:30 Gabriela Eleutério Soares


Parte A - Aplicação do MapReduce

  • Resolução apoiada dos exercícios 1 a 3
  • Resolução proposta dos 'divisores'

Parte B - Frontend do pipeline

  • Ingestão e limpeza dos dados com PySpark
  • Proposta de TPC

AulaT02 - Hadoop

3 Março 2026, 18:00 Alexandre Manuel de Castro Passos de Almeida


Ecosistema Hadoop:

Armazenamento distribuído (HDFS)

Negociador de recursos (YARN)

Computação (MapReduce)