Sumários
AulaTP02
24 Fevereiro 2026, 14:30 • Alexandre Manuel de Castro Passos de Almeida
Parte A - Aplicação do MapReduce
- Resolução apoiada dos exercícios 1 a 3
- Resolução proposta dos 'divisores'
Parte B - Frontend do pipeline
- Ingestão e limpeza dos dados com PySpark
- Proposta de TPC
AulaT02 - Hadoop
24 Fevereiro 2026, 13:00 • Alexandre Manuel de Castro Passos de Almeida
Ecosistema Hadoop:
- Armazenamento distribuído (HDFS)
- Negociador de recursos (YARN)
- Computação (MapReduce)
Software
11 Fevereiro 2026, 19:30 • Gabriela Eleutério Soares
Instalação e verificação do software
Spark em modo script e via shell
Inscrições dos grupos
Introdução
11 Fevereiro 2026, 18:00 • Gabriela Eleutério Soares
Funcionamento e avaliação da UC
Visão geral de Big Data
* Dados
* Small Data - Big Data
* 5 Vs
* Armazenamento, Processamento, Extração de valor
AulaTP01 - Software
11 Fevereiro 2026, 14:30 • Alexandre Manuel de Castro Passos de Almeida
Instalação e verificação do software
Spark em modo script e via shell
Inscrições dos grupos