Sumários
AulaTP02 - MapReduce
3 Março 2026, 19:30 • Alexandre Manuel de Castro Passos de Almeida
Parte A - Aplicação do MapReduce
Resolução apoiada dos exercícios 1 a 3
Resolução proposta dos 'divisores'
Parte B - Frontend do pipeline
Ingestão e limpeza dos dados com PySpark
Proposta de TPC
AulaT02 - Hadoop
3 Março 2026, 18:00 • Alexandre Manuel de Castro Passos de Almeida
Ecosistema Hadoop:
Armazenamento distribuído (HDFS)
Negociador de recursos (YARN)
Computação (MapReduce)
AulaTP01 - Software
24 Fevereiro 2026, 19:30 • Alexandre Manuel de Castro Passos de Almeida
Instalação e verificação do software (Docker)
Teste do Spark em modo script e via shell
Inscrições dos grupos
Software
24 Fevereiro 2026, 19:30 • Gabriela Eleutério Soares
Instalação e verificação do software
Spark em modo script e via shell
Inscrições dos grupos
AulaT01 - Introdução
24 Fevereiro 2026, 18:00 • Alexandre Manuel de Castro Passos de Almeida
Funcionamento e avaliação da UC
Visão geral de Big Data (Conceitos, Tecnologias, Ética)
* Dados
* Small Data - Big Data
* 5 Vs
* Armazenamento, Processamento, Extração de valor