Sumários

AulaTP02 - MapReduce

3 Março 2026, 19:30 Alexandre Manuel de Castro Passos de Almeida


Parte A - Aplicação do MapReduce

Resolução apoiada dos exercícios 1 a 3

Resolução proposta dos 'divisores'

Parte B - Frontend do pipeline

Ingestão e limpeza dos dados com PySpark

Proposta de TPC


AulaT02 - Hadoop

3 Março 2026, 18:00 Alexandre Manuel de Castro Passos de Almeida


Ecosistema Hadoop:

Armazenamento distribuído (HDFS)

Negociador de recursos (YARN)

Computação (MapReduce)


AulaTP01 - Software

24 Fevereiro 2026, 19:30 Alexandre Manuel de Castro Passos de Almeida


Instalação e verificação do software (Docker)
Teste do Spark em modo script e via shell
Inscrições dos grupos

Software

24 Fevereiro 2026, 19:30 Gabriela Eleutério Soares


Instalação e verificação do software
Spark em modo script e via shell
Inscrições dos grupos

AulaT01 - Introdução

24 Fevereiro 2026, 18:00 Alexandre Manuel de Castro Passos de Almeida


Funcionamento e avaliação da UC

Visão geral de Big Data (Conceitos, Tecnologias, Ética)

  * Dados

  * Small Data - Big Data

  * 5 Vs

  * Armazenamento, Processamento, Extração de valor