Sumários

Sumário

3 Novembro 2025, 14:00 Paulo Jorge Mestre Vieira


Limpeza e integração de dados. ETL vs ELT. Introdução ao PySpark.

Sumário

27 Outubro 2025, 14:00 Paulo Jorge Mestre Vieira


Continuação do estudo da arquitetura de computação para Big Data: Exemplo da plataforma Hadoop e do seu sistema de ficheiros distribuído. O modelo de programação MapReduce. O processo de Ingestão de dados. Tipos de ingestão: batch e streaming. Apoio ao desenvolvimento do projecto prático.

Sumário

20 Outubro 2025, 14:00 Paulo Jorge Mestre Vieira


Revisões. Teste de avaliação.

Sumário

13 Outubro 2025, 14:00 Paulo Jorge Mestre Vieira


Continuação da Arquitetura de computação para Big Data: Exemplo da plataforma Hadoop e do seu sistema de ficheiros distribuído. O modelo de programação MapReduce. Apresentação da Tarefa Semanal 4.

Sumário

6 Outubro 2025, 14:00 Paulo Jorge Mestre Vieira


Arquitetura de computação para Big Data: (1) redundante e tolerante a falhas e (2) distribuída para suportar grandes volumes de dados.