Sumários

AulaT04 - Pipeline

17 Março 2026, 18:00 Alexandre Manuel de Castro Passos de Almeida


Etapas
Recolha dos dados
Formulação do problema
Avaliação dos dados
Identificação de características
Seleção de características
Seleção e treino de modelos
Avaliação de modelos
Optimização do modelo
Implantação do modelo


AulaTP03 - PySpark

10 Março 2026, 19:30 Alexandre Manuel de Castro Passos de Almeida


PySpark (Data Processing - exercícios 5 a 16)

Proposta de TPC (para realizar em casa)

PySpark - Data Processing

10 Março 2026, 19:30 Gabriela Eleutério Soares


  • PySpark (Data Processing - exercícios 5 a 16)
  • Proposta de TPC (para realizar em casa)
  • AulaT03 - Spark

    10 Março 2026, 18:00 Alexandre Manuel de Castro Passos de Almeida


    • Contexto
    • DataFrames
    • Arquitectura
    • Transformações/Acções



    AulaTP02 - MapReduce

    3 Março 2026, 19:30 Alexandre Manuel de Castro Passos de Almeida


    Parte A - Aplicação do MapReduce

    Resolução apoiada dos exercícios 1 a 3

    Resolução proposta dos 'divisores'

    Parte B - Frontend do pipeline

    Ingestão e limpeza dos dados com PySpark

    Proposta de TPC