Sumários

Introduction to basic spark operations

25 Fevereiro 2025, 19:30 João Pedro Oliveira


Introduction to basic PySpark operations to process data stored in csv or json files:
  • data ingestion
  • data cleaning
  • data transformation
  • data aggregation

Introduction to basic spark operations

25 Fevereiro 2025, 19:30 Rodrigo Francisco Guerreiro


Introduction to basic PySpark operations to process data stored in csv or json files:
  • data ingestion
  • data cleaning
  • data transformation
  • data aggregation

Machine learning pipeline para big data

25 Fevereiro 2025, 18:00 João Pedro Oliveira


Pipeline de aprendizagem automática para big data:
  • formulação do problema
  • recolha de dados
  • análise exploratória dos dados
  • escolha de características (features)
  • escolha e treino do modelo
  •  avaliação do modelo
  • afinação do modelo
  • entrada em produção

Introdução à linguagem de programação Spark

18 Fevereiro 2025, 19:30 João Pedro Oliveira


Exemplo de análise exploratória de um pequeno dataset usando o Spark.

Introdução à linguagem de programação Spark

18 Fevereiro 2025, 19:30 Rodrigo Francisco Guerreiro


Exemplo de análise exploratória de um pequeno dataset usando o Spark.