Sumários

Agrupamento

11 Março 2021, 18:00 Rita Sousa


Conceitos e medidas de distâncias. Estratégias de agrupamento: hierárquica e de atribuição de pontos a agrupamentos. Algoritmos k-means e CURE.

Introdução ao Apache Spark

4 Março 2021, 19:30 Rita Sousa


Princípios de execução da plataforma Apache Spark (continuação da aula anterior). Exercício.

Redução de dimensionalidade

4 Março 2021, 18:00 Rita Sousa


Decomposição de matrizes. Métodos Singular Value Decomposition (SVD) e CUR. Análise de componentes principais através do algoritmo PCA.

Introdução ao Apache Spark

25 Fevereiro 2021, 19:30 Rita Sousa


Enquadramento, arquitectura e princípios de execução da plataforma Apache Spark.

Apache Hadoop, HDFS e MapReduce

25 Fevereiro 2021, 18:00 Rita Sousa


Conceitos fundamentais e eco-sistema associado a Apache Hadoop. Sistema distribuído de ficheiros HFDS. Algoritmo de programação paralela MapReduce.