Currículo
Visualização para Big Data 03202
Contextos
Groupo: Escola de Tecnologias e Arquitetura > Optativas
ECTS
6.0 (para cálculo da média)
Objectivos
(SABER) OA1. Entender de que forma a visualização ajuda a extrair conhecimento de dados complexos e em larga escala. OA2. Entender os princípios e técnicas mais importantes de análise e visualização de dados em larga escala. OA3. Entender de que forma as características intrínsecas de big data afetam as técnicas clássicas de visualização. (SABER FAZER) OA4. Aplicar um processo estruturado de desenho e conceção para criação de visualizações eficazes. OA5. Construir sistemas em ambiente web para visualização exploratória de big data. (COMPETÊNCIAS TRANSVERSAIS) OA6. Discutir trabalhos de investigação recente, publicados na área de visualização. OA7. Trabalhar em equipa na execução de projetos de visualização.
Programa
CP1. Fundamentos de visualização para big data •O processo de visualização •Desafios decorrentes de características intrínsecas a big data •Diretivas para desenho e conceção de visualizações eficazes CP2. Técnicas de visualização exploratória de big data •Orientada ao pixel •Agregação e nível de detalhe •Distorção •Orientada por questões CP3. Redução de volume de dados •Amostragem •Agrupamento •Modelação CP4. Ferramentas e ambientes de programação •Programação web para criação de visualizações, por ex. utilizando D3 •Experiência prática com ferramentas direcionadas para big data – sistemas Hadoop/Spark •Experiência prática com notebooks de visualização exploratória de big data, em web, por ex. Apache Zeppelin •Desempenho computacional CP5. Construção de sistemas de visualização exploratória de big data •Streaming de dados em quase-tempo real •Baseados em grafos de grande dimensão •Baseados em tabelas de grande dimensão
Método de Avaliação
AULAS TEÓRICAS Usarão slides com ex., vídeos pedagógicos curtos, demos de ferramentas e, se apropriado, apresentações convidadas. AULAS PRÁTICAS Incluirão trabalhos de programação e análise de artigos científicos. Se apropriado, os trabalhos usarão tutoriais com código parcialmente fornecido, potenciando o uso de ferramentas de análise e visualização de dados. PROJETO FINAL DE GRUPO Incluirá o desenho e implementação dum sistema de visualização exploratória de big data, em ambiente web. | AVALIAÇÃO CONTÍNUA Inclui 3 componentes: •Trabalhos práticos de 2-3 alunos. (30%) O fator de ponderação de cada trabalho varia em função da sua dimensão e dificuldade. •Projeto final de 2-3 alunos. (30%) •Teste final escrito e individual. (40%) Nota mínima em cada componente: 8 em 20. EXAME FINAL A opção existente de realizar apenas um exame final (100%) não é encorajada, porque é difícil aprender as temáticas desta UC sem a experiência prática obtida numa avaliação contínua.
Carga Horária
Carga Horária de Contacto -
Trabalho Autónomo - 113.0
Carga Total -
Bibliografia
Principal
- •Jure Leskovec, Anand Rajaraman and Jeffrey David Ullman. Mining of Massive Datasets, 2nd Edition. Cambridge University Press, 2014 •Bill Chambers, Matei Zaharia. Spark: The Definitive Guide: Big data processing made simple. O’Reilly Media, 2017 •Matthew O. Ward, Georges Grinstein, Daniel Keim. Interactive Data Visualization: Foundations, Techniques, and Applications, 2nd Edition. CRC Press, 2015 :
Secundária
- •Jacques Bertin. Semiology of Graphics: Diagrams, Networks, Maps. Esri Press, 1983 (Reprinted in 2010) •Edward Tufte, The Visual Display of Quantitative Information, 2nd Edition. Graphics Press, 2001 •Alexandru C. Telea. Data Visualization: Principles and Practice. AK Peters/CRC Press, 2008 •Chaomei Chen. Information Visualization: Beyond the Horizon, 2nd Edition. Springer, 2010 •Robert Spence. Information Visualization: An Introduction, 3rd Edition. Springer, 2014 •Colin Ware. Information Visualization: Perception for Design, 3rd Edition. Morgan Kaufmann, 2012 •Tamara Munzner. Visualization Analysis & Design: Abstractions, Principles, and Methods. CRC Press, 2014 •Scott Murray. Interactive Data Visualization for the Web: An Introduction to Designing with D3, 2nd Edition. O’Reilly Media, 2017 •Small collection of research papers, software and online materials e.g. tutorials and pedagogical videos. That is the case of material related to systems and toolkits mentioned in the course e.g. D3, Hadoop, Spark and Apache Zeppelin. •Adriano Lopes. Slides of Big Data Visualization, available in the e-learning platform as the topics are delivered in the lectures. :