Currículo
Tópicos Avançados em Business Intelligence 02676
Contextos
Groupo: Sistemas Integrados de Apoio à Decisão > 2º Ciclo > Parte Escolar > Optativas > 2º Ano
ECTS
6.0 (para cálculo da média)
Objectivos
Módulo 1: Text Mining e Classificação OA1: Identificar as abordagens mais comuns de preparação de dados e representação de textos OA2: Descrever os algoritmos mais relevantes de Text Mining e classificação de texto, bem como os conceitos associados OA3: Ilustrar a aplicação de Text Mining a problemas reais Módulo 2: Big Data OA4: Reconhecer as tendências e problemas actuais em Big Data Analytics OA5: Identificar as soluções actuais propostas para analisar grandes e diversos volumes de dados e as técnicas que permitem a sua resolução OA6: Compreender um exemplo de aplicação de técnicas de Aprendizagem Automática e Data Analytics a um problema Módulo 3: Análise Multicritério OA7: Quantificar a importância relativa dos critérios de avaliação e das alternativas num problema de decisão multicritério OA8: Identificar e utilizar software apropriado à Análise Multicritério Global: OA9: Propor e desenhar uma solução para um problema em uma das três áreas temáticas
Programa
CP1: Representação de textos e extração de features. CP2: Classificação de Texto: preparação de dados, técnicas de classificação e exemplos práticos. CP3: Aplicação de Text Mining a problemas reais, oportunidades e desafios CP4: Introdução aos problemas e técnicas de Big Data Analytics CP5. Técnicas de aprendizagem não-supervisionada, supervisionada e procura CP6. Ferramentas para Big Data CP7. Caso de estudo em Big Data Analytics CP8: Análise Multicritério em problemas de decisão. Agente de decisão. Estruturação e operacionalização de problemas CP9: Modelação de preferências e função valor. Normalização. Agregação e avaliação global CP10: Aplicação de métodos de Análise Multicritério (AHP e MACBETH)
Método de Avaliação
As 36h lectivas são divididas em 18h teóricas (T) e 18h Teórico/práticas (TP). Cada módulo tem uma componente lectiva de 12h (6h-T + 6h-TP). As aulas T são de natureza expositiva e permitem apresentar os fundamentos teóricos dos três módulos. As aulas TP permitem consolidar os conceitos leccionados nas aulas T, através da resolução de exercícios e da discussão de casos de estudo. | Avaliação contínua: nota mínima de 8/20 valores em todas as componentes. A avaliação contínua da UC é composta pelas seguintes componentes: - Projecto final individual + escrita artigo de 8-12 páginas: 55% - Apresentação em workshop: 25% - Participação no debate no workshop: 20% A UC não pode ser feita por exame.
Carga Horária
Carga Horária de Contacto -
Trabalho Autónomo - 113.0
Carga Total -
Bibliografia
Principal
- Roman B. Statnikov and Joseph B. Matusov, Multicriteria Analysis in Engineering, Springer-Science+Business Media, B.V., 2002 Communities and Local Government, Multi-criteria analysis: a manual. Communities and Local Government Publications [Online], 2009 Tom Mitchell. Machine Learning, McGraw Hill, 1997, ISBN 978-0070428072 Ethem Alpaydin. Introduction to Machine Learning. MIT Press (2010). ISBN 026201243X. Edd Dumbill, Jeremy Howard, Margit Zwemer, Mike Loukides, Aria Haghighi, Mac Slocum, Alistair Croll, Jim Stogdill, Andy Kirk, Tim O’Reilly, Julie Steels, Colin Hill, Alex Howard, Big Data Now: 2012 Edition, O’Reilly Media, Inc., O´Reilly, STRATA Conference. Ian H. Witten, Eibe Frank, and Mark A. Hall. Data Mining: Practical Machine Learning Tools and Techniques (Third Edition). 2011. Morgan Kaufman. ISBN: 978-0-12-374856-0 Sholom M. Weiss, Nitin Indurkhya, and Tong Zhang. Fundamentals of Predictive Text Mining. 2010. Springer. ISBN: 978-1-84996-225-4. :
Secundária
- Stanley Zionts, Mutiple Criteria problem solving, Springer-Verlag, Berlin, 1978 G. Fandel and T. Gal, Multiple criteria decision making: theory and application, Springer-Verlag, Berlin,1980 Tom White. Hadoop: The Definitive Guide, O’Reilly, ISBN 978-0262012430. Cathy O'Neil , Rachel Schutt, Doing Data Science: Straight Talk from the Frontline, O’Reilly, 2013, ISBN 978-1449358655. Chris Manning and Hinrich Schütze. Foundations of Statistical Natural Language Processing. 1999. MIT Press. ISBN: 0-262-13360-1 Daniel Jurafsky and James H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition (Second Edition). 2008. Pearson Prentice Hall. ISBN: 978-0131873216 :