Ficha Unidade Curricular (FUC)

Informação Geral / General Information


Código :
04102
Acrónimo :
04102
Ciclo :
1.º ciclo
Línguas de Ensino :
Português (pt)
Língua(s) amigável(eis) :
Inglês, Português

Carga Horária / Course Load


Semestre :
1
Créditos ECTS :
6.0
Aula Teórica (T) :
0.0h/sem
Aula Teórico-Prática (TP) :
36.0h/sem
Aula Prática e Laboratorial (PL) :
0.0h/sem
Trabalho de Campo (TC) :
0.0h/sem
Seminario (S) :
0.0h/sem
Estágio (E) :
0.0h/sem
Orientação Tutorial (OT) :
1.0h/sem
Outras (O) :
0.0h/sem
Horas de Contacto :
37.0h/sem
Trabalho Autónomo :
113.0
Horas de Trabalho Total :
150.0h/sem

Área científica / Scientific area


460 - Matemática e estatística

Departamento / Department


Departamento de Tecnologias Digitais

Ano letivo / Execution Year


2023/2024

Pré-requisitos / Pre-Requisites


Não tem

Objetivos Gerais / Objectives


Esta Unidade Curricular visa desenvolver competências em aprendizagem automática supervisionada. Assim, os alunos irão ser capazes de extrair de conhecimento a partir de dados de organizações das mais variadas áreas de intervenção. Os alunos tomarão contato com vários problemas para os quais existem dados que os caracterizam, através de projetos apresentados e discutidos nas aulas laboratorais. Os alunos adquirirão conhecimento em metodologias para a proposta de soluções a partir desses dados que envolvam o treino de modelos de regressão e de classificação.

Objetivos de Aprendizagem e a sua compatibilidade com o método de ensino (conhecimentos, aptidões e competências a desenvolver pelos estudantes) / Learning outcomes


OA1: O processo de descoberta de conhecimento a partir de dados e as etapas usuais OA2: A metodologia CRISP-DM (Cross Industry Standard Process for Data Mining) OA3: Caracterização de problemas a partir de dados e preparação dos mesmos OA4: Problemas de regressão OA5: Problemas de classificação OA6: Regressão linear e logística OA7: Árvores de decisão OA8: Naive-Bayes OA9: Redes neuronais artificiais OA10: Máquinas de vetores de supporte OA11. Desenvolvimento, de forma autónoma, de soluções para problemas específicos de casos do mundo real que envolvam preparação de dados, modelação e avaliação dos resultados

Conteúdos Programáticos / Syllabus


CP1: A caracterização de um problema a partir de dados existentes (de uma ou mais fontes); CP2: A importância da seleção das variáveis adequadas; CP3: Introdução à extração de conhecimento a partir de dados (Data Mining) e principais metodologias; CP4: Tratamento e preparação de dados; CP5: Problemas de classificação (e.g., sequence labeling) e métricas; CP6: Problemas de regressão e métricas; CP7: Regressão linear e logística CP8: Árvores de decisão CP9: Naive-Bayes CP10: Redes neuronais artificiais CP11: Máquinas de vetores de suporte

Demonstração da coerência dos conteúdos programáticos com os objetivos de aprendizagem da UC / Evidence that the curricular units content dovetails with the specified learning outcomes


São, de seguida, indicados através dos códigos referidos nos objetivos e no programa, quais são os elementos do programa que respondem a cada um dos objetivos: OA1: CP1; CP3 OA2: CP3; CP4; CP5; CP6 OA3: CP1; CP2; CP5; CP6 OA4: CP5 OA5: CP6 OA6: CP7 OA7: CP8 OA8: CP9 OA9: CP10 OA10: CP11 OA11: CP1-CP11

Avaliação / Assessment


Os alunos são avaliados a 100% por um projeto, nos seguintes moldes: - 1ª Época: projeto realizado em grupos de alunos ao longo do semestre e acompanhado com aulas de tutorias (12 horas) (50%). Discussão individual na 1ª época de avaliação (50%). - 2ª Época e Época especial: projeto individual

Metodologias de Ensino / Teaching methodologies


O processo de aprendizagem é essencialmente prático na medida em que os problemas são primeiramente apresentados e os alunos são sensibilizados para a importância da sua resolução. À medida que a aula flui, os conceitos teóricos são apresentados após se explicar como cada situação específica é endereçada. Desta forma, o ensino é guiado essencialmente pela prática.

Demonstração da coerência das metodologias de ensino e avaliação com os objetivos de aprendizagem da UC / Evidence that the teaching and assessment methodologies are appropriate for the learning outcomes


Inicialmente, os alunos tomam contacto com problemas para os quais é necessário identificar dados que os caracterizam. É através desses problemas que os primeiros conceitos são expostos (OA1 e OA3). Posteriormente, em aulas de laboratório, os alunos desenvolvem, através da metodologia CRISP-DM, pequenos scripts para resolver as várias etapas do processo de descoberta de conhecimento a partir de dados (OA2-OA5). Durante essas aulas, os conceitos teóricos vão sendo gradualmente introduzidos, de forma a facilitar a conexão entre teoria e prática. Em paralelo, são apresentados diversos algoritmos de aprendizagem automática para realização de modelação preditiva (OA6-OA10), onde também é expressa a necessidade de desenvolvimento autónomo de soluções para problemas específicos do mundo real que envolvam preparação de dados, modelação e avaliação dos resultados (OA11). Durante as aulas de laboratório, é apresentado o enunciado do projeto a ser desenvolvido em trabalho autónomo. O projeto é acompanhado por aulas de tutoria, num modelo em que o docente transmite o conhecimento ao mesmo tempo que assume o papel de "cliente" ao qual o projeto tem de ser entregue (OA1-OA3; OA9-OA11).

Observações / Observations


-

Bibliografia Principal / Main Bibliography


Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining: Practical machine learning tools and techniques. Morgan Kaufmann. Sharda, R., Delen, D., Turban, E., Aronson, J., & Liang, T. P. (2014). Businesss Intelligence and Analytics: Systems for Decision Support. Prentice Hall. VanderPlas, J. (2016). Python Data Science Handbook. O’Reilly Media.

Bibliografia Secundária / Secondary Bibliography


Foster Provost, Tom Fawcett (2013) Data Science for Business. What you need to know about data mining and data-analytic thinking, 1st edition. O'Reilly. Ller, A. & Guido, S. (2017). Introduction To Machine Learning with Python: A Guide for Data Scientists. Sebastopol, CA: O'Reilly Media, Inc. Avila, J. (2017). Scikit-Learn Cookbook - Second Edition. Birmingham: Packt Publishing. Mueller, J. P. (2019). Python for Data Science for Dummies, 2nd Edition (2.a ed.). John Wiley & Sons. McKinney, W. (2022). Python for Data Analysis: Data Wrangling with Pandas, NumPy, and Jupyter (3.a ed.). O’Reilly Media.

Data da última atualização / Last Update Date


2024-02-16