Currículo
Text Mining 02870
Contextos
Groupo: Sistemas Integrados de Apoio à Decisão - 2020 > 2º Ciclo > Parte Escolar > Unidades Curriculares Obrigatórias
ECTS
6.0 (para cálculo da média)
Objectivos
OA1. Compreender os fundamentos e desafios de Text Mining OA2. Conhecer técnicas de preparação, limpeza e representação de documentos OA3. Aplicar métodos de Processamento Computacional da Língua OA4. Classificar textos usando aprendizagem automática OA5: Agrupar documentos usando modelos de tópicos OA6. Aplicar na prática técnicas de Text Mining OA7: Descrever os conceitos, etapas e métodos principais envolvidos no desenvolvimento de processos de Text Mining OA8: Explicar o funcionamento de algoritmos avançados para extração de informação e classificação de texto e a sua aplicação no tratamento de casos reais OA9: Selecionar as técnicas apropriadas para tarefas específicas de análise de texto e avaliar os benefícios e desafios das opções adoptadas
Programa
Introdução CP1: Utilidade de grandes quantidades de texto, desafios e métodos atuais CP2: Informação não estruturada vs. (semi-)estruturada CP3: Obtenção e filtragem de informação, extração de informação e Data Mining Representação de documentos CP4: Preparação e limpeza de documentos CP5: Extração de propriedades CP6: Estratégias de pesagem de termos CP7: Modelos de espaços vectoriais CP8: Medidas de similaridade Processamento Computacional da Língua CP9: Modelos de língua CP10: Morfologia e análise morfossintática CP11: Estruturas complexas: análise sintáctica CP12: Extração de informação Classificação de Texto CP13: Introdução à aprendizagem automática estatística CP14: Medidas de avaliação CP15: Classificadores generativos CP16: Classificadores discriminativos CP17: Aprendizagem não supervisionada CP18: Recursos para Text Mining Casos de Estudo CP19: Análise de sentimento CP20: Identificação de tópicos
Método de Avaliação
Apenas é possível obter aprovação a esta UC por avaliação ao longo do semestre, não contemplando a modalidade de avaliação por exame. Componentes de avaliação: a) TESTES (2 mini-testes: 5% cada, teste final: 30%), realizados durante o período letivo; b) TRABALHOS (2 trabalhos, 30% cada), entregues e apresentados durante o período letivo. Os trabalhos podem ser realizados individualmente ou em grupo, sendo o número de elementos do grupo definido nos enunciados dos trabalhos. Não existindo notas mínimas, a nota de TRABALHOS está limitada à nota de TESTES + 6 valores. Exemplos de cálculo da nota final: TRABALHOS = 20, TESTES = 14 --> Nota Final = 18 TRABALHOS = 20, TESTES = 10 --> Nota Final = 14 (a nota da componente TRABALHOS foi limitada a 16 valores = 10 + 6) Em caso de reprovação, a nota de TESTES pode ser substituída por uma prova escrita a realizar no período de avaliação correspondente à 1º época, 2ª época ou época especial. Os estudantes poderão melhorar a nota da componente TESTES através de uma prova escrita, a realizar durante o período de avaliação correspondente à 1ª época. Os estudantes que o pretendam fazer, devem informar os docentes assim que forem divulgadas as notas da avaliação periódica. A assiduidade não é requisito de aprovação.
Carga Horária
Carga Horária de Contacto -
Trabalho Autónomo - 113.0
Carga Total -
Bibliografia
Principal
- Charu C. Aggarwal, Machine Learning for Text, 2018, null, https://link.springer.com/book/10.1007/978-3-319-73531-3 Gabe Ignatow, Rada F. Mihalcea, An Introduction to Text Mining: Research Design, Data Collection, and Analysis — 1st Edition, 2017, null, https://methods.sagepub.com/book/an-introduction-to-text-mining Dan Jurafsky and James H. Martin, Speech and Language Processing (3rd ed. draft), 2020, null, https://web.stanford.edu/~jurafsky/slp3/:
Secundária
- Atefeh Farzindar and Diana Inkpen, Natural Language Processing for Social Media, Second Edition. Synthesis Lectures on Human Language Technologies, 2018, null, https://link.springer.com/book/10.1007/978-3-031-02167-1 Jacob Eisenstein, Introduction to Natural Language Processing, 2019, null, https://mitpress.mit.edu/9780262042840/introduction-to-natural-language-processing/: