Sumários
Aula 8, Atividade Modelos de Aprendizagem da Máquina, Melhoria da Água e Aula 11
15 Novembro 2024, 09:30 • Vitória Albuquerque
Cadeias de caracteres
Valores desconhecidos
Transformação de variáveis
Criar variáveis
Lidar com a dependência de casos
Datasets de texto
Redução da dimensionalidade
Amostragem de linhas
Apresentação e discussão dos Modelos de Aprendizagem da Máquina (regressão linear simples, regressão linear múltipla, árvore de regressão, árvore de decisão, floresta aleatória, K-Means, DBSCAN) pelos alunos
Modelação
Avaliação dos Modelos
Probabilidade discreta e contínua
Simulação Monte-Carlo
Simulação Monte-Carlo - com e sem substituição
Fixar a semente aleatória
Usar a função mean para calcular a probabilidade
Distribuição de probabilidades para uma variável discreta
Independência
Regra da Multiplicação
Regra da Adição
Combinações e Permutações
Teorema de Bayes
Blackjack
Blackjack - Monte Carlo
Aniversários - Monte Carlo
Aniversários - Probabilidade Exata
Variáveis aleatória
Distribuição de uma lista de números
Distribuição de probabilidade de uma variável aleatória
Valor esperado de uma variável aleatória
Variância de uma variável aleatória
Amostra e População
Função Cumulativa da Distribuição Experimental (FCDe)
Função Cumulativa da Distribuição (FCD)
Função Cumulativa de Probabilidade (FCP)
Simulação de Monte Carlo para variáveis contínuas
Distribuições e R
A Distribuição Uniforme
A Distribuição Normal
Teorema do Limite Central
Aula 12
14 Novembro 2024, 09:30 • António Jorge Filipe Fonseca
Agrupamento
Distância entre variáveis numéricas
Distância entre variáveis nominais
Distância entre variáveis mistas
Métodos de agrupamento
Métodos de particionamento
K-Means
Validação dos clusters (externa)
Validação dos clusters (interna) - coeficiente de silhoueta
Validação dos clusters (interna)
K-Medoids
Métodos hierárquicos
Métodos hierárquicos - hclust()
Métodos hierárquicos - dendograma
Validação com silhouette
Agrupamento baseado em densidade
Aula 13
12 Novembro 2024, 14:00 • António Jorge Filipe Fonseca
Regras de Associação
Modelação de dependências entre variáveis
Relação entre Modelação e Dependência
Tipos de Dependências
Modelação de dependências entre variáveis com regras de associação
Medidas de Interesse
Algoritmos Comuns
Aplicações Práticas
Limitações das Regras de Associação
Etapas do Processamento
Exemplo de aplicação
O modelo de cesta de compras
Exemplo com o Boston dataset
Variáveis do Boston dataset
Variáveis do Boston dataset
Seleção e Pré-processamento dos Dados
Geração de Regras
Resultados
Aula 12
11 Novembro 2024, 14:00 • António Jorge Filipe Fonseca
Agrupamento
Distância entre variáveis numéricas
Distância entre variáveis nominais
Distância entre variáveis mistas
Métodos de agrupamento
Métodos de particionamento
K-Means
Validação dos clusters (externa)
Validação dos clusters (interna) - coeficiente de silhoueta
Validação dos clusters (interna)
K-Medoids
Métodos hierárquicos
Métodos hierárquicos - hclust()
Métodos hierárquicos - dendograma
Validação com silhouette
Agrupamento baseado em densidade
Melhoria da Água, Aula 8, Aula 9 e Aula 10
8 Novembro 2024, 09:30 • Vitória Albuquerque
Entendimento dos dados
Preparação dos dados
Arrumação de dados
Datas
Sumarização dos dados
O valor mais comum
Variabilidade dos dados
Valores estranhos nos dados
Valores discrepantes (outliers)
Visualização de dados em R
Boas práticas com gráficos de barras
10 boas práticas para os gráficos estatísticos
Tamanho dos bins nos histogramas
Boxplots
Gráficos condicionados a variáveis
Gráficos condicionados com facets
Gráficos de Dispersão (scatterplots)
Mostrar valores por grupos (standard)
Mostrar valores por grupos (ggplot2)
Pacote GGally