Sumários
Teste 2, Melhoria da Água, Aula 12, Aula 14
11 Abril 2025, 14:00 • Vitória Albuquerque
Teste 2
Melhoria da Água
Modelação
Agrupamento
Distância entre variáveis numéricas
Distância entre variáveis nominais
Distância entre variáveis mistas
Métodos de agrupamento
K-Means
Validação de clusters (externa)
Validação de clusters (interna) - coeficiente de silhoueta
K-Medoids
Métodos hierárquicos
Métodos hierárquicos - hclust()
Métodos hierárquicos - dendograma
Validação com silhouette
Agrupamento baseado em densidade
Modelação em Análise de Dados
Modelos Estatísticos
Modelos Gráficos
Análise de Séries Temporais
Aprendizagem Automática Supervisionada
Aprendizagem Automática Não Supervisionada
Aprendizagem Automática Profunda
Construção de Modelos
Aplicações
Desafios
Considerações Éticas
Modelos Preditivos
Análise Preditiva
Árvore de Decisão
Máquinas de Vetor de Suporte
Redes Neuronais Artificiais
Teste 2, Exercícios Práticos, Acompanhamento do Projeto Final
11 Abril 2025, 09:30 • Vitória Albuquerque
Teste 2
Exercícios Práticos
Acompanhamento do Projeto Final
Aula 15, Aula 16
9 Abril 2025, 09:30 • Vitória Albuquerque
Avaliação de Modelos
Performance Preditiva
Matriz de Confusão
Taxa de Erro e Precisão (Accuracy)
Matriz Custo/Benefício
Matriz Positivos/Negativos
Precisão (Precision), Recall, F1
Erro Quadrático Médio e Erro Absoluto Médio
Erro Quadrático Médio e Erro Absoluto Médio Normalizados
Pacotes R para Métricas de Avaliação de Modelos
Performance Preditiva
Holdout e Random Subampling
Validação Cruzada (Cross Validation)
Estimativas de Bootstrap
Procedimentos Recomendados
Reporte e Deployment
Reporting com documentos dinâmicos
Reporting com aplicações web
Shiny
Aula 8, Aula 9, Aula 10, Aula 11
4 Abril 2025, 14:00 • Vitória Albuquerque
Arrumação de dados
Datas
Cadeias de caracteres
Valores desconhecidos
Transformação de variáveis
Lidar com dependências de casos
Datasets de texto
Redução da dimensionalidade
Amostragem de linhas
Sumarização de dados
O valor mais comum
Variabilidade dos dados
Valores estranhos nos dados
Valores discrepantes (outliers)
Visualização de dados em R
Boas práticas com gráficos de barras
10 boas práticas para os gráficos estatísticos
Probabilidade discreta e contínua
Simulação Monte-Carlo
Simulação Monte-Carlo - com e sem substituição
Fixar a semente aleatória
Usar a função mean para calcular a probabilidade
Distribuição de probabilidades para variável discreta
Independência
Regra da Multiplicação
Regra da Adição
Combinações e Permutações
Teorema de Bayes
Blackjack
Blackjack - Monte Carlo
Aniversários - Monte Carlo
Aniversários - Probabilidade Exata
Variáveis aleatórias
Distribuição de uma lista de números e distribuição de probabilidade de uma variável aleatória
Distribuição de probabilidade de variável aleatória
Valor Esperado de uma variável aleatória
Variância de uma variável aleatória
Amostra e População
Erro Padrão de uma variável aleatória
Distribuição de probabilidades para variável contínua
Função Cumulativa da Distribuição Experimental (FCDe)
Função Cumulativa da Distribuição (FCD)
Função Densidade de Probabilidade (FDP)
Simulações de Monte Carlo com variáveis contínuas
Distribuições em R
A Distribuição Uniforme
A Distribuição Normal
Teorema do Limite Central
Tamanho dos bins nos histogramas
Boxplots
Gráficos condicionados a variáveis
Gráficos condicionados com facets
Gráficos de Dispersão (scatterplots)
Mostrar valores por grupo (standard)
Mostrar valores por grupo (ggplot2)
Pacote GGally
Melhoria da Água, Aula 11, Aula 12, Aula 13, Aula 14
4 Abril 2025, 09:30 • Vitória Albuquerque
Melhoria da Água
Modelação
Probabilidade discreta e contínua
Simulação Monte-Carlo
Simulação Monte-Carlo - com e sem substituição
Fixar a semente aleatória
Usar a função mean para calcular a probabilidade
Distribuição de probabilidades para variável discreta
Independência
Regra da Multiplicação
Regra da Adição
Combinações e Permutações
Teorema de Bayes
Blackjack
Blackjack - Monte Carlo
Aniversários - Monte Carlo
Aniversários - Probabilidade Exata
Variáveis aleatórias
Distribuição de uma lista de números e distribuição de probabilidade de uma variável aleatória
Distribuição de probabilidade de variável aleatória
Valor Esperado de uma variável aleatória
Variância de uma variável aleatória
Amostra e População
Erro Padrão de uma variável aleatória
Distribuição de probabilidades para variável contínua
Função Cumulativa da Distribuição Experimental (FCDe)
Função Cumulativa da Distribuição (FCD)
Função Densidade de Probabilidade (FDP)
Simulações de Monte Carlo com variáveis contínuas
Distribuições em R
A Distribuição Uniforme
A Distribuição Normal
Teorema do Limite Central
Agrupamento
Distância entre variáveis numéricas
Distância entre variáveis nominais
Distância entre variáveis mistas
Métodos de agrupamento
K-Means
Validação de clusters (externa)
Validação de clusters (interna) - coeficiente de silhoueta
K-Medoids
Métodos hierárquicos
Métodos hierárquicos - hclust()
Métodos hierárquicos - dendograma
Validação com silhouette
Agrupamento baseado em densidade
Modelação em Análise de Dados
Modelos Estatísticos
Modelos Gráficos
Análise de Séries Temporais
Aprendizagem Automática Supervisionada
Aprendizagem Automática Não Supervisionada
Aprendizagem Automática Profunda
Construção de Modelos
Aplicações
Desafios
Considerações Éticas
Modelos Preditivos
Análise Preditiva
Árvore de Decisão
Máquinas de Vetor de Suporte
Redes Neuronais Artificiais
Regras de Associação
Modelação de dependência de variáveis
Relação entre Modelação e Dependência
Desafios
Modelação de dependência entre variáveis com regras de associação
Medidas de Interesse
Algorítmos Comuns
Aplicações Práticas
Limitações das regras de Associação
Etapas de Processamento
Exemplo da aplicação
O modelo da cesta de compras
Exemplo com o Boston dataset
Variáveis de Boston dataset
Seleção e Pré-processamento de Dados
Geração de Regras
Resultados