SISTEMAS DE APOIO À DECISÃO E MINERAÇÃO DE DADOS

Semestre 2012.2

 

Prof. Paulo Adeodato

CIn-UFPE

 

Objetivo

 

Ao concluir a disciplina o aluno terá experiência em mineração de dados.

 

A metodologia é escolher um problema real a ser atacado em equipe e realizar todos os passos necessários à sua resolução, seguindo o processo do CRISP-DM.

 

O projeto será sobre um problema que possa ser modelado como uma decisão binária, em função da disponibilidade de ferramental para avaliação de desempenho técnico e seu fácil mapeamento nos indicadores do domínio de aplicação.

 

Bibliografia

 

Livros

Data Mining: Concepts and Techniques

Jiawei Han and Micheline Kamber. Morgan Kaufmann Publishers, 2006.

 

Data Mining

Ian H. Witten and Eibe Frank. Morgan Kaufmann Publishers, 2005.

 

Data Mining Cookbook: Modeling Data for Marketing, Risk and Customer Relationship Management

Olivia Parr Rud. John Wiley & Sons, 2001.

 

Cross-Industry Standard Process for Data Mining

http://www.crisp-dm.org/CRISPWP-0800.pdf

 

Artigos

No-show consultas médicas

Efetivação de usuário

Transbordo em telefonia

Seleção de candidatos ao mestrado do CIn-UFPE

Falhas na rede elétrica

Cross-selling de crédito imobiliário

Celeridade processual no TCE-PE

 

Sites Recomendados

 

http://www.kdnuggets.com (site mais amplo de Data Mining com conferências, softwares, repositórios de dados, ofertas de emprego etc.)

http://www.dmreview.com (softwares, aplicações comerciais, problemas reais e apresentações gratuitas de mineração de dados)

http://www.spss.com (softwares da SPSS, aplicações reais, eventos e apresentações gratuitas de mineração de dados)

http://www.sas.com (softwares da SAS, aplicações reais, eventos e apresentações gratuitas de mineração de dados)

http://www.the-modeling-agency.com (Empresa de soluções e treinamento em aplicações reais)

 

Palestrantes convidados

 

Járley Nóbrega

Laílson Bandeira

 

Ferramentas

 

MS-Excel

Weka : http://en.wikipedia.org/wiki/WEKA e http://www.cs.waikato.ac.nz/~ml/weka/index.html

Rapid Miner: http://en.wikipedia.org/wiki/RapidMiner e http://rapid-i.com/

R: http://www.r-project.org/

 

Avaliação para Graduação e pós-graduação

 

Graduação e Pós-graduação

Projeto: 100% da avaliação

  • Artigo científico de 6 a 10 páginas (no formato do evento Qualis ≥ B3, para submissão)
  • Apresentação PowerPoint ou Impress

 

Temas das aulas:

 

  • Apresentação da disciplina e discussão dos potenciais projetos para escolha
  • O processo de descoberta de conhecimento em banco de dados
  • A metodologia para desenvolvimento de soluções com mineração de dados CRISP-DM
  • Modelagem de problemas reais binários
  • Aplicações práticas da descoberta de conhecimento em banco de dados e Escolha dos projetos (equipes de 3 ou 4 alunos)
  • Erros típicos em projetos de KDD
  • Demonstração do desenvolvimento e da solução de um sistema de apoio à decisão (NeuroTech)
  • Princípios da aprendizagem baseada em dados
  • OLAP: consultas analíticas em um data warehouse e Aula Prática com o Excel (Tabelas dinâmicas)

 

Entrega da 1a parte do artigo (problema caracterizado como binário, indicadores de desempenho definidos e dados e visão analisados)

 

  • Modelagem dos problemas
  • Tipologia dos dados de entrada
  • Problemática geral da preparação de dados
  • Orientação de projetos

 

Entrega da 2a parte do artigo (visão montada e dados transformados)

 

  • Weka: ferramenta de modelagem
  • RapidMiner: ferramenta de modelagem
  • Tanagra: ferramenta de modelagem
  • Visão geral das técnicas de classificação, estimação e indução de regras
  • Tipologia do conhecimento de saída
  • Validação estatística do conhecimento minerado
  • Orientação de projetos

 

Entrega da 3a parte do artigo (conhecimento extraído e desempenho avaliado)

 

  • Revisão, correção e integração das partes.

 

Entrega do artigo final (conjugação das partes anteriores corrigidas) e Apresentação de Projeto para toda a turma

 

O artigo final deverá estar no formato especificado para submissão ao evento escolhido.

 

 

Pré-requisitos:

 

  • Fundamentos de Inteligência Artificial
  • Estatística básica

 

Maiores eventos científicos focados em Mineração de Dados: