Aprendizagem de Máquina

Mestrado e Doutorado em Informática

Primeiro Trimestre 2014

Os materiais disponibilizados nesta página encontram-se em diferentes formatos. As transparências apresentadas em aula estão no formato PDF, representados pelo ícone []. Para visualizar os arquivos PDF corretamente, você precisa ter instalado em seu computador o Adobe Acrobat Reader []. Note que está material está em constante atualização. Sempre que houver uma atualização aparecerá ao lado do ícone [] o ícone []. Poderão aparecer também nesta página documentos em outros formatos, como por exemplo, Microsoft Word [], Microsoft Powerpoint [] além de links para outras páginas []. Note que parte do material possui acesso restrito através de um login e senha.

Avisos
2.6.2014 Disponibilizado o resultado das avaliações.
28.4.2014 Disponibilizada a Segunda Avaliação Prática. Entrega até 15/5/2014.
13.4.2014 Disponibilizada a Primeira Avaliação Prática. Entrega até 23/4/2014.
5.2.2014 Nesta página serão disponibilizadas ao longo do semestre informações importantes a respeito da disciplina. Portanto, consulte esta página regularmente.
Disciplina
Carga Horária  
Carga Horária Total: 30h/a.
Carga Horária Semanal: 5h/a, sendo em média 2h/a teóricas e 2h/a práticas.
   
Apresentação  
Aprendizagem de máquina está relacionada com programas computacionais que melhoram seu desempenho automaticamente através da experiência. Os métodos de aprendizagem de máquina têm sido utilizados em diversas aplicações como veículos autônomos que aprendem a dirigir em vias expressas, reconhecimento da fala, detecção de fraudes em cartões de crédito, estratégias para a construção de jogos, programas de mineração de dados que descobrem regras gerais em grandes bases de dados, etc.
   
Objetivos  
O objetivo principal desta disciplina é apresentar os principais paradigmas de aprendizagem de máquina, incluindo uma variedade de algoritmos e técnicas como: aprendizagem de conceitos, árvores de decisão, redes neurais, métodos probabilísticos de aprendizagem e aprendizagem não-supervisionada. Aproximadamente 50% da carga horária será dedicada a aulas práticas em laboratório onde os principais algoritmos serão implementados e testados em dados sintéticos e reais.
   
Referências Bibliograficas
  • T. M. Mitchell. Machine Learning. McGraw–Hill Science/Engineering/Math, 432 páginas, ISBN 0070428077, 1997.
  • R. O. Duda, P. E. Hart, D. G. Stork. Pattern Classification, 2nd edition, Wiley-Interscience, 2000. ISBN 0471056693.
  • S. Theodoridis, K. Koutroumbas. Pattern Recognition. Academic Press. 625 páginas, ISBN 0126861404.
   
Ementa  
1) Introdução: Por que a Aprendizagem Computacional é Difícil? Problemas de Aprendizagem. Projetando um Sistema de Aprendizagem de Máquina. Exemplos. Tipos de Aprendizagem. Aplicações. 2) Extração de Características: Importância. Redução de Dimensionalidade. Características Discriminantes. Geração de Características Usando Transformadas Lineares. Características para a Análise de Imagens. Seleção de Características. 3) Aprendizagem de Árvores de Decisão: Representação de Árvores de Decisão. Algoritmo de Aprendizagem ID3 e C4.5. Entropia e Ganho de Informação. Exemplos. Aspectos na Aprendizagem de Árvores de Decisão. 4) Aprendizagem Baseadas em Instâncias: Espaço Euclidiano. Aprendizagem Baseada em Instâncias (ou Modelos Baseados em Distância). Regra k-NN (k vizinhos mais próximos). Exemplos. 5) Aprendizagem Bayesiana: Teorema de Bayes e Aprendizagem Conceitual. Classificador Ótimo de Bayes. Algoritmo de Gibbs. Classificador Naïve Bayes. Exemplos. 6) Aprendizagem de Redes Neurais: Motivação Biológica. Perceptron. Superfície de Decisão. Descida do Gradiente. Redes Multicamadas (Multilayer). Retropropagação (Backpropagation ). Generalização e Sobreajuste. Exemplos. 7) Máquinas de Vetor de Suporte: Conceito de maximização da margem, programação quadrática, função kernel, SVM soft margin, SVM multi-classes. 8) Combinação e Rejeição: Otimização da decisão, tipos de saída, estratégias de combinação, conceito de rejeição, critérios de rejeição, curvas ROC.
   
Cronograma das Aulas
Data Assunto transp. ref. compl.  
13.3 Apresentação da Disciplina
Introdução à Aprendizagem de Máquina
Estudo de Caso
Extração de Características



---
---
---
 
Simuladores e Softwares. --- Modelo OpenCV + Visual Studio 2005  
20.3 Atividade Não-Presencial: Extração de Características | Viagem ao INESC TEC Porto ---  
Programação com Visual Studio Express 2010 + OpenCV 2.4 --- ---  
27.3 Aprendizagem de Árvores de Decisão    
Algoritmos ID3, J48. ---  
3.4 Aprendizagem Bayesiana
Aprendizagem Baseada em Instâncias

---
---
 
Algoritmo k-NN e e Naive Bayes. ---  
10.4 Não haverá atividades | Viagem ao CIRMMT Montréal. --- ---  
17.4 Recesso Acadêmico
Atividade Não-Presencial: Avaliação 1
Leitura Obrigatória: Combinação de Classificadores e Rejeição
---
---

---

---
 
24.4 Aprendizagem de Redes Neurais    
Multilayer perceptron e backpropagation, JavaNNS.  
1.5 Feriado | Atividade Não-Presencial: Avaliação 2 ---
ver abaixo  
8.5 Máquinas de Vetor de Suporte  
LibSVM. ---    
15.5 Data Limite para envio da Avaliação 2 ---
ver abaixo  
     
Software Utilizados  
  OpenCV 2.4.8 OpenCV TWiki  
  Weka 3.7.10 OpenCV TWiki  
  JavaNNS 1.1 OpenCV TWiki  
  LibSVM OpenCV TWiki  
  Microsoft Visual C++ 2010 Express OpenCV TWiki  
  Roteiros de Laboratório    
Avaliações  
  Primeira Avaliação  
  Segunda Avaliação



 
  Roteiros de Laboratório    
Resultado das Avaliações  
  Resultado das avaliações e conceitos finais