Descoberta de Conhecimento e Aprendizagem de Máquina

Este site fornece as principais informações a respeito do Grupo de Pesquisas em Descoberta do Conhecimento e Aprendizagem de Máquina, pertencente ao Programa de Pós-Graduação em Informática (PPGIa) da Pontifícia Universidade Católica do Paraná (PUCPR).

A Descoberta de Conhecimento em Base de Dados é o processo de extração de conhecimento novo, útil e interessante a partir de bases de dados (KDD - “Knowledge Discovery in Databases”). É um processo de natureza iterativa e interativa, composto por um conjunto de três atividades principais: pré-processamento, mineração de dados e pós-processamento.

A Mineração de Dados é a etapa central que converte os dados em Conhecimento, utilizando-se, para tanto, das técnicas de Aprendizagem de Máquina (“Machine Learning”).

Membros

Alceu de Souza Britto Junior - Dr., Pontifícia Universidade Católica do Paraná, 2001. Pesquisador Produtividade em Pesquisa CNPq. Áreas de Atuação: Processamento de Imagens, Reconhecimento de Padrões.

Carlos Nascimento Silla Junior Dr., University of Kent, Inglaterra, 2011. Pesquisador Produtividade em Pesquisa CNPq. Membro ACM, IEEE, ISMIR, SBC. Áreas de Atuação: Data Mining, Computational Intelligence, Music Information Retrieval, Computer Music Technology.

Emerson Cabrera Paraiso - Ph.D., Université de Technologie de Compiègne, França, 2005. Membro ACM, CREAPR. Diretor do Centro de Pesquisa Web Intelligence Brasil. Áreas de Atuação: Sistemas Especialistas, Sistemas Inteligentes, Sistemas Multiagentes, Interface Homem-Máquina, Ontologias, Bioinformática.

Fabrício Enembreck Dr., Université de Technologie de Compiègne, França, 2003. Pesquisador Produtividade em Pesquisa CNPq. Áreas de Atuação: Sistemas Multi-Agentes, Agentes Adaptativos, Mineração de Dados.

Jean Paul Barddal - Ph.D., Pontifícia Universidade Católica do Paraná, 2018. Áreas de Atuação: Mineração de Fluxos Contínuos de Dados (Data Stream Mining), Classificação, Regressão, Agrupamento, Seleção de Atributos, Otimização de sistemas visando Green Computing e a Interseção entre Mineração de Dados e o Direito (principalmente GDPR e LGPD).

Júlio Cesar Nievola - Ph.D., Universidade Federal de Santa Catarina, 1995. Pesquisador Produtividade em Pesquisa - Fundação Araucária e Líder do Grupo de Pesquisas em Descoberta do Conhecimento e Aprendizagem de Máquina. Membro IEEE, ACM, AAAI, CREAPR. Áreas de Atuação: Data Mining, Sistemas Inteligentes, Redes Neurais Artificiais, Computação Evolucionária, Bioinformática. Homepage.

Linhas

O Grupo de Pesquisas em Descoberta do Conhecimento e Aprendizagem de Máquina concentra seus trabalhos sobre três áreas de aplicação, cada uma com técnicas de pré-processamento, algoritmos e técnicas de pós-processamento características, que são:

Bioinformática

Os dados utilizados em sua maioria são provenientes de micro-arranjos. Tais dados caracterizam-se por possuírem poucos exemplos, mas com uma quantidade grande de características (exemplos típicos estão na faixa de poucas centenas de exemplos, cada um com alguns milhares de atributos).

Multimídia

Dados multimídia provém de sensores e necessitam de um pré-tratamento computacionalmente intensivo para a obtenção das características a serem utilizadas pelos algoritmos principais.

Textos e Hipertextos

Tem como principal característica o fato de que os dados não tem uma estrutura padrão, ou seja, os dados são não estruturados ou semi-estruturados.

Projetos

Mineração de Dados em Bioinformática

Ano Início: 2004.

Área de Concentração: METODOLOGIA E TÉCNICAS DE COMPUTAÇÃO.

Alunos Envolvidos: 1 aluno de Doutorado, 7 alunos de Mestrado, 9 alunos em Projeto Final de Curso (Ciência da Computação e Engenharia de Computação), 2 alunos PIBIC e 2 alunos PIBIC Junior.

Descrição: A proposta desta linha de pesquisa consiste na aplicação de métodos de Aprendizagem de Máquina e Mineração de Dados que contribuam nos avanços das descobertas de dados de expressão gênica, através da capacidade do sistema de aprender automaticamente a partir dos dados disponíveis e produzir hipóteses úteis. Os estudos estão focados na análise de dados obtidos de micro-arranjos e engloba as tarefas de agrupamento e classificação a partir dos mesmos.

Responsável: Prof. Júlio Cesar Nievola.

Financiamento: Este projeto tem um en resume help convênio formal assinado entre a PUCPR e o TECPAR/IBMP (Instituto de Biologia Molecular do Paraná). Além deste acordo, o projeto tem como fontes parciais de financiamento 2 bolsas de Iniciação Científica, sendo 1 bolsa da PUCPR (PIBIC) e outra pelo CNPq. Além disso, todos os alunos de mestrado recebem bolsas parciais da PUCPR que variam de 50% a 100% do valor da mensalidade.

Aprendizagem de Máquina em Dados Multimídia

Ano Início: 2004.

Área de Concentração: METODOLOGIA E TÉCNICAS DE COMPUTAÇÃO .

Alunos Envolvidos: 2 alunos de Graduação e 5 alunos de Mestrado.

Descrição: A análise de conteúdo multimídia está relacionada ao entendimento computacional do significado semântico de um documento multimídia, como por exemplo, uma seqüência de vídeo com textos (legendas) e trilha de áudio associados. Ferramentas que contribuam para a análise automática do conteúdo, isto é, para o acesso, compreensão, indexação e recuperação de informações, tornam–se indispensáveis à medida que avançamos cada vez mais na era da informação. Assim, o objetivo geral do projeto é o de desenvolver um sistema para análise de conteúdo multimídia que possa ser integrado a uma base de dados multimídia visando facilitar o gerenciamento, a busca e a recuperação de informações. Este sistema de análise deverá, dentre outras facilidades, prover tarefas de busca e recuperação multimodal de informações sobre grandes bases de dados de conteúdo multimídia.

Responsável: Prof. Alessandro Lameiras Koerich.

Financiamento: Este projeto tem financiado do CNPq, intitulado “Uma Abordagem Multimodal para a Análise de Conteúdo Multimídia”. Ele tem como fontes parciais de financiamento 2 bolsas de Iniciação Científica, sendo 1 bolsa concedida pela PUCPR e outra pelo CNPq. Além disso, todos os alunos de mestrado recebem bolsas parciais da PUCPR que variam de 50% a 100% do valor da mensalidade.

Mineração de Textos

Ano Início: 2003.

Área de Concentração: METODOLOGIA E TÉCNICAS DE COMPUTAÇÃO.

Alunos Envolvidos: 1 aluno de Graduação, 2 alunos de Mestrado e 1 aluno de Doutorado.

Descrição: O objetivo da linha é o uso de técnicas de aprendizagem de máquina em mineração de textos estruturados ou semi-estruturados, incluindo a Web, para a obtenção de sumários automáticos, classificação automática de textos, dentre outros. No âmbito desta pesquisa, projetos que visam facilitar a capitalização do conhecimento organizacional e técnico de uma equipe de desenvolvimento de projetos são foco de potenciais aplicações. Através da análise de documentos redigidos ou consultados pelos participantes de um projeto colaborativo (suportado pelo computador), podemos construir uma representação sobre o conhecimento neles contidos (por ex. sob a forma de uma ontologia) que podem ser reutilizados na construção de sistemas inteligentes de apoio a decisão.

Responsável: Prof. Emerson Cabrera Paraíso.

Financiamento: Este projeto tem como fontes parciais de financiamento 1 bolsa de Iniciação Científica concedida PUCPR. Além disso, todos os alunos de mestrado recebem bolsas parciais da PUCPR que variam de 50% a 100% do valor da mensalidade.

Atuação Detalhada (Detailed Description)

Clique aqui para acessar a produção detalhada do grupo.