Alunos da PUCPR vencem desafio internacional de Processamento de Linguagem Natural (PLN)

  • Posted on: 9 July 2021
  • By: secretaria

Alunos do PPGIa e PPGTS da PUCPR conquistam o primeiro lugar em categoria do eHealth-KD Challenge, promovido por universidades da Espanha e de Cuba.

Alunos do Programa de Pós-Graduação em Informática (PPGIa) e Programa de Pós-Graduação em Tecnologia em Saúde (PPGTS) da Pontifícia Universidade Católica do Paraná (PUCPR), em parceria com a Universidade Federal de Minas Gerais (UFMG) e Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio), participaram do eHealth-KD Challenge 2021, desafio que promove o desenvolvimento de métodos de Processamento de Linguagem Natural (PLN) aplicados ao domínio médico.
Sob a supervisão dos professores Emerson Cabrera Paraiso (PPGIa) e Claudia Moro (PPGTS) da PUCPR, Eduardo Laber da PUC-Rio e Adriana Pagano da UFMG, a equipe PUCRJ-PUCPR-UFMG conquistou o primeiro lugar na categoria Entity Recognition Scenario, no reconhecimento de entidades nomeadas.

Tarefas do desafio: extração de entidades médicas e suas relações.
Fonte: https://ehealthkd.github.io/2021

A equipe também conquistou o segundo lugar geral na competição, em um trabalho colaborativo na elaboração de um sistema capaz de extrair informações clínicas relevantes a partir de dados não estruturados, disponibilizados pelos organizadores.
O método de deep learning multitarefa e multilingue baseado em BERT, proposto pela equipe, obteve resultados significativos nas tarefas de reconhecimento e extração de relação de entidades em textos de múltiplos domínios.
“Foi muito gratificante participar do desafio, onde pudemos utilizar nossos conhecimentos em machine learning e processamento de linguagem natural em uma área tão importante como a saúde. A parceria entre as universidades foi incrível, uma oportunidade única de aprendizado e colaboração.”
Elisa Terumi Rubel Schneider, aluna de Doutorado do PPGIA

O objetivo principal do desafio foi encorajar pesquisadores e especialistas no uso de métodos de Processamento de Linguagem Natural na extração de informações de textos de saúde, descobrindo novos conhecimentos através da mineração de conteúdos de saúde.
Embora o desafio esteja voltado para o domínio da saúde, a estrutura do conhecimento a ser extraído é de uso geral, podendo ser aplicado em outros domínios. Além disso, embora o desafio contenha a maioria das sentenças em espanhol, também incluiu uma pequena seleção de sentenças de diferentes domínios e idiomas, encorajando abordagens multidomínios e multilíngues.
O método proposto pela equipe, juntamente com o código completo da abordagem e detalhes da implementação estão publicamente disponíveis, incentivando pesquisas que podem ser utilizadas em diversas tarefas, com outras aplicabilidades.

A equipe foi formada por:
PUCPR:
● Claudia Maria Cabral Moro
● Emerson Cabrera Paraiso
● Elisa Terumi Rubel Schneider
● Giovanni Pazini Meneghel Paiva
● João Vitor Andrioli de Souza
● Lucas Emanuel Silva e Oliveira
● Lucas Ferro Antunes de Oliveira
PUC-Rio:
● Eduardo Laber
● Lucas Pavanelli
UFMG:
● Adriana Pagano
● Yohan Bonescki Gumiel
● Thiago Castro Ferreira