Reconhecimento de entidades nomeadas em relatórios de inteligência financeira

Autores

  • Jairo Santana Universidade Federal de Santa Catarina (UFSC)
  • Diefferson K. Môro Universidade Federal de Santa Catarina (UFSC)
  • Rogério de Aquino Silva Universidade Federal de Santa Catarina (UFSC)
  • Vinicius F. C. Ramos Universidade Federal de Santa Catarina (UFSC) https://orcid.org/0000-0002-8319-743X
  • Gustavo Medeiros de Araújo Universidade Federal de Santa Catarina (UFSC) https://orcid.org/0000-0003-0572-6997

DOI:

https://doi.org/10.22477/ii.widat.150

Palavras-chave:

reconhecimento de entidades nomeadas, mineração de texto, relatório de inteligência financeira, processamento de linguagem natural

Resumo

O reconhecimento de entidades nomeadas é uma das subáreas do processamento de linguagem natural, mineração de textos e aprendizado de máquinas. Todas essas áreas fazem parte da grande área da inteligência artificial, muito utilizada em diversos problemas práticos do nosso dia a dia. Uma das competências da Polícia Federal é a investigação de crimes financeiros, em especial, a lavagem de dinheiro. Dentre os problemas encontrados na investigação policial, destacamos a análise dos Relatórios de Inteligência Financeira (RIF), escritos em português do Brasil, que são gerados pelo Conselho de Controle de Atividades Financeiras. O objetivo desta análise é identificar os atores envolvidos em esquemas de lavagem de dinheiro, mas, dependendo da complexidade do esquema, a identificação, por exemplo, desses atores e suas relações (sociedades, parentescos, “laranjas”, empresas “fantasmas”, etc) em um relatório, pode demandar um tempo significativo do policial envolvido na investigação. Este trabalho, portanto, visa apresentar resultados iniciais da automatização do reconhecimento de entidades nomeadas, importantes para a investigação policial, em RIFs. Identificamos, na literatura, uma grande lacuna para esse tipo de solução em textos em português. Os nossos resultados, ainda preliminares, demonstram que as ferramentas e os dados utilizados para o treinamento ainda precisam ser melhor trabalhados para que estes sejam mais significativos. Pudemos perceber que com poucos dados de treinamento conseguimos aumentar a precisão do reconhecimento de entidades de 14 para 27% e, em um teste com o framework RASA NLU, aumentamos a precisão para 60,98% de entidades reconhecidas corretamente, muito aquém dos 90% encontrados na literatura para outros idiomas.

Artigo apresentado no II WIDaT, em 2018, na UFPB. Disponível originalmente em: https://dadosabertos.info/enhanced_publications/idt/. Acesso em: 25 set. 2023.

Downloads

Não há dados estatísticos.

Biografia do Autor

Diefferson K. Môro, Universidade Federal de Santa Catarina (UFSC)

Graduação em Tecnologias de Informação e Comunicação – UFSC Araranguá.

Vinicius F. C. Ramos, Universidade Federal de Santa Catarina (UFSC)

Professor Adjunto da Universidade Federal de Santa Catarina (UFSC) campus Araranguá. Possui graduação em Bacharelado em Ciência da Computação pela UFRJ, Mestrado em Engenharia de Sistemas e Computação pela COPPE/UFRJ e Doutorado em Engenharia de Sistemas e Computação com acordo de co-tutela entre a COPPE/UFRJ e a Universidade Tecnlógica de Eindhoven (HOL). Atualmente, trabalha com pesquisa e desenvolvimento de metodologias e ferramentas tecnológicas para o tratamento e análise de grande quantidade de dados (Big Data) em redes sociais. Suas pesquisas também são voltadas para o ensino de programação de computadores e o desenvolvimento de ambientes construtivistas de aprendizagem presenciais e a distância com o uso de novas tecnologias digitais da informação e comunicação. Atua principalmente nos seguintes temas: tecnologia educacional, educação a distância, novas tecnologias da Web, sistemas adaptativos, avaliação de sistemas adaptativos, ensino de programação e tratamento e análise de big data.

Gustavo Medeiros de Araújo, Universidade Federal de Santa Catarina (UFSC)

Doutor em Engenharia de Automação e Sistemas pela UFSC (2013) e mestre em Ciência da Computação pela UFSC (2007). Tem experiência na área de Ciência da Computação e Automação, com ênfase em Data Science, Machine e Deep Learning e Cyber-Physical System. Possui duas linhas de pesquisa: i) Aplicações com Data Science, Machine e Deep Learning e ii) Protocolos de Redes de Sensores Sem Fio (RSSF) e MANTEs. Além da formação acadêmica, possui experiência na indústria de software desenvolvendo sistemas de informação para o governo federal e sistemas para a indústria de automação. Atualmente, é professor Adjunto A2 da Universidade Federal de Santa Catarina, membro do Laboratório de Integração Software e Hardware (LISHA) e membro do Laboratório de Engenharia e Ciência de Dados (LECID).

Downloads

Publicado

27/11/2018

Como Citar

SANTANA, J.; MÔRO, D. K.; SILVA, R. de A.; RAMOS, V. F. C.; ARAÚJO, G. M. de. Reconhecimento de entidades nomeadas em relatórios de inteligência financeira. Anais do Workshop de Informação, Dados e Tecnologia - WIDaT, [S. l.], v. 2, p. 4–10, 2018. DOI: 10.22477/ii.widat.150. Disponível em: https://widat.ibict.br/index.php/widat2023/article/view/150. Acesso em: 6 abr. 2026.