Reconhecimento de entidades nomeadas em relatórios de inteligência financeira
DOI:
https://doi.org/10.22477/ii.widat.150Palavras-chave:
reconhecimento de entidades nomeadas, mineração de texto, relatório de inteligência financeira, processamento de linguagem naturalResumo
O reconhecimento de entidades nomeadas é uma das subáreas do processamento de linguagem natural, mineração de textos e aprendizado de máquinas. Todas essas áreas fazem parte da grande área da inteligência artificial, muito utilizada em diversos problemas práticos do nosso dia a dia. Uma das competências da Polícia Federal é a investigação de crimes financeiros, em especial, a lavagem de dinheiro. Dentre os problemas encontrados na investigação policial, destacamos a análise dos Relatórios de Inteligência Financeira (RIF), escritos em português do Brasil, que são gerados pelo Conselho de Controle de Atividades Financeiras. O objetivo desta análise é identificar os atores envolvidos em esquemas de lavagem de dinheiro, mas, dependendo da complexidade do esquema, a identificação, por exemplo, desses atores e suas relações (sociedades, parentescos, “laranjas”, empresas “fantasmas”, etc) em um relatório, pode demandar um tempo significativo do policial envolvido na investigação. Este trabalho, portanto, visa apresentar resultados iniciais da automatização do reconhecimento de entidades nomeadas, importantes para a investigação policial, em RIFs. Identificamos, na literatura, uma grande lacuna para esse tipo de solução em textos em português. Os nossos resultados, ainda preliminares, demonstram que as ferramentas e os dados utilizados para o treinamento ainda precisam ser melhor trabalhados para que estes sejam mais significativos. Pudemos perceber que com poucos dados de treinamento conseguimos aumentar a precisão do reconhecimento de entidades de 14 para 27% e, em um teste com o framework RASA NLU, aumentamos a precisão para 60,98% de entidades reconhecidas corretamente, muito aquém dos 90% encontrados na literatura para outros idiomas.
Artigo apresentado no II WIDaT, em 2018, na UFPB. Disponível originalmente em: https://dadosabertos.info/enhanced_publications/idt/. Acesso em: 25 set. 2023.
Downloads
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2023 Anais do Workshop de Informação, Dados e Tecnologia - WIDaT

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Você tem o direito de:
- Compartilhar — copiar e redistribuir o material em qualquer suporte ou formato
- Adaptar — remixar, transformar, e criar a partir do material para qualquer fim, mesmo que comercial.
O licenciante não pode revogar estes direitos desde que você respeite os termos da licença.