Aprimoramento do Annif para indexação automática de publicações em português
DOI:
https://doi.org/10.22477/viii.widat.273Palavras-chave:
Indexação automática, inteligência artificial, Processamento de Linguagem NaturalResumo
A indexação automática desempenha um papel essencial na organização e recuperação da informação, especialmente em bibliotecas e repositórios institucionais que lidam com grandes volumes de documentos. O presente estudo investiga a aplicação de uma ferramenta baseada em inteligência artificial para a indexação automática de publicações em língua portuguesa, com o objetivo de aprimorar a precisão e a coerência dos descritores atribuídos aos documentos. Para isso, foram conduzidos testes com uma ferramenta desenvolvida originalmente para a indexação de textos em outro idioma, avaliando sua capacidade de adaptação a um novo contexto linguístico. A metodologia adotada incluiu a realização de testes exploratórios iniciais, seguidos da criação de um conjunto de treinamento específico composto por trinta mil documentos extraídos de bases institucionais. O treinamento foi conduzido de maneira incremental, permitindo a avaliação da evolução do desempenho da ferramenta. Os resultados indicaram que a qualidade das sugestões geradas pela ferramenta está diretamente relacionada à diversidade e estrutura do conjunto de treinamento. Inicialmente, a indexação apresentou baixa precisão para documentos em língua portuguesa, mas, após o refinamento dos dados e a ampliação do conjunto de treinamento, observou-se uma melhora significativa na coerência dos descritores atribuídos. O estudo demonstra que a adaptação da ferramenta para a indexação de documentos em língua portuguesa é viável, desde que sejam realizados ajustes metodológicos no treinamento do modelo. Conclui-se que o aprimoramento contínuo do conjunto de treinamento pode fortalecer a padronização da indexação, melhorar a recuperação da informação e reduzir a necessidade de intervenção manual em bibliotecas e repositórios institucionais.
Referências
FUJITA, M. L. Sistema de indexação PRECIS: perspectiva histórica e técnica de seu desenvolvimento e aplicação. Revista Brasileira de Biblioteconomia e Documentação, São Paulo, v. 21, n. 1/2, p. 46-62, jan./jun. 1988.
HAYNES, D. Metadata for information management and retrieval: understanding metadata and its use. London: Facet Publishing, 2018.
POMERANTZ, J. Metadata. Cambridge: MIT Press, 2015.
RUBI, M. P.; FUJITA, M. S. L. Elementos de política de indexação em manuais de indexação de Sistemas de Informação especializados. Perspectivas em Ciência da Informação, Belo Horizonte, v. 8, n. 1, p. 66-77, jan./jun. 2003. Disponível em: https://periodicos.ufmg.br/index.php/pci/article/view/23460/18920. Acesso em: 19 maio 2025.
SUOMINEN, Osma. Annif: DIY automated subject indexing using multiple algorithms. Liber Quarterly: the Journal of the Association of European Research Libraries, [S. l.], v. 29, n. 1, p. 1-26, 2019. Disponível em: https://doi.org/10.18352/lq.10285. Acesso em: 19 maio 2025.
SVENONIUS, E. The intellectual foundation of information organization. Cambridge, MA: MIT Press, 2000.
Downloads
Publicado
Como Citar
Edição
Seção
Categorias
Licença
Copyright (c) 2025 Renan Luiz da Silva Nascimento, Bruno Carlos da Cunha Costa, Ana Carolina Simionato Arakaki

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.