Aprimoramento do Annif para indexação automática de publicações em português

Autores

DOI:

https://doi.org/10.22477/viii.widat.273

Palavras-chave:

Indexação automática, inteligência artificial, Processamento de Linguagem Natural

Resumo

A indexação automática desempenha um papel essencial na organização e recuperação da informação, especialmente em bibliotecas e repositórios institucionais que lidam com grandes volumes de documentos. O presente estudo investiga a aplicação de uma ferramenta baseada em inteligência artificial para a indexação automática de publicações em língua portuguesa, com o objetivo de aprimorar a precisão e a coerência dos descritores atribuídos aos documentos. Para isso, foram conduzidos testes com uma ferramenta desenvolvida originalmente para a indexação de textos em outro idioma, avaliando sua capacidade de adaptação a um novo contexto linguístico. A metodologia adotada incluiu a realização de testes exploratórios iniciais, seguidos da criação de um conjunto de treinamento específico composto por trinta mil documentos extraídos de bases institucionais. O treinamento foi conduzido de maneira incremental, permitindo a avaliação da evolução do desempenho da ferramenta. Os resultados indicaram que a qualidade das sugestões geradas pela ferramenta está diretamente relacionada à diversidade e estrutura do conjunto de treinamento. Inicialmente, a indexação apresentou baixa precisão para documentos em língua portuguesa, mas, após o refinamento dos dados e a ampliação do conjunto de treinamento, observou-se uma melhora significativa na coerência dos descritores atribuídos. O estudo demonstra que a adaptação da ferramenta para a indexação de documentos em língua portuguesa é viável, desde que sejam realizados ajustes metodológicos no treinamento do modelo. Conclui-se que o aprimoramento contínuo do conjunto de treinamento pode fortalecer a padronização da indexação, melhorar a recuperação da informação e reduzir a necessidade de intervenção manual em bibliotecas e repositórios institucionais.

Referências

FUJITA, M. L. Sistema de indexação PRECIS: perspectiva histórica e técnica de seu desenvolvimento e aplicação. Revista Brasileira de Biblioteconomia e Documentação, São Paulo, v. 21, n. 1/2, p. 46-62, jan./jun. 1988.

HAYNES, D. Metadata for information management and retrieval: understanding metadata and its use. London: Facet Publishing, 2018.

POMERANTZ, J. Metadata. Cambridge: MIT Press, 2015.

RUBI, M. P.; FUJITA, M. S. L. Elementos de política de indexação em manuais de indexação de Sistemas de Informação especializados. Perspectivas em Ciência da Informação, Belo Horizonte, v. 8, n. 1, p. 66-77, jan./jun. 2003. Disponível em: https://periodicos.ufmg.br/index.php/pci/article/view/23460/18920. Acesso em: 19 maio 2025.

SUOMINEN, Osma. Annif: DIY automated subject indexing using multiple algorithms. Liber Quarterly: the Journal of the Association of European Research Libraries, [S. l.], v. 29, n. 1, p. 1-26, 2019. Disponível em: https://doi.org/10.18352/lq.10285. Acesso em: 19 maio 2025.

SVENONIUS, E. The intellectual foundation of information organization. Cambridge, MA: MIT Press, 2000.

Downloads

Publicado

08-09-2025

Como Citar

NASCIMENTO, R. L. da S.; COSTA, B. C. da C.; SIMIONATO ARAKAKI, A. C. Aprimoramento do Annif para indexação automática de publicações em português. VIII Workshop de Informação, Dados e Tecnologia (WIDaT) 2025, Brasília, DF, v. 8, 2025. DOI: 10.22477/viii.widat.273. Disponível em: https://widat.ibict.br/index.php/widat2025/article/view/273. Acesso em: 31 maio. 2026.