Web scraping do ResearchID

proposta de sistema para o monitoramento de Índice H de pesquisadores no Brasil

Autores

DOI:

https://doi.org/10.22477/ii.widat.155

Palavras-chave:

dados de citação, ResearcherID, Índice H, web scraping

Resumo

A dimensão dos dados aponta uma nova tendência de estudos e práticas que vem sendo adotada por cientistas da informação interessados em estudos métricos que visem o uso de dados de citação e referências. Essas abordagens ressaltam métodos e tecnologias que garantem a interoperabilidade e a criação de uma identidade única para autores e de documentos científicos. O ResearcherID é um sistema de identificação de autores científicos, criado em 2008 pela Thomson Reuters com o objetivo de resolver o problema da identificação de autores. O ResearcherID foi adotado pelo Conselho Nacional de Pesquisa do Brasil como fonte de dados para coleta do Índice H nacional. Este indicador é aplicado para medir a produtividade e visualização do impacto de cientistas baseando-se nos seus artigos mais citados. Nesse contexto, a proposta desse estudo será a de medir o índice H dos pesquisadores brasileiros cadastrados no ResearcherID. Os procedimentos metodológicos exigem a aplicação de conhecimentos inerentes a linguagem de programação Python. São utilizadas técnicas de web scraping para recuperação de informação no ResearcherID. O resultado do estudo consolida-se na forma de dois scripts em Python (Anexo A e B) tais programas objetivam-se como base para a elaboração de um sistema de monitoramento do índice H no ResearcherID.

Artigo apresentado no II Workshop de Informação, Dados e Tecnologia, realizado nos dias 27 a 29 de novembro de 2018, na cidade de João Pessoa (PB), nas dependências da Universidade Federal da Paraíba (UFPB). Disponível originalmente em: https://dadosabertos.info/enhanced_publications/idt/. Acesso em: 25 set. 2023.

Detentor do Copyright
VI Workshop de Informação, Dados e Tecnologia - WIDaT 2023

Downloads

Não há dados estatísticos.

Biografia do Autor

Alexandre Ribas Semeler, Universidade Federal do Rio Grande do Sul (UFRGS)

Bibliotecário de dados no Instituto de Geociências da Universidade Federal do Rio Grande do Sul (UFRGS), Porto Alegre, Brasil. É graduado em Biblioteconomia pela UFRGS (2003-2007) e mestre em Comunicação e Informação pela UFRGS (2008-2010). É Doutor em Ciência da Informação pela Universidade Federal de Santa Catarina (UFSC) (2015-2017). Atualmente é (2018) pós-doutorando em Ciência da Informação na Universidade Federal de Santa Catarina, Florianópolis, Brasil. Suas áreas de interesse de pesquisa incluem: tópicos interdisciplinares em ciência da informação, e-ciência, ciência de dados e biblioteconomia de dados.

Adilson Luiz Pinto, Universidade Federal de Santa Catarina (UFSC)

Orientador de Mestrado e Doutorado desde 2011. Coordenador do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal de Santa Catarina - UFSC (gestão 2017-2019); Sub-Coordenador do Programa de Pós-Graduação em Ciência da Informação da Universidade Federal de Santa Catarina - UFSC (gestão 2014-2016); Coordenador de Pesquisa e Extensão da Universidade Federal de Santa Catarina - UFSC (gestão 2011-2012). Professor Associado II do Departamento de Ciência da Informação da UFSC (Graduação em Biblioteconomia/Arquivologia/Ciência da Informação e Mestrado/Doutorado em Ciência da Informação), Professor Visitante: (i) Universidad de Panamá, (ii) Universidad Nacional de la Republica Uruguai, (iii) Universidad Nacional de Cuyo, (iv) Universidad Carlos III de Madrid, (v) Université Montpellier III, (vi) Universidade Estadual de Londrina. Titulações: Graduado em Biblioteconomia pela PUC-Campinas (2000), Mestre em Ciência da Informação pela PUC-Campinas (2004) e em Documentação Audiovisual pela Universidad Carlos III de Madrid (2006); Doutor em Documentação pela Universidad Carlos III de Madrid (2007). Membro do Grupo de Pesquisa Inteligência, Tecnologia e Informação - Research Group (ITI-RG); Membro do Conselho Editorial das revistas (i) El Profesional de la Información; (ii) Hipertext.net; (iii) Boletín Millares Carlo; (iv) Revista Interamericana de Bibliotecología; Avaliador contínuo (i) Transinformação, (ii) Revista da ACB, (iii) Revista RBBD, (iv) Enancib no GT7 e GT8, (v) revista InCID, (vi) El Profesional de la Información, (vii) da 3ª, 4ª,5ª e 6ª edição do Encontro Brasileiro de Bibliometria e Cientometria, (viii) LiiNC em Revista, (ix) CBBD, (x) SNBU e (xi) Biblioetcas: anales de investigación. Especialista em Ciência da Informação, com ênfase em: Estudos Métricos da Informação (bibliometria, cienciometria, informetria, librametrics, webometria e arquivometria), E-Science (mineração automatizada de dados), Visualização da Informação (Análise de Redes Sociais, Visualização analítica, Visualização de textos, Modelagem de Processo, Visualização temporal, Geolocalização de dados e Clusterização).

Arthur Oliveira, Universidade Federal do Rio Grande do Sul (UFRGS)

Graduando de Ciência da Computação no Instituto de Informática da Universidade Federal Do Rio Grande Do Sul (2013-atual). Cientista de Dados Junior. Atuando nas seguintes áreas: Ciência da Informação, Programação Orientada a Objetos, Computação Paralela Aplicada à Coleta, Análise e Visualização de Dados Científicos.

Downloads

Publicado

27/11/2018

Como Citar

SEMELER, A. R.; PINTO, A. L.; OLIVEIRA, A. Web scraping do ResearchID: proposta de sistema para o monitoramento de Índice H de pesquisadores no Brasil. Anais do Workshop de Informação, Dados e Tecnologia - WIDaT, [S. l.], v. 2, p. 4–19, 2018. DOI: 10.22477/ii.widat.155. Disponível em: https://widat.ibict.br/index.php/widat2023/article/view/155. Acesso em: 6 abr. 2026.