Qualidade de dados

análise focada na categoria representacional

Autores

DOI:

https://doi.org/10.22477/viii.widat.221

Palavras-chave:

qualidade de dados, qualidade representacional, revisão sistemática da literatura

Resumo

A qualidade de dados pode ser dividida em quatro categorias: intrínseca, contextual, representacional e acessibilidade. A qualidade representacional é definida a partir de quão bem estruturados estão os conjuntos de dados, avaliando principalmente aspectos relacionados ao formato e significado desses dados. Esta pesquisa tem como objetivo verificar o estado da arte das discussões a respeito da categoria representacional em pesquisas de qualidade de dados, buscando identificar como o assunto tem sido discutido pela literatura e potenciais temas a serem explorados. Como metodologia, utilizou-se a análise exploratória baseada em um protocolo de pesquisa. Os resultados mostram a preocupação de diversos setores com a qualidade de dados, apontando a qualidade representacional como um fator importante na percepção dos consumidores de dados para tomadas de decisão. Conclui-se que a qualidade representacional de dados ainda é um assunto pouco explorado isoladamente. Conclui-se ainda que a definição do conceito de qualidade de dados representacional, suas dimensões, critérios e métricas ainda podem ser estudados de maneira mais aprofundada.

Referências

BLAKE, Roger H.; MANGIAMELI, Paul. Evaluating the semantic and representational consistency of interconnected structured and unstructured data. AMCIS 2009 Proceedings, n. 126, 2009. Disponível em: https://aisel.aisnet.org/amcis2009/126. Acesso em: 12 maio 2025.

CALERO, Coral; CARO, Angélica; PIATTINI, Mario. An applicable data quality model for web portal data consumers. World Wide Web, v. 11, p. 465-484, 2008. Disponível em: https://link.springer.com/article/10.1007/s11280-008-0048-y. Acesso em: 12 maio 2025.

CARO, Angélica et al. A proposal for a set of attributes relevant for web portal data quality. Software Quality Journal, v. 16, p. 513-542, 2008. Disponível em: https://link.springer.com/article/10.1007/s11219-008-9046-7. Acesso em: 12 maio 2025.

GHASEMAGHAEI, Maryam; CALIC, Goran. Can big data improve firm decision quality? The role of data quality and data diagnosticity. Decision Support Systems, v. 120, p. 38-49, 2019. Disponível em: https://dl.acm.org/doi/abs/10.1016/j.dss.2019.03.008. Acesso em: 12 maio 2025.

HEO, Misook. User satisfaction with portals: testing for factorial validity and invariance across age groups. Online Information Review, v. 37, n. 5, p. 804-820, 2013. Disponível em: https://www.emerald.com/insight/content/doi/10.1108/oir-06-2012-0099/full/html. Acesso em: 12 maio 2025.

JABAR, Zam Zarina Abdul et al. Establishment of big data analytics application model for Malaysian public sector: an expert validation. EDPACS, v. 65, n. 4, p. 1-20, 2022. Disponível em: https://www.tandfonline.com/doi/full/10.1080/07366981.2021.1958736. Acesso em: 12 maio 2025.

JUDDOO, Suraj et al. Data governance in the health industry: investigating data quality dimensions within a big data context. Applied System Innovation, v. 1, n. 4, p. 43, 2018. Disponível em: https://www.mdpi.com/2571-5577/1/4/43. Acesso em: 12 maio 2025.

JURAN, Joseph Moses. Quality control handbook. New York: Mcgraw-Hill, 1988.

KLEIN, Barbara D. User perceptions of data quality: Internet and traditional text sources. Journal of computer information systems, v. 41, n. 4, p. 9-15, 2001. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/08874417.2001.11647016. Acesso em: 12 maio 2025.

KWIATKOWSKA, Mila; POUW, Frank. Data quality in secondary data analysis: a case study of ecological data using a semiotic-based approach. In: INTERNATIONAL CONFERENCE ON DATA SCIENCE, TECHNOLOGY AND APPLICATIONS, 8., 2019. Prague. Proceedings […]. Prague: [S. l.], 2019. v. 1, p. 377-384. Disponível em: https://www.scitepress.org/Link.aspx?doi=10.5220/0007978403770384. Acesso em: 12 maio 2025.

LANGER, André et al. SemQuire: assessing the data quality of linked open data sources based on DQV. Current Trends in Web Engineering, v. 11153, p. 163-175, 2018. Disponível em: https://link.springer.com/chapter/10.1007/978-3-030-03056-8_14. Acesso em: 12 maio 2025.

LEITE, Patrícia et al. Towards a model for the measurement of data quality in websites. New Review of Hypermedia and Multimedia, v. 20, n. 4, p. 301-316, 2014. Disponível em: https://www.tandfonline.com/doi/full/10.1080/13614568.2014.968638. Acesso em: 12 maio 2025.

LIU, Yuewen et al. Gender differences in information quality of virtual communities: a study from an expectation-perception perspective. Personality and individual differences, v. 104, p. 224-229, 2017. Disponível em: https://www.sciencedirect.com/science/article/pii/S0191886916309084. Acesso em: 12 maio 2025.

MATOS, Sandra; JORGE, Susana; SÁ, Patricia Moura e. Measuring the quality of the strategic financial planning information (Q-FPI) in the local government. International Journal of Public Administration, v. 46, n. 10, p. 671-688, 2023. Disponível em: https://www.tandfonline.com/doi/full/10.1080/01900692.2021.2011315. Acesso em: 12 maio 2025.

MORAGA, Carmen et al. SQuaRE-aligned data quality model for web portals. In: INTERNATIONAL CONFERENCE ON QUALITY SOFTWARE, 9., 2009. Jeju, Korea (South). Proceedings [...]. Jeju, Korea (South): IEEE, 2009. p. 117-122. Disponível em: https://ieeexplore.ieee.org/document/5381502. Acesso em: 12 maio 2025.

MULGUND, Pavankumar et al. Data quality issues with physician-rating websites: systematic review. Journal of Medical Internet Research, v. 22, n. 9, p. e15916, 2020. Disponível em: https://www.jmir.org/2020/9/e15916/. Acesso em: 12 maio 2025.

PRIESTLEY, Maria; O’DONNELL, Fionntán; SIMPERL, Elena. A survey of data quality requirements that matter in ML development pipelines. ACM Journal of Data and Information Quality, v. 15, n. 2, p. 1-39, 2023. Disponível em: https://dl.acm.org/doi/10.1145/3592616. Acesso em: 12 maio 2025.

PRODANOV, Cleber Cristiano; FREITAS, Ernani Cesar de. Metodologia do trabalho científico: métodos e técnicas da pesquisa e do trabalho acadêmico. 2. ed. Novo Hamburgo: Editora Feevale, 2013.

REDMAN, Thomas C. Data quality management past, present, and future: towards a management system for data. In: SADIQ, Shazia (ed.). Handbook of data quality: research and practice. Berlin: Springer Berlin Heidelberg, 2013. p. 15-40. Disponível em: https://link.springer.com/chapter/10.1007/978-3-642-36257-6_2. Acesso em: 12 maio 2025.

SADIQ, Shazia. Prologue: research and practice in data quality management. In: SADIQ, Shazia (ed.). Handbook of data quality: research and practice. Berlin: Springer Berlin Heidelberg, 2013. p. 1-11. Disponível em: https://link.springer.com/chapter/10.1007/978-3-642-36257-6_1. Acesso em: 12 maio 2025.

SALOMONE, Sonia; HYLAND, Paul; MURPHY, Glen. Perceptions of data quality dimensions and data roles. In: AUSTRALIAN AND NEW ZEALAND ACADEMY OF MANAGEMENT CONFERENCE, 25., 2011, Wellington. Proceedings [...]. Wellington: [s.n.], 2011. p. 1-25. Disponível em: https://eprints.qut.edu.au/48014/. Acesso em: 12 maio 2025.

SHANG, Ning; WENG, Chunhua; HRIPCSAK, George. A conceptual framework for evaluating data suitability for observational studies. Journal of the American Medical Informatics Association, v. 25, n. 3, p. 248-258, 2018. Disponível em: https://pubmed.ncbi.nlm.nih.gov/29024976/. Acesso em: 12 maio 2025.

STRONG, Diane M.; LEE, Yang W.; WANG, Richard Y. Data quality in context. Communications of the ACM, v. 40, n. 5, p. 103-110, 1997. Disponível em: https://dl.acm.org/doi/10.1145/253769.253804. Acesso em: 12 maio 2025.

TIMMERMAN, Yoram et al. Cost-based analysis of the impact of data completeness and representational consistency. Decision Support Systems, v. 175, p. 114044, 2023. Disponível em: https://www.sciencedirect.com/science/article/pii/S0167923623001197. Acesso em: 12 maio 2025.

WAHYUDI, Agung; FARHANI, Adiska; JANSSEN, Marijn. Relating big data and data quality in financial service organizations. In: INTERNATIONAL CONFERENCE ON E-BUSINESS, E-SERVICES AND E-SOCIETY, 17., 2018, Tirana. Proceedings [...]. [S. l.]: Springer, 2018. p. 504-519. Disponível em: https://repository.tudelft.nl/record/uuid:f8bd8560-c503-466e-82d4-069141188061. Acesso em: 12 maio 2025.

WANG, Richard Y.; STRONG, Diane M. Beyond accuracy: what data quality means to data consumers. Journal of Management Information Systems, v. 12, n. 4, p. 5-33, 1996. Disponível em: http://www.jstor.org/stable/40398176. Acesso em: 12 maio 2025.

YI, Bingyu; HUA, Wen; SADIQ, Shazia. A pattern-based framework for addressing data representational inconsistency. Databases Theory and Applications, v. 9877, p. 395-406, 2016. Disponível em: https://link.springer.com/chapter/10.1007/978-3-319-46922-5_31. Acesso em: 12 maio 2025.

ZAVERI, Amrapali et al. Quality assessment for linked open data: a survey. Semantic Web Journal, v. 7, n. 1, p. 63-93, 2015. Disponível em: https://journals.sagepub.com/doi/full/10.3233/SW-150175. Acesso em: 12 maio 2025.

ZHANG, Yan; TRACE, Ciaran B. The quality of health and wellness self‐tracking data: a consumer perspective. Journal of the Association for Information Science and Technology, v. 73, n. 6, p. 879-891, 2022. Disponível em: https://asistdl.onlinelibrary.wiley.com/doi/full/10.1002/asi.24591. Acesso em: 12 maio 2025.

Downloads

Publicado

08-09-2025

Como Citar

YOSHITANE, D. K.; JESUS, A. F. de; SANTAREM SEGUNDO, J. E. Qualidade de dados: análise focada na categoria representacional. VIII Workshop de Informação, Dados e Tecnologia (WIDaT) 2025, Brasília, DF, v. 8, 2025. DOI: 10.22477/viii.widat.221. Disponível em: https://widat.ibict.br/index.php/widat2025/article/view/221. Acesso em: 7 mar. 2026.