Qualidade de dados
análise focada na categoria representacional
DOI:
https://doi.org/10.22477/viii.widat.221Palavras-chave:
qualidade de dados, qualidade representacional, revisão sistemática da literaturaResumo
A qualidade de dados pode ser dividida em quatro categorias: intrínseca, contextual, representacional e acessibilidade. A qualidade representacional é definida a partir de quão bem estruturados estão os conjuntos de dados, avaliando principalmente aspectos relacionados ao formato e significado desses dados. Esta pesquisa tem como objetivo verificar o estado da arte das discussões a respeito da categoria representacional em pesquisas de qualidade de dados, buscando identificar como o assunto tem sido discutido pela literatura e potenciais temas a serem explorados. Como metodologia, utilizou-se a análise exploratória baseada em um protocolo de pesquisa. Os resultados mostram a preocupação de diversos setores com a qualidade de dados, apontando a qualidade representacional como um fator importante na percepção dos consumidores de dados para tomadas de decisão. Conclui-se que a qualidade representacional de dados ainda é um assunto pouco explorado isoladamente. Conclui-se ainda que a definição do conceito de qualidade de dados representacional, suas dimensões, critérios e métricas ainda podem ser estudados de maneira mais aprofundada.
Referências
BLAKE, Roger H.; MANGIAMELI, Paul. Evaluating the semantic and representational consistency of interconnected structured and unstructured data. AMCIS 2009 Proceedings, n. 126, 2009. Disponível em: https://aisel.aisnet.org/amcis2009/126. Acesso em: 12 maio 2025.
CALERO, Coral; CARO, Angélica; PIATTINI, Mario. An applicable data quality model for web portal data consumers. World Wide Web, v. 11, p. 465-484, 2008. Disponível em: https://link.springer.com/article/10.1007/s11280-008-0048-y. Acesso em: 12 maio 2025.
CARO, Angélica et al. A proposal for a set of attributes relevant for web portal data quality. Software Quality Journal, v. 16, p. 513-542, 2008. Disponível em: https://link.springer.com/article/10.1007/s11219-008-9046-7. Acesso em: 12 maio 2025.
GHASEMAGHAEI, Maryam; CALIC, Goran. Can big data improve firm decision quality? The role of data quality and data diagnosticity. Decision Support Systems, v. 120, p. 38-49, 2019. Disponível em: https://dl.acm.org/doi/abs/10.1016/j.dss.2019.03.008. Acesso em: 12 maio 2025.
HEO, Misook. User satisfaction with portals: testing for factorial validity and invariance across age groups. Online Information Review, v. 37, n. 5, p. 804-820, 2013. Disponível em: https://www.emerald.com/insight/content/doi/10.1108/oir-06-2012-0099/full/html. Acesso em: 12 maio 2025.
JABAR, Zam Zarina Abdul et al. Establishment of big data analytics application model for Malaysian public sector: an expert validation. EDPACS, v. 65, n. 4, p. 1-20, 2022. Disponível em: https://www.tandfonline.com/doi/full/10.1080/07366981.2021.1958736. Acesso em: 12 maio 2025.
JUDDOO, Suraj et al. Data governance in the health industry: investigating data quality dimensions within a big data context. Applied System Innovation, v. 1, n. 4, p. 43, 2018. Disponível em: https://www.mdpi.com/2571-5577/1/4/43. Acesso em: 12 maio 2025.
JURAN, Joseph Moses. Quality control handbook. New York: Mcgraw-Hill, 1988.
KLEIN, Barbara D. User perceptions of data quality: Internet and traditional text sources. Journal of computer information systems, v. 41, n. 4, p. 9-15, 2001. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/08874417.2001.11647016. Acesso em: 12 maio 2025.
KWIATKOWSKA, Mila; POUW, Frank. Data quality in secondary data analysis: a case study of ecological data using a semiotic-based approach. In: INTERNATIONAL CONFERENCE ON DATA SCIENCE, TECHNOLOGY AND APPLICATIONS, 8., 2019. Prague. Proceedings […]. Prague: [S. l.], 2019. v. 1, p. 377-384. Disponível em: https://www.scitepress.org/Link.aspx?doi=10.5220/0007978403770384. Acesso em: 12 maio 2025.
LANGER, André et al. SemQuire: assessing the data quality of linked open data sources based on DQV. Current Trends in Web Engineering, v. 11153, p. 163-175, 2018. Disponível em: https://link.springer.com/chapter/10.1007/978-3-030-03056-8_14. Acesso em: 12 maio 2025.
LEITE, Patrícia et al. Towards a model for the measurement of data quality in websites. New Review of Hypermedia and Multimedia, v. 20, n. 4, p. 301-316, 2014. Disponível em: https://www.tandfonline.com/doi/full/10.1080/13614568.2014.968638. Acesso em: 12 maio 2025.
LIU, Yuewen et al. Gender differences in information quality of virtual communities: a study from an expectation-perception perspective. Personality and individual differences, v. 104, p. 224-229, 2017. Disponível em: https://www.sciencedirect.com/science/article/pii/S0191886916309084. Acesso em: 12 maio 2025.
MATOS, Sandra; JORGE, Susana; SÁ, Patricia Moura e. Measuring the quality of the strategic financial planning information (Q-FPI) in the local government. International Journal of Public Administration, v. 46, n. 10, p. 671-688, 2023. Disponível em: https://www.tandfonline.com/doi/full/10.1080/01900692.2021.2011315. Acesso em: 12 maio 2025.
MORAGA, Carmen et al. SQuaRE-aligned data quality model for web portals. In: INTERNATIONAL CONFERENCE ON QUALITY SOFTWARE, 9., 2009. Jeju, Korea (South). Proceedings [...]. Jeju, Korea (South): IEEE, 2009. p. 117-122. Disponível em: https://ieeexplore.ieee.org/document/5381502. Acesso em: 12 maio 2025.
MULGUND, Pavankumar et al. Data quality issues with physician-rating websites: systematic review. Journal of Medical Internet Research, v. 22, n. 9, p. e15916, 2020. Disponível em: https://www.jmir.org/2020/9/e15916/. Acesso em: 12 maio 2025.
PRIESTLEY, Maria; O’DONNELL, Fionntán; SIMPERL, Elena. A survey of data quality requirements that matter in ML development pipelines. ACM Journal of Data and Information Quality, v. 15, n. 2, p. 1-39, 2023. Disponível em: https://dl.acm.org/doi/10.1145/3592616. Acesso em: 12 maio 2025.
PRODANOV, Cleber Cristiano; FREITAS, Ernani Cesar de. Metodologia do trabalho científico: métodos e técnicas da pesquisa e do trabalho acadêmico. 2. ed. Novo Hamburgo: Editora Feevale, 2013.
REDMAN, Thomas C. Data quality management past, present, and future: towards a management system for data. In: SADIQ, Shazia (ed.). Handbook of data quality: research and practice. Berlin: Springer Berlin Heidelberg, 2013. p. 15-40. Disponível em: https://link.springer.com/chapter/10.1007/978-3-642-36257-6_2. Acesso em: 12 maio 2025.
SADIQ, Shazia. Prologue: research and practice in data quality management. In: SADIQ, Shazia (ed.). Handbook of data quality: research and practice. Berlin: Springer Berlin Heidelberg, 2013. p. 1-11. Disponível em: https://link.springer.com/chapter/10.1007/978-3-642-36257-6_1. Acesso em: 12 maio 2025.
SALOMONE, Sonia; HYLAND, Paul; MURPHY, Glen. Perceptions of data quality dimensions and data roles. In: AUSTRALIAN AND NEW ZEALAND ACADEMY OF MANAGEMENT CONFERENCE, 25., 2011, Wellington. Proceedings [...]. Wellington: [s.n.], 2011. p. 1-25. Disponível em: https://eprints.qut.edu.au/48014/. Acesso em: 12 maio 2025.
SHANG, Ning; WENG, Chunhua; HRIPCSAK, George. A conceptual framework for evaluating data suitability for observational studies. Journal of the American Medical Informatics Association, v. 25, n. 3, p. 248-258, 2018. Disponível em: https://pubmed.ncbi.nlm.nih.gov/29024976/. Acesso em: 12 maio 2025.
STRONG, Diane M.; LEE, Yang W.; WANG, Richard Y. Data quality in context. Communications of the ACM, v. 40, n. 5, p. 103-110, 1997. Disponível em: https://dl.acm.org/doi/10.1145/253769.253804. Acesso em: 12 maio 2025.
TIMMERMAN, Yoram et al. Cost-based analysis of the impact of data completeness and representational consistency. Decision Support Systems, v. 175, p. 114044, 2023. Disponível em: https://www.sciencedirect.com/science/article/pii/S0167923623001197. Acesso em: 12 maio 2025.
WAHYUDI, Agung; FARHANI, Adiska; JANSSEN, Marijn. Relating big data and data quality in financial service organizations. In: INTERNATIONAL CONFERENCE ON E-BUSINESS, E-SERVICES AND E-SOCIETY, 17., 2018, Tirana. Proceedings [...]. [S. l.]: Springer, 2018. p. 504-519. Disponível em: https://repository.tudelft.nl/record/uuid:f8bd8560-c503-466e-82d4-069141188061. Acesso em: 12 maio 2025.
WANG, Richard Y.; STRONG, Diane M. Beyond accuracy: what data quality means to data consumers. Journal of Management Information Systems, v. 12, n. 4, p. 5-33, 1996. Disponível em: http://www.jstor.org/stable/40398176. Acesso em: 12 maio 2025.
YI, Bingyu; HUA, Wen; SADIQ, Shazia. A pattern-based framework for addressing data representational inconsistency. Databases Theory and Applications, v. 9877, p. 395-406, 2016. Disponível em: https://link.springer.com/chapter/10.1007/978-3-319-46922-5_31. Acesso em: 12 maio 2025.
ZAVERI, Amrapali et al. Quality assessment for linked open data: a survey. Semantic Web Journal, v. 7, n. 1, p. 63-93, 2015. Disponível em: https://journals.sagepub.com/doi/full/10.3233/SW-150175. Acesso em: 12 maio 2025.
ZHANG, Yan; TRACE, Ciaran B. The quality of health and wellness self‐tracking data: a consumer perspective. Journal of the Association for Information Science and Technology, v. 73, n. 6, p. 879-891, 2022. Disponível em: https://asistdl.onlinelibrary.wiley.com/doi/full/10.1002/asi.24591. Acesso em: 12 maio 2025.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2025 Débora Kaori Yoshitane, Ananda Fernanda de Jesus, José Eduardo Santarem Segundo

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.