데이터 품질

위키백과, 우리 모두의 백과사전.

데이터 품질 또는 데이터 퀄리티(data quality)는 정보의 질적 또는 양적 상태를 나타낸다. 데이터 품질에 대한 정의는 다양하지만 일반적으로 데이터가 "운영, 의사결정 및 계획에서 의도된 용도에 적합한" 경우 데이터는 고품질로 간주된다.[1][2][3] 더욱이, 데이터가 참조하는 실제 구조를 올바르게 표현한다면 데이터는 고품질로 간주된다. 또한 이러한 정의와는 별도로 데이터 소스의 수가 증가함에 따라 특정 외부 목적에 대한 사용 적합성과 관계없이 내부 데이터 일관성에 대한 문제가 중요해진다. 동일한 목적으로 사용되는 동일한 데이터 세트를 논의할 때에도 데이터 품질에 대한 사람들의 견해는 종종 불일치할 수 있다. 이 경우 데이터 거버넌스는 데이터 품질에 대해 합의된 정의와 표준을 형성하는 데 사용된다. 이러한 경우 데이터 품질을 보장하기 위해 표준화를 포함한 데이터 정제가 필요할 수 있다.[4]

같이 보기[편집]

각주[편집]

  1. Redman, Thomas C. (2013년 12월 30일). 《Data Driven: Profiting from Your Most Important Business Asset》. Harvard Business Press. ISBN 978-1-4221-6364-1. 
  2. Fadahunsi, Kayode Philip; Akinlua, James Tosin; O’Connor, Siobhan; Wark, Petra A; Gallagher, Joseph; Carroll, Christopher; Majeed, Azeem; O’Donoghue, John (March 2019). “Protocol for a systematic review and qualitative synthesis of information quality frameworks in eHealth”. 《BMJ Open》 9 (3): e024722. doi:10.1136/bmjopen-2018-024722. ISSN 2044-6055. PMC 6429947. PMID 30842114. 
  3. Fadahunsi, Kayode Philip; O'Connor, Siobhan; Akinlua, James Tosin; Wark, Petra A.; Gallagher, Joseph; Carroll, Christopher; Car, Josip; Majeed, Azeem; O'Donoghue, John (2021년 5월 17일). “Information Quality Frameworks for Digital Health Technologies: Systematic Review”. 《Journal of Medical Internet Research》 (영어) 23 (5): e23479. doi:10.2196/23479. PMC 8167621. PMID 33835034. 
  4. Smallwood, R.F. (2014). 《Information Governance: Concepts, Strategies, and Best Practices》. John Wiley and Sons. 110쪽. ISBN 9781118218303. 2020년 7월 30일에 원본 문서에서 보존된 문서. 2020년 4월 18일에 확인함. Having a standardized data governance program in place means cleaning up corrupted or duplicated data and providing users with clean, accurate data as a basis for line-of-business software applications and for decision support analytics in business intelligence (BI) applications. 

외부 링크[편집]