您的位置:首页 >企业新闻 >

呼吁:建立高质量的数据 全面的数据质量框架

时间:2021-04-02 00:00:00 来源:网络整理

大数据时代已经淹没了几乎所有的科学领域,大量的新数据可以刺激新的研究,并在以前不可能的规模上进行探究。对于生物学来说尤其如此。新技术,新设备,新的检测极限,大量数据的爆炸性增长,使得研究人员可以获得的数据的数量和种类的大幅增加。但是正如互联网打开了我们的眼界,给我们带来前所未有的丰富信息,同时混杂其中的低质量信息也浪费了我们很多时间和精力,数据质量也对数据分析造成了一定困扰。

由美国农业部生态学家Sarah McCord领导的一个研究小组在《生物科学》杂志上撰文指出,数据的数量只是问题的一部分。同样重要的是数据的质量。根据这篇新发表的文章,“大数据使得“确保高质量数据”的难度和负荷量成几何级数放大。”“无法保证质量的数据可能会导致重大的科学问题。数据质量管理的问题,会使得来自严格的数据分析的后果推断出现问题,比如,对生态系统的理解和模型的预测能力的问题以及不确定性,”进而影响现实世界的管理决策。

为了应对这些挑战,作者提出了一个全面的数据质量框架,旨在鼓励收集者、策展人和生态数据用户的最佳做法。他们提出的方法是对广泛使用的DataOne 生命周期和类似方法的改进。拟议的框架是关键,而不是孤立的质量保证和在某个单一的阶段进行质量控制。“鼓励所有越来越依赖数据的生态学家和土地管理者——他们可能与研究人或数据提供者没什么关系——参与确保数据质量。”这组作者说,这样一来,拟议的框架将产生对更多用户有用的更高质量的生态数据,数据集中的错误更少。尽管拟议框架的部署存在困难,但作者认为“采取这些步骤的必要性是全球性的。”质量保证和质量控制框架可以增强现有的生态数据和协作方法,减少误差,提高生态分析的效率,从而改善生态研究和管理。”

# # #


郑重声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。