当前位置 > CPDA数据分析师 > “数”业专攻 > 数据质量对于数据分析来说至关重要

数据质量对于数据分析来说至关重要

来源:数据分析师 CPDA | 时间:2019-03-15 | 作者:admin

bigdata ejemplos cibbva - 数据质量对于数据分析来说至关重要

 

对大多数公司来说,收集数据通常只是为了记录,当质检完成、员工的表现被审查、维护被记录,甚至当周会进行时,数据也在被收集。然后,为了实现更大的目标,例如做出更好的业务决策,保留记录供将来参考。收集数据的另一个原因是,做出的决策将对公司的成功产生积极影响,改善其实践并增加收入,对于许多公司来说,管理高质量的数据是一项艰巨的任务。然而,拥有准确且业务有序的数据是确保公司不会遭受伴随“坏”或“脏”数据而来的负面影响到,不可或缺的组成部分。

 

数据质量的关键所在包括:大致分为完整性,一致性,准确性,有效性和及时性这五个组件。

 

crm05a - 数据质量对于数据分析来说至关重要

 

当这些组件中的每一个都被正确地执行时,它将产生高质量的数据,同样重要的是,使用收集数据的每个人都必须对数据所代表的内容有一个大致的了解。数据活动的范围不限于公司自身产生的数据,它还必须包括从外部来源获得的数据。高质量的数据将确保更有效地推动公司的成功,因为它依赖于基于事实的决策,而不是习惯性的或人类的直觉。

 

完整性确保数据中应该收集的和实际收集的数据之间没有差距

 

解决方案:如果数据不完整,可以通过暂停提交来解决此问题。通过使用强制字段功能,可以轻松实现数据完整性,比如在进行一次线上采访调查的过程中如果没有填写必填字段,被访者将无法完成完整的数据提交。数据的完整性也将确保花费更少的时间浪费在修复因数据不完整而导致的错误。

 

一致性:数据类型必须与收集的数据的预期版本一致。

 

解决方案:可以通过使用数据收集应用程序中的下拉菜单来确保这一点,这将是以预期格式一致的方式收集数据。而不是自由形式的填写,还有一些预先确定的选项可供选择。

 

准确性:收集的数据是正确的,相关并准确地表示它应该是什么。

 

解决方案:准确性比数据完整性和一致性更有难度。准确的数据经验累积和训练有素的结果,但是,仍然存在人为错误的空间。为了减少不准确的可能性,必须实施额外的措施,例如将图片捕获,GPS位置和时间戳添加到记录的事件中。

 

有效性:有效性来自过程而非最终结果。

 

解决方案:当需要修复无效数据时,过程会出现问题最多的地方,而不是结果。这使得解决起来有点棘手。

 

及时性:应在预期时间收到数据,以便有效利用信息。

 

解决方案:实时数据,任何较慢的速度都不能提供足够的信息。有了实时数据和分析,企业就能更好地做出更有效、更明智的决策。迫切需要消除实地完成调查和收到调查之间的时间差

 

eito studie big data nimmt fahrt auf content image full width - 数据质量对于数据分析来说至关重要

 

77%的公司认为他们的底线受到不准确和不完整数据的影响。据悉,12%的收入是由于数据质量差而浪费掉的,这是一个令人震惊的数据。然而,那些注重高质量数据的公司的收入增长了15%到20%

由于数据质量差,公司目睹了40%的举措无法实现目标效益,这对运营效率有重大影响。实施数据质量计划,可以使企业的销售额增加20%-40%