400 050 6600
数据分析师

手机号

验证码

30天自动登录
当前位置:首页 - Q&A问答

Q&AQ&A问答

怎样通过大数据学到关于数据即服务的知识?

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-08-14

什么时候需要访问公司数据呢?

1、构建一个新的移动应用程序供您的客户使用,需要访问其现有客户记录

2、根据对您的总销售数据的分析,尝试做出正确的业务决策

3、或者(祝您好运)尝试获得客户的单一视图以及您所拥有的有关客户的所有信息。

 

您必须跳过几圈,需要花费多长时间才能访问一个现有数据源,更不用说多个了?

或者从终用户的角度来看,您的客户服务代表可以使用多少个系统来通过电话回答客户的问题?对于大多数组织而言,数据状态并不理想,有什么问题?怎么会这样呢?实际上,很自然。随着公司的发展,您的数据孤岛也随之增加,您构建了新的应用程序,并且它们通常具有自己的后端。您购买了新的现成软件,这些软件也有自己的支持数据库,您构建了更多应用程序以扩展或解决现有应用程序中的问题,并且不得不重复数据,当您将数据装入数据仓库,然后出于不同目的对冷数据进行不同切割时,会发生更多的重复,您收购或合并了一家公司,但从未完全合并数据或对系统进行重复数据删除,这些不同的数据仓库由不同的团队拥有,相当合理地,他们在授予访问权限方面有自己的策略和安全限制。

 

所有这些合理步骤的终画面都是反乌托邦的数据环境,在该环境中几乎不可能获得所需的数据

理想情况下在需要时访问数据应与在您选择的云提供商中启动实例一样简单,我们拥有基础设施即服务–为什么不提供数据即服务?提供“ 数据即服务意味着需要访问数据的人员可以按需获取数据,开发人员可以构建查询公司数据的新应用程序和服务,分析师可以计算数字,产生见解并创建可视化效果,外部方也可以访问:合作伙伴的视野有限,或者您可以安全地授予客户访问权限。

 

数据即服务有两种基本方法:

1、将数据保留在原处,并通过某种连接到源系统的代理层来访问数据。

2、将关键用例所需的关键数据集中在一个位置,将模式与几个名称结合在一起:操作数据层,数据中心,数据结构以及主题的其他变体。

 

将所需数据合并到一个位置肯定需要更多的前期工作,但是它确实避免了一些可能的陷阱,例如:

1、延迟和用户体验由于每个源系统都在做自己的事情,因此直接访问许多源系统上的数据可能会有不可预测的延迟。对于分析工作负载,这可能是可以的,但对于实时应用程序来说,这是不可能的。将数据组合到操作数据层中可提供较低且可预测的延迟。

 

2、性能和可伸缩性新的需求将给源系统带来额外的负担,这可能对现有工作负载的性能以及这些系统的成本和扩展要求产生负面影响,处理新的工作负载,而源系统却不会负担。随着时间的流逝,现有的消费者甚至可以过渡。

 

3、单一事实来源如果您有数据重复或多个事实来源,则这是重复数据删除和合并的机会,从而产生有用的单一视图,同样如果您需要聚合初存在于多个源系统中的数据,则在单个操作数据层中进行操作可能比从所有源系统中提取数据并在代理层或应用程序中进行聚合要容易得多。

 

做法数据本身仅仅是开始

同样重要的是,流程方面,在进行前期工作时,您需要仔细识别数据生产者和数据消费者,以确保他们都可以成功地挂接到系统中,并根据需要制定计划以合并和协调数据,为了促进这一点,一个好主意是识别数据“管理员”,即知道给定数据源并可以确保以准确和有用的方式提供数据的人,然后是公开数据,实施依赖于使用“数据即服务”而不是惯用方法的新工作方式,以及应用适当的安全性和权限的过程,以便只有适当的人员和系统才能访问该数据,正确的数据。

 

另一个实践:从小做起

鉴于数据源和系统可能纠缠不清,因此很想一口气解决所有问题:只审核您组织的所有数据,并在第1轮中进行操作以使其全部可用,有时这是可能的,但此类项目通常不会脱离计划阶段,通常只从几个数据生产者和消费者开始,并改善他们的合作方式,尽早取得成功,为项目树立信誉-提供切实的商业价值-然后向系统中逐步增加更多生产者和消费者,以交付更多用例。

 

成功交付数据即服务并非易事,您的数据资产看起来越差,就越困难-但是收益也就越大

 客服热线:400-050-6600

商业联合会数据分析专业委员会

Prev article

为什么要冒险创新的CFO想要有效创新的正确选择

Next article

什么使数据资本生病–以及如何解决它

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务