var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

数据管理和合规性方面取得了进步

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-07-27

在金融服务行业内的数据和信息技术主管中进行的调查
金融机构正在将其预算的很大一部分分配给合规性计划,而接受调查的人中有54%进一步表明,至少这些功能的一半仍在其组织内部手动执行,87%的高管表示,他们将在2021年实施战略数据管理计划,以实现进一步的关键业务目标,例如提高盈利能力和改善客户成果,许多公司报告说,人工智能驱动的分析云服务处于这些计划的前沿,此类解决方案使金融服务公司能够筛选大量数据,并获得准确,一致且可信赖的实时数据的单一视图,这项研究还为CDO提供了有关同行如何利用新数据管理技术和体系结构(例如数据结构,自动化治理,机器学习,数据沿袭和区块链)的见解,以使他们能够满足其无数的业务需求。

金融服务机构正在努力争取竞争优势
为客户提供更多价值,降低风险,并更快地响应业务需求,这需要充分利用数据,并且研究表明,防御性数据管理和自动化合规性功能以及更具战略意义的改变银行类型的举措可能还需要大量工作,而这些举措可能会产生重大影响。在他们的运作上,其他主要发现包括,风险数据汇总是其IT部门的主要监管问题,而69%的受访者表示“了解客户”是其资源消耗的主要领域,其企业已将数据沿袭作为一种数据治理技术,而52%的组织已应用了众包技术,通过进攻性的数据管理方法奉行以分析为基础的业务战略。

现代数据管理技术的进步确保我们的金融服务客户能够继续遵守法规和风险管理计划,同时还使他们能够实施能够产生新收入来源,增强客户体验并提高运营效率的战略计划。 

了解NoSQL数据库:文档存储
面向文档的数据库(也称为:聚合数据库,文档数据库或文档存储)将每个记录及其关联数据放在单个文档中,这种数据库类型是NoSQL伞的子集,NoSQL伞指的是使用“非关系”模型(即不依赖结构化查询语言SQL的数据库)的流行数据库管理系统的列表,创建NoSQL是为了填补SQL数据库中的空白 ,因为大多数数据库使用SQL ,所以有时将它们称为RDBMS,即关系数据库管理系统,与非关系相比,今天的关系仍然具有普及的优势,因为-尽管“ NoSQL”一词直到21世纪才问世,尽管它始于1960年代后期-但由于指数级的大数据云创新,以及互联网的极高普及度和UGC的需求,也就是说,像MongoDB和Redis这样的大数据非关系型企业现在已经与甲骨文和MySQL这样的老牌关系型巨头处于相似的联盟,而且趋势还在不断发展。 

文件存放处的用途
那么为什么面向文档的数据库与大数据相关?过去几十年来,它与现代NoSQL数据库的总体需求增长紧密相关。NoSQL提供了一种组织大量非结构化数据的方法,在许多情况下,它比SQL更可扩展且对开发人员更友好。但是,存在大量例外情况,应注意:NoSQL图形数据库之类的混合实际上具有在不丢失完整性的情况下处理结构化和非结构化数据的不同能力:这意味着高可伸缩性,高灵活性,具有高度可靠的查询,我的想法是,两个世界的融合将继续下去。无论如何,文档存储如今具有广泛的用途:

Web应用程序-博客平台,详细的Web见解,电子商务应用程序,用户项,内容管理系统
游戏-成就(例如完成的挑战,实时统计数据),游戏中的聊天/消息传递,领导力得分跟踪,订阅。 
用户生成的内容-聊天记录,用户评分,用户评论,推文,博客。
常规存储/日志记录-用户帐户,分类项目,存储日志,实时见解。
除其他用途外。常用文档存储系统的示例包括MongoDB,CouchDB,OrientDB和DocumentDB。有关现代NoSQL数据库的完整列表,请参见此处。

文件库的结构
让我们做一个思想实验:您正在使用关系数据库来存储包含在各种表中的数据,目的是绘制各种图书作者的地图。一张表格映射了作者姓名,发行日期和类型,以及相关的作者ID。其中一些作者有系列文章,因此您有一个单独的表,用于查看专辑名称和ID,是一张不同类型和类型ID的表格,您以图表方式关联了这三个表,创建了主键和外键字段;将这些表以结构化设计链接在一起以进行查询。这就是您完成的基本结构,相比之下,文档数据库不依赖于表模式,每个实体都放置在单个文档中,并且可以在该单个文档中找到关联数据,实际上您可以在没有架构的情况下开始加载数据,您的数据库不需要组织和结构化–您不一定需要列,表,主键/外键,关系,存储过程, 很快。   

一方面,这允许在数据,集成和建模方面有更大的差异
另一方面在实体之间执行敏锐关系的能力较低,因此SQL仍然是事务(如ATM)中的主要力量,在这些事务中,需要严格而极其简单的系统来确保数据库级别的业务逻辑和可信赖性,总体而言,文档存储依赖于键值存储,键值存储在创建这些实施规则方面并不相同,当针对数据库的高度本地化区域时,SQL具有更好的性能,并且对统一数据也很有效,即用于个人会计之类的事情,但是为了获得跨越不断发展的,相当不可预测的大数据存储区的元信息和快速连接-使用此简单的键值程序快速检索非结构化数据,面向文档的数据库自然是强大的。 

关系与 规模 
让我们看一下这种“模式减少/免费”模式的一些终的主要好处和取舍,首先与NoSQL数据库通常一样,文档存储可以很好地进行水平扩展,这与SQL数据库不同,分片(在数千台计算机之间存储共享数据)在此模型中表现良好,相比之下,关系数据库在垂直方向上可以更好地扩展(例如,添加存储,内存等),因此NoSQL被视为敏捷开发和混合/多云的更自然的对应,由于文档存储区不使用外键(关系数据库用来将表彼此关联),因此需要在应用程序层为文档数据库建立关系,但是对于选择使用文档存储的人来说,关系应该没有那么重要。

外卖

无论特定行业如何,人们都越来越难以否认世界正在朝着多云的方向发展,随之而来的是大数据的水平传播,制作面向文档的数据库以及企业员工在数据设计智能方面的培训,需求不断增长,在很大程度上,数据存储在处理高速缓存和索引数据的输入和输出时遇到的困难较小,与创建新的Web应用程序保持同步并携手并进,和水平缩放,但是需要更多文档,以使这些内容脱离小型利基社区和论坛,并且需要分发有关不同可用文档存储的更多指南,对于那些能够保持兴趣,跟踪比赛的人来说,它是一种反身工具,可以轻松添加数据集或以更少的麻烦快速扩大规模。



 


Prev article

比较Python与R进行数据分析

Next article

CPDA数据分析师动态周报

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务