如何在2020年从数据中获取更多信息
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-11-06
企业将越来越需要功能
使其能够通过安全存储,更快的集成和更好的数据发现流程来实现数字化转型,诸如机器学习(ML)之类的认知计算功能支持的AI驱动分析的采用,加快了从低延迟到实时分析的业务洞察交付,从而加快了产品上市时间,希望在2020年利用这些的可行见解的公司必须适应更新的趋势,例如数据结构/网格,数字孪生和多云策略,以保持竞争优势。随着组织不断寻找驱动灵活性,敏捷性和创新的方法,他们可以期望在来年看到以下三种趋势:
数据结构动态变为数据网格
数据结构允许通过单一,安全且受控的数据管理框架在分布式计算系统之间进行无障碍访问和共享数据,许多大型公司都根据其业务需求运行多个应用程序,从而导致收集了大量的结构化,半结构化和非结构化数据,这些数据分散在各种数据源中,例如事务数据库,数据仓库,数据湖和云存储,数据结构体系结构旨在将多个数据孤岛之间的历史数据和当前数据缝合在一起,以生成统一统一的数据业务视图,它为处理来自不同来源的大量数据而不必将所有数据复制到另一个存储库中的复杂IT挑战提供了一种优雅的解决方案,通过结合数据集成,数据虚拟化和数据管理技术来创建有助于许多业务流程(例如,加速数据准备和促进数据科学)的统一语义数据层,可以实现这一壮举。
随着数据结构从静态基础架构转变为动态基础架构,它逐渐发展为所谓的数据网格
数据网格是一种遵循元数据驱动方法的分布式数据体系结构,并受机器学习功能的支持,它是一个量身定制的分布式生态系统,具有可重复使用的数据服务,集中的管理策略和动态数据管道。数据网格的主要概念是域数据的所有权以自助服务,可使用的格式分布在不同的业务部门中,换句话说数据在域中拥有,并且这些域数据集可用于不同团队之间的有效利用。
数据网格的另一个重要方面是其全球可用的集中式发现系统(也称为数据目录)
使用数据目录,寻求洞察力的多个团队可以访问数据发现系统以获得信息,例如系统中的可用数据,原始点,数据所有者,样本数据集和元数据信息,域数据在此集中式注册表系统中建立了索引,以便快速发现。,为了使数据跨域一致,数据网格专注于提供多语言生态系统中域数据集之间的互操作性和可寻址性标准。
处于边缘的数字双胞胎带来了实时分析
数字孪生是通过传感器(例如计算机辅助设计(CAD)等建模软件)将遥感数据拼凑而成的物理对象或系统的数字传真或虚拟仿真,数字孪生可以模仿汽车,工业设备或人类的行为,可以合并以模仿工程操作,借助AI,ML,认知计算和工业物联网(IIoT)等技术的起源,数字孪生技术正在创造的可能性,从而带来创新的业务概念。
可以整合数字双胞胎以形成复杂的现实世界环境
同时允许公司与满足业务内部和/或外部机制的单个数字双胞胎建立联系,从物联网传感器生成的动态和历史数据可通过实时数据源提供有关实际工业运行和环境的见解,稍后可被物联网应用程序(例如边缘计算)利用,期望数字孪生像他们的身体平等一样准确地做出反应。通过边缘计算在本地设备级别生成和处理的实时数据可实现对延迟敏感的操作,将数字双胞胎从云中放置到网络的外部边界,可以实现近时延迟,实时分析,数据隐私,操作不一致性检测和故障预测,数字双胞胎,再加上边缘计算,再加上负担得起的传感器技术,加上计算能力的增强,可以帮助公司加速产品开发过程,提高效率,降低云存储成本并构建全面的产品组合。
多云提供同类的解决方案
多云涉及在单个网络体系结构中使用来自多个公共云托管服务提供商的云服务,以实现近时延迟,成本和其他关键指标的组合,初采用多云是由可用性和性能以及避免供应商锁定所驱动,因此组织可以从的解决方案中受益。如今公司希望通过云来支持服务,以提供更好的安全性和故障转移,满足数据治理要求并避免停机,刺激采用多云策略的另一个因素是数据结构。数据结构跨多个公共云平台实时集成异构数据,例如使用多个云平台的服务的公司可以运行一个特定的应用程序,运行一个不同的应用程序,其工作负载分散在多个云网络中,此外多云策略可通过在多个云提供商上备份数据来实现更好的灾难恢复,从而提高可靠性。
利用多云体系结构的公司需要制定集中的管理策略
使其能够通过安全存储,更快的集成和更好的数据发现流程来实现数字化转型,诸如机器学习(ML)之类的认知计算功能支持的AI驱动分析的采用,加快了从低延迟到实时分析的业务洞察交付,从而加快了产品上市时间,希望在2020年利用这些的可行见解的公司必须适应更新的趋势,例如数据结构/网格,数字孪生和多云策略,以保持竞争优势。随着组织不断寻找驱动灵活性,敏捷性和创新的方法,他们可以期望在来年看到以下三种趋势:
数据结构动态变为数据网格
数据结构允许通过单一,安全且受控的数据管理框架在分布式计算系统之间进行无障碍访问和共享数据,许多大型公司都根据其业务需求运行多个应用程序,从而导致收集了大量的结构化,半结构化和非结构化数据,这些数据分散在各种数据源中,例如事务数据库,数据仓库,数据湖和云存储,数据结构体系结构旨在将多个数据孤岛之间的历史数据和当前数据缝合在一起,以生成统一统一的数据业务视图,它为处理来自不同来源的大量数据而不必将所有数据复制到另一个存储库中的复杂IT挑战提供了一种优雅的解决方案,通过结合数据集成,数据虚拟化和数据管理技术来创建有助于许多业务流程(例如,加速数据准备和促进数据科学)的统一语义数据层,可以实现这一壮举。
随着数据结构从静态基础架构转变为动态基础架构,它逐渐发展为所谓的数据网格
数据网格是一种遵循元数据驱动方法的分布式数据体系结构,并受机器学习功能的支持,它是一个量身定制的分布式生态系统,具有可重复使用的数据服务,集中的管理策略和动态数据管道。数据网格的主要概念是域数据的所有权以自助服务,可使用的格式分布在不同的业务部门中,换句话说数据在域中拥有,并且这些域数据集可用于不同团队之间的有效利用。
数据网格的另一个重要方面是其全球可用的集中式发现系统(也称为数据目录)
使用数据目录,寻求洞察力的多个团队可以访问数据发现系统以获得信息,例如系统中的可用数据,原始点,数据所有者,样本数据集和元数据信息,域数据在此集中式注册表系统中建立了索引,以便快速发现。,为了使数据跨域一致,数据网格专注于提供多语言生态系统中域数据集之间的互操作性和可寻址性标准。
处于边缘的数字双胞胎带来了实时分析
数字孪生是通过传感器(例如计算机辅助设计(CAD)等建模软件)将遥感数据拼凑而成的物理对象或系统的数字传真或虚拟仿真,数字孪生可以模仿汽车,工业设备或人类的行为,可以合并以模仿工程操作,借助AI,ML,认知计算和工业物联网(IIoT)等技术的起源,数字孪生技术正在创造的可能性,从而带来创新的业务概念。
可以整合数字双胞胎以形成复杂的现实世界环境
同时允许公司与满足业务内部和/或外部机制的单个数字双胞胎建立联系,从物联网传感器生成的动态和历史数据可通过实时数据源提供有关实际工业运行和环境的见解,稍后可被物联网应用程序(例如边缘计算)利用,期望数字孪生像他们的身体平等一样准确地做出反应。通过边缘计算在本地设备级别生成和处理的实时数据可实现对延迟敏感的操作,将数字双胞胎从云中放置到网络的外部边界,可以实现近时延迟,实时分析,数据隐私,操作不一致性检测和故障预测,数字双胞胎,再加上边缘计算,再加上负担得起的传感器技术,加上计算能力的增强,可以帮助公司加速产品开发过程,提高效率,降低云存储成本并构建全面的产品组合。
多云提供同类的解决方案
多云涉及在单个网络体系结构中使用来自多个公共云托管服务提供商的云服务,以实现近时延迟,成本和其他关键指标的组合,初采用多云是由可用性和性能以及避免供应商锁定所驱动,因此组织可以从的解决方案中受益。如今公司希望通过云来支持服务,以提供更好的安全性和故障转移,满足数据治理要求并避免停机,刺激采用多云策略的另一个因素是数据结构。数据结构跨多个公共云平台实时集成异构数据,例如使用多个云平台的服务的公司可以运行一个特定的应用程序,运行一个不同的应用程序,其工作负载分散在多个云网络中,此外多云策略可通过在多个云提供商上备份数据来实现更好的灾难恢复,从而提高可靠性。
利用多云体系结构的公司需要制定集中的管理策略
以避免由公司IT部门而不是业务部门员工管理的未经授权的云服务实例,因为后者模型会导致影子IT并增加云成本,从这三个趋势可以明显看出,大量孤立数据是潜在的混乱,这导致企业需要寻找更好的方法来访问,存储和处理对延迟敏感的应用程序和快速的业务解决方案的高容量数据,将采用这些以数据为动力的技术,以使其在2020年成为主流。