var _hmt = _hmt || []; (function() {   var hm = document.createElement("script");   hm.src = "https://hm.baidu.com/hm.js?8c9c5a8618dc4aea3be27b32962e5871";   var s = document.getElementsByTagName("script")[0];    s.parentNode.insertBefore(hm, s); })();
400 050 6600
数据分析师

手机号

验证码

30天自动登录

图神经网络的惊人应用

来源:CPDA数据分析师网 / 作者:数据君 / 时间:2021-06-28

大量的企业数据是欧几里得的,并且易于矢量化,然而有大量非欧几里得的多维数据作为令人惊叹的机器学习用例的催化剂。

网络预测:分析复杂的朋友和敌人社交网络中实体或事件之间的所有不同关系,可以准确预测任何事件(例如特定客户购买某种产品)将如何影响网络参与者,这种情报可以改变从营销和销售方法到监管要求(了解您的客户、反洗钱等)、医疗保健、执法等的一切。

实体分类:根据事件(例如联网车辆的部件故障或系统故障)对实体进行分类的潜力对于预测性维护至关重要,这种能力对于车队管理、设备资产监控和其他物联网应用具有明显的内涵。

计算机视觉、自然语言处理:理解场景中单词与彼此或图像之间关系的多维性改变了 NLP 或计算机视觉的典型神经网络部署,后者支持场景生成,而不是机器看着汽车经过消防栓的场景,狗睡在附近,这些东西可以被描述,以便机器生成该图片。

这些用例中的每一个都围绕着实体或节点之间具有多方面关系的高维数据展开,在这种情况下,“常规机器学习失败了”,然而它们非常适合图神经网络,专门用于这些和其他高维数据部署。

高维数据
图神经网络实现了这些壮举,因为图方法专注于辨别数据之间的关系,数据集中的关系并不像高维数据中的关系那么复杂,因为“直线或二维平面上的一切都可以变成向量”,这些数字或向量构成了为典型机器学习用例生成特征的基础,非欧几里得数据集的示例包括 100 多个飞机系统彼此之间的众多关系、一组客户与另外四个客户之间的链接以及这些附加组之间链接的无数相互依赖关系,这些信息不容易矢量化,并且在没有图神经网络的情况下无法实现机器学习的能力。“向量中的每个数字实际上都依赖于图形的其他部分,所以它太复杂了,一旦事物进入稀疏图并且您拥有事物网络、药物网络、基因和药物分子,就很难预测特定药物是否缺少与其他药物的联系。”

关系预测
当节点、实体或事件之间的上下文非常重要时引用的制药用例或任何其他复杂的网络应用程序,图神经网络通过理解数据的关系提供预测准确性。这种品质体现在三个主要方面,包括:

预测链接:图神经网络擅长预测节点之间的链接,以便轻松理解实体是否相关、如何相关以及该关系对业务目标有何影响。这种洞察力对于回答诸如“某些事件是否更频繁地发生在患者、飞机或文本文档中,我能否真正预测下一个事件”等问题至关重要。

分类实体:根据属性对实体进行分类很简单。图神经网络在考虑实体之间的联系的同时做到这一点,从而产生没有图就难以实现的新分类。此应用程序涉及监督学习;预测关系需要无监督学习。

图形集群:此功能指示特定图形包含多少图形以及它们如何相互关联。该拓扑信息基于无监督学习。

将这些特性与具有普遍时间信息(包括事件时间,即客户购买时间)的数据模型相结合
可以生成机器学习的有说服力的示例,这种方法可以根据患者的过去及其所包含的所有相关事件来说明患者的医疗未来,你可以说给了这个病人,给我下一种疾病和下一次你患这种疾病的机会,按几率降序排列,企业可以为客户流失、贷款失败、某些类型的欺诈或其他用例做同样的事情。

拓扑文本分类、图片理解
当图神经网络的关系辨别力专注于 NLP 和计算机视觉方面时,它们会呈现转换结果,对于前者,它支持拓扑文本分类,这是更快、更精细地理解书面语言的基础。传统的实体提取可以查明文本中的关键术语,但在一个句子中,事物可以回溯到前一个词,到后一个词,实体提取根本不看这个,但图神经网络会看句子的结构,然后你可以在理解方面做更多的事情。

这种方法还支持图片理解,其中图神经网络理解单个图片中不同图像的关联方式
没有它们机器学习只能识别场景中的各种对象,通过它们它可以收集这些对象如何相互作用或相互关联,非图神经网络机器学习不会这样做,不是场景中的所有东西如何组合在一起,将图神经网络与传统神经网络耦合可以对场景中的图像进行丰富的描述,相反,可以从描述中生成详细的场景。

图方法
图表神经网络是基于初设计的20神经网络个世纪,然而图方法使前者能够克服矢量化的限制,以在高维、非欧几里得数据集上进行操作,有助于这项工作的特定图形技术(和适用于图形的技术)当试图确定一组节点或另一组节点之间是否应该存在缺失的链接时,索引可以通过揭示两个节点在多大程度上相似图表。

优先依恋:这个统计概念是一种“他们称之为赢家通吃的技术,你可以预测某人是否会得到一切,或者你什么都不会得到,优先连接测量节点之间的紧密程度。

中心性:中心性是衡量节点在网络中的重要性的指标,这与哪些节点位于其他节点之间有关,这些和其他图方法使图神经网络能够在不对其进行矢量化的情况下处理高维数据,从而扩展企业机器学习应用程序的整体效用。

多维机器学习量表

将图神经网络应用于上述用例和应用典型的机器学习方法的关键区别在于所分析的关系的复杂性——以及这种复杂性的规模,其中图神经网络根据一年中大部分时间、超过 20,000 个实体和近 50 万个事件的输入,当转移到客户行为、医疗保健治疗或其他关键任务部署时,这种远见远非学术性的,因此它可能比企业意识到的更快地影响认知计算部署。



Prev article

混合工作时代的 4 种变革管理策略

Next article

郑重声明

数据分析师

报名咨询

数据分析师

报名缴费

数据分析师

客服中心

数据分析师

课程服务

数据分析师

认证服务