当前位置 > CPDA数据分析师 > “数”业专攻 > 全球大数据的公司,有多少你没听过?

全球大数据的公司,有多少你没听过?

来源:数据分析师 CPDA | 时间:2018-10-25 | 作者:admin

大数据的成熟程度与大多数技术不同,首先,近十年后没有一个领导者出现过。分析行业仍处于增长模式,当行业整合时,领导者就会出现。

 

其次,大名鼎鼎的早期进入市场,这也是前所未有的,因为成熟的供应商传统上一直以来都很难接受新技术。但是,IBM,微软,SAP,惠普和甲骨文已经在游戏中。

 

那么,应该选择哪些工具和平台?以下是大数据世界中的25家公司。

 

顺序前后不分排名 -

 

此列表中的众多大数据公司提供了专注于许多不同IT部门的方法。

 

u149471631857319354fm26gp0 - 全球大数据领先的公司,有多少你没听过?

New Relic

New Relic使用SaaS模型实时监控Web和移动应用程序,这些应用程序在云端,本地或混合混合中运行。它使用来自技术合作伙伴的50多个插件连接到其监控仪表板。这些插件包括PaaS /云服务,缓存,数据库,Web服务器和排队。其用于分析的Insights软件适用于整个New Relic产品线,该公司还提供名为Insights Data Explorer的产品,旨在让软件团队中的每个人都能更轻松地探索Insights事件。

 

Alation

Alation抓取企业对其找到的每一点信息进行编目,然后集中组织的数据知识,自动捕获有关数据描述的内容,数据来源,使用者以及使用方式的信息。换句话说,它将所有数据转换为元数据,并允许使用英语单词而不是计算机字符串进行快速搜索。该公司的产品提供协作分析,以加快洞察力,统一搜索方式,提供更优化的公司数据数据结构,并协助更好的数据治理。

 

Teradata

Teradata已将大数据应用程序组合构建到其统称的统一数据架构中,其中包括Teradata QueryGrid,Teradata Listener,Teradata Unity和Teradata Viewpoint。QueryGrid提供跨新的和现有分析引擎的无缝数据结构,包括Hadoop。Listener是具有多个数据流的组织的主要提取框架,Unity是一个由四个集成产品组成的组合,用于管理整个流程中的数据流,而Viewpoint是一个基于Web的自定义工具仪表板,用于管理Teradata环境。

 

u14372814131619326036fm26gp0 - 全球大数据领先的公司,有多少你没听过?

 

VMware

VMware已将Big Data纳入其旗舰虚拟化产品,称为VMware vSphere Big Data Extensions。BDE是一种虚拟设备,使管理员能够在vSphere下部署和管理Hadoop集群。它支持许多Hadoop发行版,包括Apache,Cloudera,Hortonworks,MapR和Pivotal。

 

Splunk

Splunk Enterprise最初是一个日志分析工具,但后来扩展了它的重点,现在专注于机器数据分析,使任何人都可以使用这些信息。它可以监控在线端到端交易,实时研究客户行为和服务使用情况,监控安全威胁,并识别社交平台上的现货趋势和情绪分析。

 

u6596764111171619805fm26gp0 - 全球大数据领先的公司,有多少你没听过?

 

IBM

除了大型机和Power系统之外,IBM还通过其Softlayer子公司为大规模计算规模提供云服务。在软件方面,其DB2,Informix和InfoSphere数据库软件都支持大数据分析,Cognos和SPSS分析软件专注于BI和数据洞察。IBM还提供InfoSphere,这是构建BD场景中使用的数据集成和数据仓库的基础平台。

 

Striim

Striim以前称为WebAction,是一个实时的数据流分析软件平台,可从多个来源(如数据库,日志文件,应用程序和物联网传感器)读取数据,并允许客户立即做出反应。企业可以在数据进入时对其进行过滤,转换,聚合和丰富,在内存到磁盘之前将其组织在内存中。

 

u47048916502282222fm26gp0 - 全球大数据领先的公司,有多少你没听过?

 

SAP

SAP的主要大数据工具是其HANA内存关系数据库,该公司表示该数据库可以运行80 TB数据的分析并与Hadoop集成。虽然HANA是一个行列数据库,但它可以执行高级分析,如预测分析,空间数据处理,文本分析,文本搜索,流分析和图形数据处理,并具有ETL(提取,转换和加载)功能。

虽然一些公司专注于一个或几个数据源,但SAP处理来自各种来源的数据,包括来自传感器,机器日志和其他设备的数据; 人为生成的数据 - 社交,销售点(POS),ERP,电子邮件文档和构成企业数据的其他事物。

 

u8831202751688597867fm15gp0 - 全球大数据领先的公司,有多少你没听过?

 

Alpine Data Labs

作为Greenplum员工的创建者,Alpine Data Labs在Apache Hadoop上提供了一个易于使用的高级分析界面,为构建任何人都可以使用的分析工作流和预测模型提供协作的可视化环境,而不是要求高价数据科学家编程分析。

 

甲骨文

Oracle的大数据设备将英特尔服务器与许多Oracle软件产品相结合。它们包括Oracle NoSQL数据库,Apache Hadoop,带有Hadoop应用适配器的Oracle Data Integrator,适用于Hadoop的Oracle Loader,Oracle R企业工具,它使用R编程语言和软件环境进行统计计算和出版质量图形,Oracle Linux和Oracle Java热点虚拟机。

 

Alteryx

Alteryx的软件称自己是自助服务数据分析领域的领导者,适用于业务用户而非数据科学家。它允许他们混合来自多个和可能不同的来源的数据,分析它并共享它以便采取行动。查询可以从销售交易历史到社交媒体活动中进行。

 

Splice Machine

Splice Machine将自己定位为唯一的Hadoop关系数据库管理系统(RDBMS)的提供商。它可以充当通用数据库,可以替代Hadoop上的各种工作负载的Oracle,MySQL或SQL Server数据库。最新版本2.0添加了Spark,它可以在内存中而不是在磁盘上进行所有分析。2.0版还增加了将工作路由到OLTP或OLAP两个处理引擎之一的功能。

 

Pentaho

Pentaho是一套基于开源的商业分析工具,已扩展到大数据。该套件提供数据集成,OLAP服务,报告,仪表板,数据挖掘和ETL功能。

Pentaho for Big Data是一种数据集成工具,专门用于在大数据环境中执行ETL作业,例如亚马逊,Cloudera,EMC Greenplum,MapR和Hortonworks上的Apache Hadoop或Hadoop发行版。它还支持NoSQL数据源,如MongoDB和HBase。该公司于2015年被日立数据系统公司收购,但仍继续作为独立子公司运营。

 

SiSense

SiSense将其Prism出售给最大的企业和一些中小型企业,因为它的ElastiCube产品很小,这是一个专门针对实时分析而调整的高性能分析数据库。ElastiCubes是超快数据存储,专为广泛查询而设计。它们被定位为HP Vertica系统的更便宜的替代品。

 

ThoughtWorks

Thoughtworks通过其Agile Analytics产品将敏捷软件开发原则融入到构建大数据应用程序中。Agile Analytics利用快节奏的敏捷流程帮助公司构建数据仓库和商业智能应用程序,以便快速,持续地交付新应用程序,从数据中提取洞察力。

 

Tibco Jaspersoft

Tibco的Jaspersoft子公司在亚马逊云上推出了每小时一次的产品,可以以每小时0.48美元的价格购买分析。该公司在嵌入式分析方面也做得很好 - 在全球拥有130,000个生产应用程序,用于红帽,加州,Verizon,Tata,Groupon,英国电信,维珍和美国海军等组织。

 

亚马逊

亚马逊拥有多个企业大数据平台,包括基于Hadoop的Elastic MapReduce,用于将大量数据传输到AWS的Kinesis Firehose,用于分析数据的Kinesis Analytics,用于分析数据的DynamoDB大数据数据库,NoSQL和HBase以及Redshift大规模并行数据仓库。所有这些服务都在其更大的Amazon Web Services产品中运行。

最重要的是,AWS正试图吸引旧数据库客户使用其新产品。专家们对AWS在这项工作中取得多大成功表示不同意见,但这显然是一项极具侵略性的竞争举措。

 

微软

微软的大数据战略相当广泛并且发展迅速。它与Hortonworks合作,提供HDInsights工具,用于分析Hortonworks数据平台上的结构化和非结构化数据。Microsoft还提供iTrend平台,用于动态报告活动,品牌和个别产品。SQL Server 2016附带了一个用于大数据处理的Hadoop连接器,微软最近收购了Revolution Analytics,它创建了唯一一个用R编写的大数据分析平台,这是一种用于构建大数据应用程序的编程语言,无需数据科学家的技能。

 

谷歌

Google继续扩展其大数据分析产品,从BigQuery开始,BigQuery是一个基于云的分析平台,用于快速分析非常大的数据集。BigQuery是无服务器的,因此没有可管理的基础架构,不需要数据库管理员,它使用按需付费模式。

Google还提供Dataflow,一种实时数据处理服务,Dataproc,一种基于Hadoop / Spark的服务,Pub / Sub用于将服务连接到Google消息,以及Genomics,它专注于基因组科学。

 

Mu Sigma

Mu Sigma提供了一个分析服务框架,可以查看表格和表格,并在改善销售和营销等问题上回答公司的问题。它清理客户数据以仅显示相关数据,使用数据来理解它,从中生成洞察并向客户提供建议。Mu Sigma尝试了解业务的实际运作方式,然后确定问题的实际位置。

 

惠普企业版

惠普企业在很短的时间内就建立了大量的大数据产品组合。其主要产品是Vertica分析平台,旨在管理大量快速增长的结构化数据,并在Hadoop和SQL Analytics上提供非常快速的查询性能,以实现PB级可扩展性。

HPE IDOL软件为结构化,半结构化和非结构化数据提供单一环境。它支持利用统计技术和自然语言处理(NLP)的混合分析。

HPE拥有许多硬件产品,包括HPE Moonshot,超融合工作负载服务器,用于大数据的HPE Apollo 4000专用服务器,分析和对象存储。HPE Con​​vergedSystem专为SAP HANA工作负载而设计,HPE 3PAR StoreServ 20000可存储分析的数据,满足现有工作负载需求和未来增长。

 

BigPanda

BigPanda提供基于数据科学算法的平台,专门针对IT和DevOps员工,专门用于解决警报过载问题。大数据的众多来源之一是日志,它们可以通过冗余或错误警报迅速失控。该公司注意到开发人员对日志中的警报感到不知所措,并且不知道哪些是真实的,哪些是虚假标志。BigPanda将过载过滤到有意义的警报,使IT能够更快地对实际问题作出反应。

 

Cogito Dialog

Cogito Dialog是一项高度垂直但重要的服务,它使用行为分析技术,包括从客户电子邮件到社交媒体的所有内容分析,以及人声分析,帮助电话支持人员在与客户通话时改善通信,并更好地帮助组织管理代理业绩。

 

Datameer

Datameer声称其面向Hadoop的端到端数据分析解决方案使业务用户能够通过基于向导的数据集成,迭代点击式分析和拖放式可视化来发现任何数据中的洞察力,无论数据类型如何,大小或来源。