来源:数据分析师 CPDA | 时间:2018-08-24 | 作者:admin
许多人发现传统的编程语言不足以应对他们遇到的许多挑战。
数据科学家和开发人员在需要处理数据时有几种选择:
近25年来,R一直是一种相当流行的编程语言,但它从未像C及其前辈那样获得过如此大的吸引力。这已经开始发生变化,因为R已被证明是处理大数据的优秀语言。R-Bloggers的Oliver Bracht撰写了一篇文章,讨论了一些讨论R的好处的主题发言人。他写道,这些发言者指出R可以处理比其他语言更大的数据查询。
我们来看看数据科学家可以使用的一些编程语言。
有许多GUI开发平台。这些平台非常用户友好,但它们不够强大,无法处理大数据项目。
随着大数据在不久的将来变得越来越重要,许多这些平台将失去知名度。开发人员必须掌握传统的编程语言。
自1978年以来,C及其衍生产品已经为编程语言设定了标准.C是C ++,Java,Python和其他功能强大的面向对象编程语言的基础。
然而,虽然新的基于C语言具有强大的面向对象功能,但它们也有一定的局限性。他们无法处理大数据查询以及其他一些语言。
C语言有一些处理数据的好方法。以下是程序员使用它们处理数据查询的一些原因:
这些语言非常适合需要开发人员一次处理几千兆字节数据的应用程序。但是,在处理大数据时,它们并不那么强大。C ++可用于一些大数据项目,但需要正确引用指针。对使用指针不熟练的程序员将很难使用它。
C语言的局限性迫使开发人员寻找替代方案。R是一种更新的编程语言,更适合处理大数据。
R编程语言自1993年以来一直存在。在过去的20年里,它已被世界各地使用,但仍然没有使用过。但近年来,它最近开始受到更多的关注,因为它非常适合处理大数据。
该在R项目与大数据编程在几年前开发。它用于数据分析和分布式计算。它们的库广泛用于大型分布式平台,但它们也适用于更小的系统。它们甚至可以用在个人笔记本电脑上。
InfoWorld的特约编辑Martin Heller表示,R是大数据开发人员的优秀语言有几个原因。
“有R软件包和函数可以从任何合理的来源加载数据,而不仅仅是CSV文件。除了逗号以外的分隔符(使用read.table()函数处理)之外,你可以复制和粘贴数据表,读取Excel文件,将Excel连接到R,引入SAS和SPSS数据以及访问数据库, Salesforce和RESTful接口。例如,参见外国包装。
你不需要学习标准数据导入的语法,因为RStudio工具|导入数据集菜单项将通过查看文本文件或URL中的数据并设置正确的转换选项来帮助你以交互方式生成正确的命令。根据你看到的内容下拉列表。“
让我们更详细地看一下这些要点。
从多个来源加载数据
在大数据成为家喻户晓之前,大多数应用程序汇总来自单一来源的数据。这已不再是这种情况。
大数据导致了物联网的诞生。许多项目现在依赖于来自众多来源的数据。营销应用程序是一个典型的例子 他们从内部数据库,社交媒体和客户设备收集客户数据。
你需要一种可以查询和处理来自所有这些来源的数据的编程语言。
程序员适应性
学习新语法需要时间,不幸的是,多功能编程语言往往具有更陡峭的学习曲线,特别是正在处理像大数据这样复杂的事情。
R是一个例外。只要你了解它的基本编码原理,就可以使用内置库来处理大数据。
与其他语言的兼容性
R的一个好处是你可以将它与其他主要的编程语言结合使用,比如C ++。
能够从云平台中提取
如果开发人员在R中学习dplyr语法,他们可以使用它来运行包含Google BigQuery和Amazon Redshift在内的许多不同云平台的大数据查询。
大数据正在以多种方式改变我们的生活。然而,很少有人谈论它如何改变全世界程序员的生活。
开发人员正在寻找更强大的解决方案。他们发现R具有许多其他语言缺乏的大数据功能,因此在不久的将来它可能会成为一种更受欢迎的语言。