当前位置 > CPDA数据分析师 > “数”业专攻 > 困惑?学了那么多工具,还是不会数据分析...

困惑?学了那么多工具,还是不会数据分析...

来源:数据分析师 CPDA | 时间:2019-07-09 | 作者:admin

很多学习数据分析的同学也都有这样一种困惑「为什么学了那么多工具,还是不会数据分析?原因无外乎两个,一是只学到了碎片的知识,没有建立知识之间的连接,无法形式自己的知识体系,二是缺乏实践,导致无法形成「知行合一」的工作技能。

 

01 系统学习的重要性

 

任何学习知识,都是相互联系,相互作用的。因此第一步就是找出各部分间的直接联系,把网络结构初步地建立起来。但是有些部分和其他部分并不一定能够建立直接的联系,那么还需要发掘第二层、第三层关系。 要明确各部分之间的关系,以及综合运用。

 

行动学习理论认为,人要掌握一门技能,需要有 10% 的时间学习知识和信息,70% 的时间练习和践行,还有 20% 的时间与人沟通和讨论。这个原则叫做 721 原则。

 

碎片化学习对于 10% 的信息接收非常有用,而剩下独处练习的 70% 和讨论的 20%,则需要留出大量时间来系统学习——碎片化学习永远只是系统化学习的辅助。你需要留出足够多整块时间学习。

 

所谓系统学习法,是指把所学内容当成是一个系统看待,力求从大方向出发指导学习,这样,在学习的时候不是按部就班按章节行进,而是先模糊概括,再逐渐在大框架下逐步明晰细节、完善结构、针对缺陷和不足专攻的学习方法。

 

02 如何系统学习数据分析

 

.jpg - 困惑?学了那么多工具,还是不会数据分析...

 

在学习数据分析之前应该明白几点

 

数据初期的准备通常占整个数据挖掘项目工作量的70%左右。

数据分析师本身融合了业务知识、统计学和计算机等学科,并不是新的技术。

数据分析更适合业务人员学习(相比技术人员学习业务来的更高效)

数据分析项目通常需要重复一些毫无技术含量的工作。

 

03 职业规划

 

以数据分析师为例,先看一下国内知名互联网数据分析师的招聘要求:

 

计算机、统计学、数学等相关专业本科及以上学历;

具有深厚的统计学、数据挖掘知识,熟悉数据仓库和数据挖掘的相关技术,能够熟练地使用SQL;

三年以上具有海量数据挖掘、分析相关项目实施的工作经验,参与过较完整的数据采集、整理、分析和建模工作;

对商业和业务逻辑敏感,熟悉传统行业数据挖掘背景、了解市场特点及用户需求,有互联网相关行业背景,有网站用户行为研究和文本挖掘经验尤佳;

具备良好的逻辑分析能力、组织沟通能力和团队精神;

富有创新精神,充满激情,乐于接受挑战.

 

前三个属于硬件要求,一般而言,有专业基础(计算机、统计学、数学等相关专业)入行需要 3 个月以上的学习。对于非专业背景的同学,入行的时间可能需要的更长,建议给自己预留 6-12 月的时间。而要成为一个熟手(企业用工需求最多)则需要 2-3 年以上的行业经验。

 

作为一门对数学和计算机都有较高要求的一门交叉学科,从事大数据是有一定门槛的,但相对于 10 年以上的职业生涯(国外顶尖数据科学家 50-60 岁仍然十分活跃),预备半年的时间来学习这个最炙手可热的技能还是很划算的。

 

04 从业务开始

 

学习一门技术要和行业靠拢,没有行业背景的技术如空中楼阁。技术尤其是计算机领域的技术发展是宽泛且快速更替的,一般人没有这个精力和时间全方位的掌握所有技术细节。但是技术在结合行业之后就能够独当一面了,一方面有利于抓住用户痛点和刚性需求,另一方面能够累计行业经验,使用互联网思维跨界让你更容易取得成功。不要在学习技术时想要面面俱到,这样会失去你的核心竞争力。

 

大数据是技术工具,最终的应用需要深入理解业务企业的业务场景和商业模式,甚至有人说不懂业务就不要谈大数据,可见领域知识的重要性。值得一提的是,近几年在顶尖科学杂志《Nature》与《Science》上发表的大数据文章都是来自行业专家,而并非计算机专家,这从另外一个方面反映了业务知识的重要性。

 

05 Get技能

 

  1. 数学知识

 

数学知识是数据分析师的基础知识。对于初级数据分析师,了解一些描述统计相关的基础内容,有一定的公式计算能力即可,了解常用统计模型算法则是加分。对于高级数据分析师,统计模型相关知识是必备能力,线性代数(主要是矩阵计算相关知识)最好也有一定的了解。

 

  1. 分析工具

 

对于初级数据分析师,Excel 是必须完全掌握的,数据透视表和公式使用必须熟练,VBA 是加分。另外,还要学会一个统计分析工具,SPSS 作为入门是比较好的。对于高级数据分析师,使用分析工具是核心能力, SPSS/SAS/R/Python 至少要熟练使用其中之一,其他分析工具(如Matlab)视情况而定。

 

  1. 编程语言

 

对于初级数据分析师,会写 SQL 查询,有需要的话写写 Hadoop 和 Hive 查询,基本就 OK 了。对于高级数据分析师,除了 SQL 以外,学习 Python 是很有必要的,用来获取和处理数据都是事半功倍。当然其他编程语言也是可以的。

 

 

 

  1. 勤于学习

 

大数据时代的知识,没有像印刷时代对知识结构视为必须具备的“基础”知识,知识是非线性的,可以自由组合、切割,处于一种分散和游离的状态。未来,你必须具备快速自学和捕捉知识的能力,学习将从一个「知识储备,学以致用」的过程,向「知识构建,用时再学」的过程转变,学习将是一个持续的,乃至终身学习的过程。为此你需要具备一种快速而灵活的学习方式。

 

  1. 参与一次系统培训

 

系统培训能够帮你规划并实施一个系统的学习方案,会在你起步的时候构建一个比较扎实的基础知识框架,这个过程和盖楼时先打地基的道理是一样的,地基打的越深,楼房才能盖的越高。具备项目经验的讲师会讲授很多实际工作中的项目经验,可以带领大家快速进入正确的学习通道,少走弯路。当然,培训取代不了工作实践,如前所述,多在工作中积累业务经验,技能水平才能提升的更快。

 

  1. 在社区快速学习

 

在国外,除了大学,社区形式的学习平台(如r4stats.com、KNIME)由于知识更新快,学习时间更加灵活,形成了独特的社区学习(community learning)现象。社区里不但有初学者(freshman),也是不少顶尖技术专家(Veteran)光顾的地方。社区是一个自由、无中心的交流学习平台,没有权威,一切都可以质疑和挑战。当然,如果要和这些高手过招,你必须先打好英语基础。未来,社区将成为从业者技能 get、快速充电的重要渠道,社区或将成为继高等学校、职业学校以外的一个「无围墙」的校园。