数据分析使用计算创建自定义字段的方法
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-03-25
我们在做数据分析时如果基础数据不包含您需要回答问题的所有字段,则可以使用计算创建新字段,然后将它们另存为数据源的一部分,这些字段称为计算字段。
我们为什么要使用计算字段
我们首先要知道计算字段允许您从数据源中已经存在的数据创建新数据,创建计算字段时实际上是在数据源中创建一个新字段(或列),其值或成员由数据分析师控制的计算确定,这个新的计算字段将保存到数据源中,并可用于创建更强大的可视化。但请放心:您的原始数据保持不变。数据分析中数据计算类型,
您可以出于许多许多原因使用计算字段,一些示例可能包括:
1、分割数据
2、转换字段的数据类型,例如将字符串转换为日期。
3、汇总数据
4、筛选结果
5、计算比率
数据分析中数据计算类型
数据分析师可以使用计算创建计算字段,还可以使用三种主要类型的计算来创建计算字段:
数据分析中所谓的基本计算
基本计算使您可以在数据源详细信息级别(行级计算)或可视化详细信息级别(聚合计算)转换值或成员,细节级别表达式 -与基本计算一样,LOD计算使您可以在数据源级别和可视化级别计算值,但是LOD计算可让您进一步控制要计算的粒度级别,就可视化的粒度而言,它们可以在更高的粒度级别,更低的粒度级别或完全独立的级别执行。
表格计算 -表格计算仅允许您在可视化细节级别转换值。有关更多信息,请参见使用表计算转换值
创建一个计算字段
确定要使用的计算类型后,就该创建一个计算字段了。
数据分析师对计算的基本表达理解
基本表达式使您可以在数据源详细信息级别(行级计算)或可视化详细信息级别(聚合计算)转换值或成员。
行级计算
若要创建一列以显示数据源中每一行作者的姓氏,可以使用以下行级计算:
SPLIT([Author], '.', 3 )