数据分析师怎样在两个变量中寻找他们之间的关系
来源:CPDA数据分析师网 / 作者:数据君 / 时间:2020-03-19
可以使用散点图或突出显示表显示关联,并且可以使用Tableau的分析对象显示关联的强度。
使用散点图可视化数值变量之间的关系
CPDA数据分析师课程中会教给学员通过在“ 列”架子上放置至少一个度量,在“ 行”架子上放置至少一个度量来创建散布图。如果这些架子同时包含尺寸和度量,则会将度量放置在内部的字段中,这意味着度量始终位于您也已放置在这些架子上的任何尺寸的右侧。在我们遇到这种情况下,“内层”一词是指表格结构。
数据分析中的散点图可以使用几种标记类型
我们再默认情况下,使用形状标记类型,根据CPDA数据分析师得到的数据,还有可能需要使用其他标记类型,例如圆形或正方形,要使用散点图和趋势线将销售与利润进行比较,度量包含连续的数值数据。当您将一个数字与另一个数字作图时,您正在比较两个数字。
将类别维度拖到标记卡上的颜色
这会将数据分为三个标记(每个维成员一个标记),并使用颜色对标记进行编码。
数据分析师需要要添加趋势线的方法
要添加趋势线,请从“ 分析”窗格中将“ 趋势线”模型拖到视图中,然后将其放在模型类型上,趋势线可以提供两个数值之间关系的统计定义。要将趋势线添加到视图中,两个轴都必须包含一个可以解释为数字的字段(根据定义,散点图总是如此)。
趋势线上可以查看有关用于创建线的模型的统计信息
您还可以自定义趋势线以使用其他模型类型或包括置信带,整个模型意义将趋势线添加到视图后,通常需要了解模型的拟合优度,这是对模型预测质量的度量。此外,您可能会对构成模型的每个因素的重要性感兴趣。