变量之间的关系(表示变量间的关系有三种形式)
相关性的类别和描述
一切都是相互联系,相互影响的。怎样才能更好的理解事物之间的相互影响和制约?如何判断两个数据的相关性?
相关关系类别
客观事物之间的相关性大致可以分为两类:一类是函数关系,一类是统计关系。
函数关系是指有一个函数可以唯一描述两个变量的值。比如销量和销量的关系可以用y=p*x(y代表销量,p代表单价,x代表销量)的函数来表示。当单价确定后,对于任何给定的销量X,只有一个销量Y对应。所以销量和销量是有函数关系的。这种关系不是我们关注的焦点。
统计关系是指两个事物之间非一一对应,即当变量x取某个值时,另一个变量y不是唯一确定的,而是按照一定规律在一定范围内变化的。比如孩子身高与父母身高、广告费、销售额的关系,不是一个函数关系可以唯一确定的,这些变量之间是有一定关系的。大多数情况下,父母的身高越高,孩子的身高越高;你在广告上花的越多,你得到的销售额就越多。这种关系叫做统计关系。
根据相关性的变化方向,可分为正相关性和负相关性。正相关是指两个变量朝同一个方向变化;负相关是指两个变量的变化方向相反。
详见下图。
相关性描述方式
常用的描述相关性的方式有:相关图(即散点图)、相关系数、显著性检验。
散点图是描述相关性最常用的方法。如下图所示。
至于相关系数和显著性的方式,请参考以下小节。
相关性方法种类
不同的应用场景采用不同的相关性分析方法。
以下是所选相关性分析方法的简要总结。
解释变量类型
解释变量的类型
方式
功能
数
数
相关性分析
测量两个变量之间的相关性
类别类型
数
方差分析
评估这些因素是否对目标变量有重大影响
数
类别类型
类别类型
类别类型
偶然性分析
评估这两个因素是否相互影响/相互独立
举个简单的例子:
某电信运营商,面临着不增收的困境,想知道哪些因素可能影响客户的消费水平(即哪些因素与成本有关),哪些因素与客户流失有关,所以收集了以下表格,请分析并给出结论。
从该方法的适用场景中,我们可以知道:
1)如果要评价收入与基本支出的相关性,可以使用相关性分析。
2)如果要评价婚姻状况与基本费用的相关性,可以用方差分析。
3)如果要评价受教育程度与客户流失的相关性,可以用权变分析。
其余的可以采用类似的方法。
相关性和因果性与一切都有关系
