-
正相关 编辑
正相关(Positive correlation),是指两个变量变动方向相同,一个变量由大到小或由小到大变化时,另一个变量亦由大到小或由小到大变化。即其数据曲线的切线斜率始终大于零。如身高与体重,身高越长,体重就越重。也就是说,在正相关的情况下,一个变量随着另一个变量的变化而发生相同方向的变化(两个变量同时变大或变小)。其中,引起变化的量叫做自变量(即自己发生变化的量),另一个变量叫做因变量(即跟着自变量变化的量)。
统计学中常用相关系数r来表示两变量之间的相关关系。r的值介于-1与1之间,r为正时是正相关,反映当x增加(减少)时,y随之相应增加(减少);呈正相关的两个变量之间的相关系数一定为正值,这个正值越大说明正相关的程度越高。
当这个正值为1时就是完全正相关的情形,如点子排为一条直线,为完全正相关。正相关虽然意思明确,其实是个模糊的概念,不可以量化,只是定性说法。如果有明确的关系,例如y=2x,这叫y与x成正比,如果只是大体上,x、y的变化方向一样,例如x上升,y也上升或者x下降,y也下降,那么,这叫正相关。反之,x上升,y却下降,或者x下降,y却上升,就叫负相关了。
变量关系
在一次对人体内脂肪含量与年龄关系的研究中,研究人员的出了一组样本数据:
年龄 | 23 | 27 | 39 | 41 | 45 | 49 | 50 | 53 | 54 | 56 | 57 | 58 | 60 | 61 |
脂肪含量 | 9.5 | 17.8 | 21.2 | 25.9 | 27.5 | 26.3 | 28.2 | 29.6 | 30.2 | 31.4 | 30.8 | 33.5 | 35.2 | 34.6 |
下面便要做出散点图(而不是函数图象),因为从表中可以看到年龄为57的,脂肪含量并没有增大。
对与表中数据,我们假设人的年龄影响体内脂肪含量,于是,按照习惯,以x轴表示年龄,以y轴表示脂肪含量,得到散点图:
从图2的散点图可以看出,这些点大致分布在通过散点图中心的一条直线附近。如果散点图中的分布从整体上看大致有在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。附:回归直线的算法: