excel表格中相关系数有效位数保留(Excel数据分析——相关系数)
相关系数,在统计过程中十分常用的一个概念,用来表示两组数据之间的关联程度
之前在线性回归里提过,这个数值的计算结果在-1到1之间,越是靠近0就表示没有线性相关,而越靠近两端的-1或者1表示线性关系越强
但是它的应用却不仅仅局限于线性回归,虽然到底用途有多少我也不能完全归纳,不过这里还是可以举个拟合问题以外的例子
比方说我们有一份已经整理好格式的产品组件表格:
其中,每列表示一种产品,每种产品下方的数字表示做一个此种产品需要用到的组件数量,现在,我们想比较这些产品之间的异同
相关系数在Excel中有现成的公式PEARSON,也就是说,假设我们先计算产品A和B之间的差异,可以把公式写成:
=PEARSON (产品A列:产品B列),计算结果为0.7833
这里请注意我们在以前做线性拟合时用过的另一个公式RSQ,这个公式是相关系数的平方,也就是RSQ(x)= PEARSON(x)^2,想验证的可以自行试试
这似乎看起来不是很复杂的事情
但是,当我们要比较的产品很多的时候,我们就会遇到一个小问题,那就是产品与产品之间是两两比较,想我们目前列出有四种不同产品时,比较结果就已经有3 2 1=6种
这个配对比较会产生多少种结果,我们也有个另外的公式可以直接计算,那就是组合数公式COMBIN
在我们当前这个例子中,组合数为:=COMBIN(4,2)=6,意思是在4个总体中每次抽取2个能得到的所有组合的数量
而当我们增加产品种类的时候,比如增加到50个,就会发觉组合数猛增到了=COMBIN(50,2)=1225种
这时我们再通过手工罗列出所有组合方式,并用公式两两计算的话就会显得有点麻烦了,不是不能做,只是有现成的工具比这样操作方便
现成的相关系数工具还是在数据分析加载项里(我觉得自己快把这里面的东西都写得差不多了):
打开后界面如下:
要填写的内容比较少,我就不仔细解释了,填好后确定
输出结果如下:
Excel输出的这个格式看起来还挺齐整,除去1那个斜排,正好6个比较结果,其中越接近1的表示这两种产品相似程度越高
感觉这个思路用来做两两比较的计算挺好的,哪怕不是做相关系数计算,这个方法只是用来提取两两组合看起来也很方便
正经内容就这些啦,最后增加一点小Tip,为啥R值的平方公式就那么简洁(RSQ),不做平方公式名称就那么长呢(PEARSON)??因为这是个叫皮尔森的歪果仁搞出来的数学公式啦,所以咱为了表达点尊重,还是注意点别把人家的名字拼错了,毕竟拼错了就算不出来了啦,嘻嘻嘻~~~~
- 乳液和面霜有必要一起用吗(看完这篇文章)
- cad正在检查许可卡死了怎么办(Win10运行AutoCAD2014卡在“正在检查许可”界面怎么办)
- 本科刚毕业找不到工作怎么办(本科毕业在家里蹲3年)
- 婴儿辅食小馄饨做法(宝宝小馄饨「宝宝辅食」)
- 红娘是哪一部名著的人物(蚂蚁庄园2020年10月24日答案)
- 苹果如何辨别翻新机和原装(你可以做这3件事)
- 今年高考录取通知书查询时间(2023年高考查分时间及录取结果查询方式)
- 3m口罩型号大小(不同3M口罩型号使用领域介绍)
- 酸辣白菜怎么炒的颜色亮白(厨师长教你做法)
- 晚上睡觉为什么老磨牙(怎么回事)
- 红油焖春笋的正确做法(直接炒还是先焯水)
- wps 更改所有字体颜色(wps表格学习笔记——表格内容的查找、替换与定位)
- 个人特长及爱好怎么写(个人特长(写法10种))
- 华为怎么设置动态锁屏壁纸自定义(华为荣耀手机自定义相册视频为动态锁屏壁纸操作教程)
- wps表格表头加斜线和文字(WPS表格斜线表头的制作以及打字的方法)
- 松花蛋面的做法(色香味俱佳还能解馋)
- 电脑连不上网怎么办显示感叹号(小白也可以轻松解决)
- 常吃洋葱的七大好处(常吃可帮你带来6大好处)