相关系数,为何相关,如何相关?

我们知道,我们可以利用回归分析对具有相关关系的两个变量进行统计分析。

也就是说只要给出我们样本数据,我们就可以求出样本的回归直线方程。
接下来我们研究一个问题:
通过抽样统计某地一年内某天的最高气温,
1月1日,2°;2月15日,-1°;3月5日,16°;4月10日,21°;5月12日,27°;
6月1日,33°;7月7日,38°;8月6日,32°;9月16日,29°;10月27日,24°;
11月22日,12°;12月8日,7°;
姑且不考虑是否具有线性相关,我们尝试利用最小二乘原理求出日期与气温的“回归直线方程”,利用公式,显然是“可行”的。


在现实生活中,变量之间的常见关系有三种:一是确定性函数关系,变量之间的关系可以用函数表示;二是非确定性相关关系,变量之间有一定的关系,但不能完全用函数表达,变量问只存在统计规律;三是毫无关系的两个变量,譬如上述的日期与气温。对于两个变量,我们如何确定不相关,或者相关,相关性的强弱,如何解决?
当然我们可以求出回归方程,然后再利用相关指数判断,但似乎有点后知后觉的感觉!显然我们需要寻求一个新的判断方式——相关系数。
然而,在人教A版教材中, “线性回归方程”是教材的正文,“相关系数”是作为介绍性材料给出的。教材没有很好地揭示两者的内在联系。导致教师和学生按部就班地计算判断,不明原因,接下来,本文从几个角度来揭示两者之间的关系,以促进大家对这块内容的理解。
一、相关指数分析
从上篇文章《相关指数,为何相关,如何相关?》,我们知道我们可以借助于相关指数判断模型拟合效果的好坏来分析线性相关的强弱。





通过公式不难发现相关系数是由原始数据得到的,而相关指数则需要由预测值得到,也就是说,给出我们一组数据,我们可以直接求出相关系数,而要想求出相关指数,则必须求出回归直线方程才可以。

显然,两变量几乎不存在线性相关关系,所以没有必要去求回归直线方程了。
需要说明的是:相关系数和相关指数是两个不同的概念,
相关系数是用来判断两个变量的线性相关性的强弱;相关指数来判断回归模型的拟合效果好坏。
一般是先求相关系数,分析相关性的强弱。然后求回归方程,最后求出相关指数,分析模型的拟合效果。
二、向量分析


三、柯西不等式分析
柯西不等式:



利用相关指数解析线性相关系数,可以看到了线性回归方程在预测时的准确程度,可看到人们在定义线性相关系数时的一些本原性思考及其定义的合理性。利用向量和柯西不等式的角度解析线性相关系数,可以看到了随机性数学与确定数学之间并不存在不可逾越的鸿沟,也有沟通之桥,可以相互渗透。

【前段时间,总会有读者在公众号的消息一栏给我留言,由于小编工作的特殊性,不能及时看到留言,当看到留言时,想回复,却过了回复时间(我只能与两天内的朋友们互动),所以以后大家如果有什么疑问,不要在公众号上发消息,可以选择文章的评论或者加我好友私聊,我的微信号码:“jingruiqiang”或者“282515512”。
近期总有新朋友给我发消息“历史消息”,想看到历史文章,抱歉,因为我不太会设置“自定义菜单”,是我的无知造就了您的徒劳,想看我历史文章的朋友们,可以进入我公众号的页面,点击右上方的“小人儿”,然后点击“查看历史消息”即可。
耳娱心憩之余如有您偶或中意的“数学风景”,请帮我们随手点赞、转发。书不尽言!您的鼓励是我们最大的动力。谢谢!】
微信号:shuxuefengjing数学风景,您掌上的数学教师!!!
