十简单相关与简单直线回归分析SimpleLinearRegressionand课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《十简单相关与简单直线回归分析SimpleLinearRegressionand课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简单 相关 直线 回归 分析 SimpleLinearRegressionand 课件
- 资源描述:
-
1、2023/2/3Jen-pei Liu,PhD1十一、簡單相關與簡單直線回歸分析十一、簡單相關與簡單直線回歸分析(Simple Correlations and Simple Linear Regression)(Chapter 11)劉仁沛教授國立台灣大學農藝學研究所生物統計組國立台灣大學流行病學與預防醫學研究所國家衛生研究院生物統計與生物資訊組jpliuntu.edu.tw【本著作除另有註明,網站之內容皆採用創用CC姓名標示-非商業使用-相同方式分享3.0台灣授權條款釋出】2023/2/3Jen-pei Liu,PhD2l例1:氮肥用量與水稻穀收量表(公斤)氮肥用量x00.51.01.52
2、.02.5稻穀收量y101832485562l例2:成人年齡與血液中膽固醇的量年齡x343944464851膽固醇y(mg/ml)141.4180.5178.4212.0203.2224.1年齡x53661656667膽固醇y(mg/ml)186.0350.0286.3287.6330.3371.3l例3:年雨量與小麥產量年雨量(公厘/20)23.5 20.4 22.8 25.9 28.9 27.1 26.8 25.2產量(公斤/100)20.4 23.0 33.5 35.8 44.6 41.2 45.4 39.02023/2/3Jen-pei Liu,PhD3氮肥用量與稻穀收量的氮肥用量與稻
3、穀收量的Scatter Plot2023/2/3Jen-pei Liu,PhD4年齡與膽固醇量的年齡與膽固醇量的Scatter Plot(mg/ml)2023/2/3Jen-pei Liu,PhD5年雨量與小麥產量的年雨量與小麥產量的Scatter Plot(公斤/100)2023/2/3Jen-pei Liu,PhD6探討兩個變數之間的關係探討兩個變數之間的關係l問題:兩個變數間是否存在直線關係?將直線關係以方程式表示 資料型態(xi,yi)2023/2/3Jen-pei Liu,PhD7探討兩個變數之間的關係探討兩個變數之間的關係l假定(Assumptions)1.每對資料均為獨立2.常態
4、3.相同變方4.X與Y的關係為直線2023/2/3Jen-pei Liu,PhD8l簡單相關係數(Simple correlation coefficient)l簡單直線回歸(Simple Linear Regression)l模式建立之推論(Models and Inference)l回歸模式直線性檢定(Evaluation of Linearity)l假定之確認(Checking the Model Assumptions)2023/2/3Jen-pei Liu,PhD9yyyy(a)0 正相關(b)落在第及象限的點數l負相關負相關:落在第及象限的點數 落在第及象限的點數l無相關無相關:落
5、在第及象限的點數=落在第及象限的點數2023/2/3Jen-pei Liu,PhD12族群簡單相關係數族群簡單相關係數:(x1,y1)(xN,yN)NiXiYi=1NN22iXiYi=1i=1(X-)(Y-)=(X-)(Y-),-112023/2/3Jen-pei Liu,PhD13樣品簡單相關係數樣品簡單相關係數樣品資料:(x1,y1),(xn,yn)l乘積和:lX平方和:lY平方和:1111222111222111()()()()()()()()nniinniixyiiiiiininnixxiiiininniyyiiiixySxxyyx ynxSxxxnySyyyn2023/2/3Jen-
6、pei Liu,PhD14樣品簡單相關係數樣品簡單相關係數樣品資料:(x1,y1),(xn,yn)12211()(),()()niixyinnxxyyiiiixx yySrS Sxxyyr 之範圍:-1 r 12023/2/3Jen-pei Liu,PhD15xyr=1xyr=-1(a)完全正相關(b)完全負相關2023/2/3Jen-pei Liu,PhD16(a)不完全正相關(b)不完全負相關xy0 r 1xy-1 r t/2,n-2 拒絕H02023/2/3Jen-pei Liu,PhD19例:雨量與小麥產量例:雨量與小麥產量 n=8,xi=200.5,yi=296.5222222223
7、.525.2(200.5)/851.898834.039.0(296.5)/8368.6188(23.5)(34.0)(25.2)(39.0)(200.5)(296.5)/8129.2688129.26880.9346(51.8988)(368.6188)2820.934611 0.xxyyxyxyxxyySSSSrS SnTrr20.025,606.43693466.3462.447HTt拒絕2023/2/3Jen-pei Liu,PhD20簡單直線回歸簡單直線回歸(Simple Linear Regression)l水稻穀產量期望值E(y)與氮肥用量(x)可以用直線關係描述 E(yi)=0
8、+xi,i=1,6(=n)y i:依變數(Dependent variable)x i:獨立(自)變數(Independent variable)0:截距(Intercept)x=0時y的值:斜率(Slope)x變動一個單位y變動的量但實際觀測值與直線E(y)=0+x有差距原因:環境、實驗誤差、量測誤差及其他原因 yi=0+xi+i,i=1,6(=n)i:誤差(Error)2023/2/3Jen-pei Liu,PhD21The Simple Linear Regression Model(Here 0)xy-interceptOne-unit change in xSlope=Mean va
9、lue of y when x equals x0An observed value of y when x equals x0y00Error termStraight line defined by the equation y x=0+xx0=A specific value of the independent variable x2023/2/3Jen-pei Liu,PhD22假定假定(Assumptions):l獨立性(Independent)l常態性(Normality)l直線關係(Linearity)l相同變方(homogeneity of Variance)無數條直線可描述
10、X與Y的關係選擇直線的方法:最小平方法(Least Squares Method)德國大數學家Gauss發明2023/2/3Jen-pei Liu,PhD23yixi9.6822.11yxe1e2e3e4e6e5圖11.4 回歸直線與殘差圖2023/2/3Jen-pei Liu,PhD24最小平方法最小平方法02020i=10(Residual):=()=F=()iiiiniiyxyxyx殘差觀測值與迴歸直線垂直距離垂直距離平方 殘差平方垂直距離平方和 殘差平方和最小平方法觀測值與迴歸直線垂直距離平方和為最小之斜率與截距 對及 進行偏微分2023/2/3Jen-pei Liu,PhD250i0
11、0iF=-2(y)0F=-2(y)0iiixx x正常方程式正常方程式(Normal Equations)(Normal Equations)020iiiiiinxyxxx y2023/2/3Jen-pei Liu,PhD262000()()()()1iixyixxioiiiiiixxyySbxxSbybxybbxyyybbxin斜率估算值截距估算值預測直線回歸方程式(Predicted Linear Regression Equations)殘差估算值 為當獨立之變數為xi時,依變數之最小平方預測平均值iy2023/2/3Jen-pei Liu,PhD27計算推測直線回歸方程式計算推測直線回
12、歸方程式l所需統計值222222221252.8333240.925343967(12)(52.8333)1337.6667(34)(141.4)(39)(180.5)(67)(311.3)(12)(52.8333)(240.925)7558.15141.4180.5311.3(12)(240.925)52100.7825/75xxxyyyxyxxnxySSSbSS058.1500/1337.66675.65025240.925(5.65025)(52.8333)57.596357.5963 5.65025byxxxxyyyn x y SSS例:成人年齡與血液膽固醇含量例:成人年齡與血液膽固醇
展开阅读全文