回归分析regressionanalysis课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《回归分析regressionanalysis课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 regressionanalysis 课件
- 资源描述:
-
1、第 14 章簡單線性迴歸和相關分析迴歸分析迴歸分析迴歸分析(regression analysis)是以其他變數為基礎預測另一個變數的值。這這個方法可能是最被廣泛應用的統計程序。此方法包括推導一個數學方程式或模式,以描述想要預測的變數,稱為依變數依變數(dependent variable),以及統計實作人員認為和依變數有關的變數之間的關係。依變數以Y 表達,而有關的變數,稱為獨立變數獨立變數(independent variables),以X1,X2,.,Xk 表示(其中k 是獨立變數的個數)。14.2第14章 簡單線性迴歸和相關分析 第400頁相關分析假如我們只只對關係是否存在存在感興趣,
2、我們採用相關相關分析分析,一個我們已經介紹過的方法。在本章中,我們將呈現決定兩個變數兩個變數間的關係,有時候稱為簡單線性迴歸。描述這些關係的數學方程式也稱做模式模式,分為兩種類型:確定性模式確定性模式(deterministic model)或隨機性模隨機性模式式(probabilistic model)。14.3第14章 簡單線性迴歸和相關分析 第400.402頁模式確定性模式確定性模式(deterministic model):是指一個方程式或方程式集容許我們從獨立變數的數值去決定決定依變數的數值。隨機性模式隨機性模式(probabilistic model):是一種能將隨機隨機性性呈現出
3、來的方法,這對現實生活的應用比較實際。例如,相同大小的所有房屋(以平方呎計)是否都以完全相同的售價賣出?14.4第14章 簡單線性迴歸和相關分析 第402頁模式要產生一個隨機模式,我們從一個確定性模式開始,用以近似近似我們想要的關係模式。接著我們再加一個項,用以衡量確定性元素的隨機誤差。確定性模式:蓋一棟新房子的成本大約是每平方呎$100 而且大部分的土地售價約是$100,000。近似的銷售價格(y)將是:y=$100,000+100 x其中y=銷售價格,x 房屋的大小(以平方呎計)。14.5第14章 簡單線性迴歸和相關分析 第402頁第14章 簡單線性迴歸和相關分析模式房屋大小(依變項)與房
4、屋售價(獨立變項)之間關係的模式如下:14.6房屋大小房屋售價大部分的土地售價為$100,000蓋一棟房子大約是每平方呎$100 房屋售價=100,000+100(房屋大小)這個模式中,房屋售價完全決定於決定於房屋大小。模式然而在現實生活,房屋成本在相同的房屋大小中仍將有所不同:14.7房屋大小房屋售價100K$相同平方呎,但不同價格點(如:裝潢的選擇,改善隔間,土地位置)較低 vs.較高的變異性x房屋售價=100,000+100(大小)+第14章 簡單線性迴歸和相關誤差變數我們將使用隨機性模型表示房屋估計可賣的價格:y=100,000+100 x+其中 (希臘字母epsilon)表示隨機項又
5、稱誤差變數誤差變數(error variable)實際實際銷售價格和依據房屋大小來估計估計的價格之間的差異。甚至當 x 維持不變時,的值也將會隨著一筆筆不同的銷售而改變。14.8第14章 簡單線性迴歸和相關分析 第402頁簡單線性迴歸模型含一個獨立變數的直線模型稱為一階線性模型一階線性模型(first-order linear model)有時也稱為簡單線性迴歸模簡單線性迴歸模型型(simple linear regression model)。14.9誤差變數依變數獨立變數y-軸截距直線斜率第14章 簡單線性迴歸和相關分析 第402頁01yx第14章 簡單線性迴歸和相關分析簡單線性迴歸模型注
6、意係數 0 和 1是母體參數母體參數,它們幾乎都是未知的。因此,由資料估計估計而得。14.10yx長高=斜率(=高/長)=y-軸截距xy1010迴歸係數的估計如同我們以 為基礎估計的方式,我們以b0 估計 0 且以 b1 估計 1,最小平方最小平方或迴歸線迴歸線的y-軸截距及斜率如下:(回想:這是最小平法的應用且產生一條點與線間差異平方和最小的最小的直線。)14.11第14章 簡單線性迴歸和相關分析 第403頁xbby10 x範例14.1 年度紅利與服務年數 Xm16-016 位員工的年度紅利(以$l,000計)與其服務年數被記錄並列出如下。我們想要決定年度紅利與服務年數之間的直線關係。14.
7、12第14章 簡單線性迴歸和相關分析 第405頁第14章 簡單線性迴歸和相關分析 第406頁 圖14.1最小平方線14.13範例14.2 二手Toyota Camry 的哩程表讀數與價格,第一部分北美的汽車經銷商使用藍皮書以協助他們決定,當他們的顧客於購買新車時,所換購的二手車的價值。這本每月出版的藍皮書列出所有基本車款的換購價值。根據不同的汽車狀況與選用配備,藍皮書提供每一種車款各種不同的價值。而汽車價值的決定是根據最近二手車拍賣會中的平均成交價,以及許多二手車經銷商所提供的資源。14.14第14章 簡單線性迴歸和相關分析 第407頁範例14.2 二手Toyota Camry 的哩程表讀數與
8、價格,第一部分但是,藍皮書並沒有指出依據哩程表讀數所決定的價值,儘管事實上對二手車買主而言,一部車已經被開過多少哩是一個關鍵的因素。為了檢視這項議題,一位二手車經銷商隨機選取100 輛在上個月拍賣會中售出的車齡 3 年的Toyota Camry。這位經銷商紀錄價格(以$1,000計)與哩程表上的哩程數(以千計)。Xm16-02這位經銷商想找出迴歸線。第14章 簡單線性迴歸和相關分析 第407頁14.15第14章 簡單線性迴歸和相關分析 第409頁範例14.2 二手Toyota Camry 的哩程表讀數與價格,第一部分 14.16為我們計算出許多好的統計量,但是現在我們只對這項感興趣 0117.
9、250.0669ybb xx範例14.2 二手Toyota Camry 的哩程表讀數與價格,第一部分斜率係數b1 是.0669,其意義是哩程表上每增加1 哩,價格平均會降低$.0669 或6.69 美分。截距是 b0 17.250。意思是當 x 0(亦即,車完全沒有被開過),汽車售價為$17,250。然而我們的樣本並沒有任何哩程表讀數為少於19,100哩的汽車。這不是正確的估計。14.17詮釋詮釋第14章 簡單線性迴歸和相關分析 第410頁0117.250.0669ybb xx誤差變數的必要條件為了使這些方法有效,以下四個與誤差變數()之機率分配有關的條件必須被滿足。1.的機率分配為常態。2.
10、機率分配的平均數為 0;也就是,E()0。3.的標準差為,無論 x 的值為何,它是一個常數。4.與任何特定 y 值相關的 值與任何其他 y 值相關的 值是獨立的。14.18第16章 簡單線性迴歸和相關分析 第412頁評估模型最小平方法產生一條最佳的直線。但是,事實上有可能兩個變數之間沒有關係,或有非線性關係。有數個方法可以被用來評估模式。在本節中,我們呈現兩個統計量和一個檢定程序,以決定線性模式是否應該被採用。它們是估計值的標準誤估計值的標準誤(standard error of estimate)、斜率的t-檢定,和判定係數(coefficient of determination)。這些方
11、法都是立基於誤差的平方和。14.19第14章 簡單線性迴歸和相關分析 第414頁誤差平方和誤差平方和計算如下:其中 是依變數的樣本變異數。且使用在估計標準誤(standard error of estimate)的計算上:若s 為 0,所有的點都落在迴歸線上。14.2022212)1()(SSExxyyniiisssnyy第14章 簡單線性迴歸和相關分析 第415頁2SSEns2ys估計標準誤若 很小,適配是優良的,且線性模型可以用於預測。若 很大,模型是不良的16.21但什麼是小小?什麼是大大呢?第14章 簡單線性迴歸和相關範例14.3 二手Toyota Camry 的哩程表讀數與價格,第二
12、部分 對範例14.2 求出估計標準誤並且敘述它告訴你什麼有關模式配適度的訊息。14.22第14章 簡單線性迴歸和相關分析 第416頁範例14.3 二手Toyota Camry 的哩程表讀數與價格,第二部分 為了計算估計的標準誤,我們必須計算 SSE,它是由樣本變異數與共變異數計算而得。我們已經算出共變異數與 x 的變異數。它們分別是 2.909 與43.509。y 的樣本變異數(應用簡易計算方法)是14.23第14章 簡單線性迴歸和相關分析 第416頁2122122222111(1,481.1)22,055.23100 1100 .300SSE(1)2.909 (100 1).30043.50
13、9 10.445niniyiixyyxysynnsnss範例14.3 二手Toyota Camry 的哩程表讀數與價格,第二部分 估計的標準誤如下:14.24第14章 簡單線性迴歸和相關分析 第416頁3265.98445.102SSEns範例14.3 二手Toyota Camry 的哩程表讀數與價格,第二部分我們藉由比較 s 與依變數 的樣本平均數,以判斷s 數值的大小。在此範例中,s=.3265 且 =14.841所以它確實顯示估計標準誤的數值是小的,因此車子價格的線性迴歸模型如同哩程表的函數是良好的。14.25第14章 簡單線性迴歸和相關分析 第417頁yy檢定斜率若兩個變數間不存在線性
14、關係,我們將預估迴歸線是一條水平線水平線,斜率為斜率為 0。我們考慮是否有線性關係,如:我們考慮斜率(1)是否為零以外的數值。我們的研究假設變成:H1:1 0因此,虛無假設變成:H0:1=016.26第14章 簡單線性迴歸和相關分析 第417-418頁檢定斜率我們可以執行這個檢定統計量以測試我們的假設:是b1的標準誤,解釋為:假設誤差變項()是常態分布,檢定統計量是自由度為 n 2的學生t 分配。拒絕域的決定是根據我們是進行一項單尾或雙尾的檢定(雙尾檢定最為典型)。14.27第14章 簡單線性迴歸和相關分析 第418頁1bs111bsbt2)1(1xbsnss範例14.4 哩程表讀數與二手To
15、yota Camry 的價格是否相關?檢定以決定在範例14.2 中是否有充分證據去推論對所有3 年車齡的Toyota Camry 而言,拍賣價格與哩程表讀數之間存有線性關係。使用5%的顯著水準。14.28第14章 簡單線性迴歸和相關分析 第419頁範例14.4 哩程表讀數與二手Toyota Camry 的價格是否相關?我們檢定這些假設H1:1 0H0:1 =0(如果虛無假設為真,表示沒有線性關係存在。)拒絕域為:14.29第14章 簡單線性迴歸和相關分析 第419頁/2,.025,98/2,.025,981.984 1.984tttttt 或範例14.4 哩程表讀數與二手Toyota Camr
展开阅读全文