Part-4-高等统计与理论课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《Part-4-高等统计与理论课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Part 高等 统计 理论 课件
- 资源描述:
-
1、Part 4 高等統計與理論1閱讀範圍l邱皓政著 量化研究與統計分析Chapter 13 線性關係的分析迴歸Chapter 14 項目分析與信度估計 Chapter 15 因素分析l陳景堂著 統計分析SPSS for Windows入門與應用 簡單線性迴歸分析模型迴歸分析應用問卷實例解說與信度分析因素分析21.線性關係的分析:迴歸 Regression3 線性關係的分析原理l基本條件:連續變項之間的關係l線性關係 linear relationship,指兩個變項的關係可以被一條最具代表性的直線來表達之時,所存在的關連情形。l該直線之方程式為Y=bx+a,b為斜率(即y/x,每單位的X變動時,
2、在Y軸上所變動的量)l線性關係可以散佈圖的方式來表現 身高190180170160150體重9080706050404線性關係與相關l線性關係的描述與運用相關分析的目的在描述兩個連續變數的線性關係的強度與方向(僅能說明兩變項之間具有一定程度之關聯,但無法知道兩變項之間的因果與先後關係)迴歸基於兩變項之間的線性關係,進一步分析兩變項之間的預測關係的探討與運用(即取用某獨立變數去預測另一個依變數)。迴歸與相關均以線性關係為基礎,即以兩個連續變項的共變數為基礎,其數學原理相似。l相關係數計算之時,同時考慮兩個變項的變異情形,屬於對稱性設計,以X Y表示。但迴歸則由於目的在取用某一變項去預測另一變項的
3、變化情形,X、Y兩個變項各有其角色,在迴歸係數的計算中,X、Y變項為不對稱設計,以X Y或Y X表示。5相關與迴歸分析的圖示 X Y cov(x,y)SDx2 X Y SDy2 X Y cov(x,y)SDx2 X Y SDy2 NYYXX)(CovarianceyxxyyxSSSSSPYYXXYYXXssyxr22)()()(),cov(以 X 預測 Y(XY):xyxyaXbY.以 Y 預測 X(YX):yxyxaYbX.6 簡單線性迴歸模型簡單線性迴歸模型是假設依變數 Y 之期望值為自變數 X 之線性函數,即所有 Yi 之期望值均落在一直線上,此稱之為迴歸線性假設(The lineari
4、ty of regresssion)或迴歸共線假設。簡單線性迴歸模型 7迴歸係數將所收集到的資料代入(1)式中,求出截距 a 和斜率 b,即可獲得簡單線性迴歸方程式。n1=i2n1=ii2in1=iin1=iin1=iiixxnyxyxn=ba=ybxnii=1nii=1nXbay(1)簡單線性迴歸方程式:8迴歸係數l迴歸方程式Y=b X+a,代入一個X值以預測Y值。lb係數:為一未標準化的迴歸係數,其意義為每單位X值的變動時,Y所變動的原始量b係數大小隨著X與Y兩變項的單位使用,而沒有一定的範圍b係數適用於實務工作的預測數值的計算l係數:如果將b值乘以X變項的標準差再除以Y變項的標準差,即可
5、去除單位的影響,並控制兩個變項的分散情形,得到新的數值(Beta),為不具備特定單位的標準化迴歸係數yxssxyxyb,9迴歸係數l係數:係數也是將X與Y變項所有數值轉換成Z分數(標準常態分配)後,所計算得到的迴歸方程式的斜率,該方程式通過ZX,ZY的零點,因此截距為0係數具有與相關係數相似的性質,也就是介於-1至+1之間,其絕對值越大者,表示預測能力越強,正負向則代表X與Y變項的關係方向。係數適用於變項解釋力的比較,偏向學術用途XYxy,10迴歸係數之檢定(理論的截距和斜率)斜率的檢定虛無假設:(or B1)0對立假設:0 1xxxxSS/-S/S-=T/xxSS/Trp)tT(P0截距的推
6、論檢定虛無假設:(or B0)0對立假設:0 2n1=ixx2inSxS/Tn1=ixx2inSxS/Trp)tT(P011變異數拆解與F考驗 令最佳迴歸預測線為01BXBY在給定一個 值可以獲得一個預測值iYiX令原始配對值為iiieBXBY01其中,為迴歸無法解釋的誤差部份iiiYYe12變異數拆解與F考驗 l利用迴歸方程式,依變項Y變異量當中可以被解釋的部分稱為迴歸變異量(SSreg)l無法被解釋的部分稱為誤差變異量(SSe)變項Y總變異量(SSt)=迴歸預測值變異量(SSreg)+誤差變異量(SSe)迴歸值離均差(迴歸方程式可以解釋的部份)YYj原始離均差=迴歸值離均差+誤差YYj誤差
7、(迴歸方程式無法解釋的部份)jjYY13迴歸可解釋變異量比 l迴歸可解釋變異量比,又稱為R2(R square),表示使用X去預測Y時的預測解釋力,即Y變項被自變項所解釋的比率。反應了由自變項與依變項所形成的線性迴歸模式的契合度(goodness of fit)l又稱為迴歸模型的決定係數(coefficient of determination),R2開方後可得multiple R,為自變項與依變項的多元相關。lR2為0時,表示自變數與依變數之間無線性關係 SSreg SSe +1=SSt SSt =迴歸可解釋變異量比+誤差變異量比=100%tregteSSSSSSSSR1214adjuste
8、d R squarel以樣本統計量推導出來的R2來評估整體模式的解釋力,並進而推論到母群體時,會有高估的傾向 l樣本數越小,越容易高估,解釋力膨脹效果越明顯,樣本數越大,膨脹情形越輕微 l校正後R2(adjusted R2),可以減輕因為樣本估計帶來的R2膨脹效果。當樣本數越小,應採用校正後R2。Adjusted 1/1/1/12NSSpNSSdfSSdfSSRtettee 15判定簡單線性迴歸模型的適合性判定係數若迴歸可解釋變異愈趨近於總變異,則表示依變數的變化能由迴歸模型來解釋,此時表示此迴歸模型極合適。迴歸變異與總變異的比值稱為判定係數,表為 R2,0R21。2tetettreg2SSS
9、S1SSSS-SSSSSSR模型適合性的檢定虛無假設:迴歸模型不適合(解釋能力極低或斜率為零 or R2=0)對立假設:迴歸模型適合(解釋能力高或斜率不為零)1)1kn,k(FMSEMSR=Frp)fF(P016變異來源平方和自由度(Degree of Freedom)均方(Mean Square)F-值迴歸效果SSregkMSreg=SSreg/k F=MSreg/MSe 誤差效果SSeN-k-1MSe=SSe/N-k-1 總和SStN-1迴歸分析之變異數分析摘要表17迴歸分析的基本假設(一)固定自變項假設(fixed variable)特定自變數的特定數值應可以被重複獲得,然後得以此一特定
10、的Xi代入方程式而得到預測值。(二)線性關係假設(linear relationship)當X與Y的關係被納入研究之後,迴歸分析必須建立在變項之間具有線性關係的假設成立上。(三)常態性假設(normality)迴歸分析中的所有觀察值Y是一個常態分配,即Y來自於一個呈常態分配的母群體。因此經由迴歸方程式所分離的誤差項e,即由特定Xi所預測得到的與實際Yi之間的差距,也應呈常態分配。誤差項e的平均數為0。18迴歸分析的基本假設(四)誤差獨立性假設(independence)誤差項除了應呈隨機化的常態分配,不同的X所產生的誤差之間應相互獨立,無相關存在,也就是無自我相關(non-autocorrel
11、ation)。(五)誤差等分散性假設(homoscedasticity)特定X水準的誤差項,除了應呈隨機化的常態分配,且誤差項之變異量應相等,稱為誤差等分散性(六)多元共線性假設 自變項間相關程度過高,不但變項之間的概念區隔模糊,難以解釋之外,在數學上會因為自變項間共變過高,造成自變項與依變項共變分析上的扭曲現象,稱為多元共線性(multicollinearnality)19等分散性假設圖示誤差等分散性誤差變異歧異性變異不變變異隨X的改變而改變20簡單迴歸分析操作程序1.輸入資料2.選取分析迴歸方法線性3.選擇欲分析的兩個變項(為自變數X,另一個為依變數Y),移至清單中。4.選擇強迫進入變數法
12、作為變項分析方法5.進入統計量勾選各種統計量再按繼續6.進入統計圖勾選各種統計圖再按繼續7.進入選項勾選各種選項再按繼續8.按確定執行21簡單迴歸分析範例l某研究所10名學生修習某門課程之期中考與期末考分數如下表,試問該教授是否可以以期中考成績來預測期末考成績?簡單迴歸分析範例num12345678910期中考78809090708882746585期末考8483899078898784788022相相 關關1.000.822.8221.000.002.002.10101010期末考成績期中考成績期末考成績期中考成績期末考成績期中考成績Pearson 相關顯著性(單尾)個數期末考成績 期中考成
13、績敘敘 述述 統統 計計84.204.521080.208.5510期末考成績期中考成績平均數標準差 個數簡單迴歸分析範例輸出結果(1)敘述統計各變項的敘述統計量各變項之平均數標準差與個數相關矩陣各變項之間的相關矩陣,期中考與期末考的Pearson相關係數達0.822,達顯著水準又p-value=0.0020.05,Reject H0:B1=0,代表期中考與期末考成績存在線性關係23模模 式式 摘摘 要要b b.822a.676.6352.73.67616.66018.004模式1RR 平方調過後的R 平方 估計的標準誤R 平方改變量F 改變 分子自由度 分母自由度顯著性 F 改變變更統計量預
14、測變數:(常數),期中考成績a.依變數:期末考成績b.簡單迴歸分析範例輸出結果(2)模式摘要自變數(期中考成績)對依變數(期末考成績)的整體解釋力由R平方解釋期中考成績可以解釋依變項(期末考成績)67.6%的變異。調整後的R平方為63.5%24係係 數數a a49.3698.5775.756.000.434.106.8224.082.004(常數)期中考成績模式1B 之估計值標準誤未標準化係數Beta 分配標準化係數t顯著性依變數:期末考成績a.簡單迴歸分析範例輸出結果(3)369.49434.0)()()(01XBXBY期中考成績期末考成績原始回歸模式之估計值0BB1,B0與Beta值均達顯
15、著水準,故期中考成績與期末考成績的線性關係存在之估計值1BXXBetaY822.0)(*)()(期中考成績期末考成績標準化迴歸模式之估計值Beta25簡單迴歸分析範例輸出結果【結果說明】以(期中考成績)預測(期末考成績),為一簡單迴歸分析。基於相同數學原理,簡單迴歸與相關分析之結果相同。Pearson相關係數,Multiple R與Beta皆為0.822,這些係數之檢定值均相同,達顯著水準。R2的數據則提供迴歸變異數的比重,顯示以期中考成績預測期末考成績具有63.5%的解釋力,F-value=16.66,p=0.004,顯示該解釋力具有統計的意義。結果指出:期中考成績能夠有效預測期末考成績,B
16、eta係數達0.822,(t=4.082,p=0.004),表示期中考成績越高,則期末考成績越好。26多元迴歸分析操作程序1.輸入資料2.選取分析迴歸方法線性3.選擇欲分析的兩個變項(為自變數X,另一個為依變數Y),移至清單中。4.選擇強迫進入變數法或可選用其他選入模式,如逐步迴歸法作為變項分析方法5.進入統計量勾選各種統計量再按繼續6.進入統計圖勾選各種統計圖再按繼續7.進入選項勾選條件與遺漏值處理模式按繼續8.按確定執行27多元迴歸分析範例l同前一個期中考預測期末考之應用。今老師若以缺席、期中考與期末考分數、作業成績,進行學生學期總分評分工作,試說明這些變項對於學期總分的影響?多元迴歸分析
17、範例num12345678910性別男男女男女男男女女男缺席次數(X1)2100521101作業分數(X2)80859085758080758085期中考(X3)78809090708882746585期末考(X4)84838990788987847880學期總分8082899570878582808428敘敘 述述 統統 計計83.406.57101.40.52101.301.491081.504.741080.208.551084.204.5210學期總分性別缺席次數作業分數期中考成績期末考成績平均數 標準差個數選選 入入/刪刪 除除 的的 變變 數數b b期末考成績,性別,缺席次數,作業
18、分數,期中考成績a.選入模式1選入的變數刪除的變數方法所有要求的變數已輸入。a.依變數:學期總分b.多元迴歸分析範例輸出結果(1)(強迫進入法)敘述統計各變項的敘述統計量各變項之平均數標準差與個數選入/刪除的變數顯示回歸分析的自變項清單計有五個自變項被納入分析29模模 式式 摘摘 要要b b.977a.954.8962.12.95416.52254.009模式1RR 平方調過後的R 平方 估計的標準誤 R 平方改變量 F 改變分子自由度分母自由度 顯著性 F 改變變更統計量Durbin-Watson 檢定預測變數:(常數),期末考成績,性別,缺席次數,作業分數,期中考成績a.依變數:學期總分b
19、.多元迴歸分析範例輸出結果(1)(強迫進入法)模式摘要顯示自變數對依變數之整體解釋力。所有自變數可以解釋依變數(學期總分)95.4%的變異。調整後的R平方為89.6%。因為小樣本,宜採用調整後的R平方。30變異數分析變異數分析b b370.462574.09216.522.009a17.93844.484388.4009迴歸殘差總和模式1平方和自由度平均平方和F 檢定顯著性預測變數:(常數),期末考成績,性別,缺席次數,作業分數,期中考成績a.依變數:學期總分b.多元迴歸分析範例輸出結果(1)(強迫進入法)模式顯著性整體檢定用以檢定整體迴歸模式的顯著性。F檢定值為16.522,p-value=
20、.009,顯示上述89.6%的迴歸解釋力。具有統計上的意義。31係係 數數a a51.62533.3761.547.197-.1631.740-.013-.093.930.6171.621-2.683.735-.610-3.649.022.4132.423-.279.322-.201-.865.436.2144.680.441.265.5741.668.171.09710.266.271.365.186.742.499.1835.450(常數)性別缺席次數作業分數期中考成績期末考成績模式1B 之估計值標準誤未標準化係數Beta 分配標準化係數t顯著性允差VIF共線性統計量依變數:學期總分a.多
21、元迴歸分析範例輸出結果(1)(強迫進入法)之估計值0B之估計值各變項B之估計值Beta係數估計各變項B,Beta值及顯著性檢定。僅缺席次數之B值=-0.610,達顯著(t=-3.649,p=0.022)。說明缺席次數為影響學期總分的顯著變數,且次數越多,學期總分越低32共共 線線 性性 診診 斷斷a a5.3871.000.00.00.00.00.00.00.5073.259.00.00.39.00.00.00.1027.275.00.53.01.00.00.002.785E-0343.982.05.37.03.02.19.001.457E-0360.797.01.01.06.22.01.15
22、1.637E-04 181.422.94.08.51.76.80.85維度123456模式1特徵值 條件指標(常數)GENDERABSENT HOMEWORK MIDEXAM FINEXAM變異數比例依變數:GRADEa.多元迴歸分析範例輸出結果(1)(強迫進入法)共線性檢驗特徵值越小,條件指標越大,顯示模式共線性明顯。偏高的變異比例指出,Homework(0.76),Midexam(0.80)與 Finexam(0.85)之間具有明顯共線性。33相相 關關1.000-.413-.761.656.806.825-.4131.000.115-.272-.549-.372-.761.1151.00
23、0-.619-.344-.405.656-.272-.6191.000.691.425.806-.549-.344.6911.000.822.825-.372-.405.425.8221.000.118.005.020.002.002.118.376.223.050.145.005.376.028.165.123.020.223.028.014.110.002.050.165.014.002.002.145.123.110.002.101010101010101010101010101010101010101010101010101010101010101010101010GRADEGENDE
24、RABSENTHOMEWORKMIDEXAMFINEXAMGRADEGENDERABSENTHOMEWORKMIDEXAMFINEXAMGRADEGENDERABSENTHOMEWORKMIDEXAMFINEXAMPearson 相關顯著性(單尾)個數GRADEGENDERABSENTHOMEWORKMIDEXAMFINEXAM34迴歸 標準化殘差 的常態 P-P 圖依變數:學期總分觀察累積機率1.00.75.50.250.00預期累積機率1.00.75.50.250.00殘殘 差差 統統 計計 量量a a69.0091.8783.406.4210-1.243.13-8.53E-151.411
25、0-2.2441.321.0001.00010-.5861.476.000.66710預測值殘差標準化預測值標準化殘差最小值最大值平均數標準差個數依變數:學期總分a.多元迴歸分析範例輸出結果(1)(強迫進入法)殘差分析用以檢定極端值的存在,以及是否違反常態性假設。殘差的值為觀察值與預測值的差,殘差越大,表誤差越大。標準化後之殘差絕對值若大於1.96,代表偏離值。結果顯示無偏離值,但因樣本太少,殘差非呈現常態分配。35選選 入入/刪刪 除除 的的 變變 數數a a期末考成績.逐步迴歸分析法(準則:F-選入的機率=.100)。缺席次數.逐步迴歸分析法(準則:F-選入的機率=.100)。模式12選入
展开阅读全文