书签 分享 收藏 举报 版权申诉 / 53
上传文档赚钱

类型统计学一元线性回归课后习题答案教学课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4290793
  • 上传时间:2022-11-26
  • 格式:PPT
  • 页数:53
  • 大小:498.32KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《统计学一元线性回归课后习题答案教学课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    统计学 一元 线性 回归 课后 习题 答案 教学 课件
    资源描述:

    1、一元线性回归课后习题讲解一元线性回归课后习题讲解-第九组第九组111.1 从某一行业中随机抽取从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:家企业,所得产量与生产费用的数据如下:企业编号产量(台)生产费用140130242150350155455140565150678154784165810017091161671012518011130175121401852产量和费用存在正的线性相关系数(1)绘制产量与生产费用的散点图,判断二者之间的关系形态。)绘制产量与生产费用的散点图,判断二者之间的关系形态。3r=0.92022222 yynxxnyxxynr222222212(40

    2、*130 42*150.140*185)(40 42.140)*(130 150.185)12*(4042.140)20 16 2212*(130 150.185)(130 150.185)r 2)计算产量与生产费用之间的线性相关系数。)计算产量与生产费用之间的线性相关系数。42、计算检验的统计量)2(122ntrnrt21220.92027.4354531 0.9202t(3)对相关系数的显著性进行检验()对相关系数的显著性进行检验(),并说明二者之并说明二者之间的关系强度。间的关系强度。511.2 学生在期末考试之前用于复习的时间(单位:小时)和考学生在期末考试之前用于复习的时间(单位:小

    3、时)和考试分数(单位:分)之间是否有关系?为研究这一问题,一位试分数(单位:分)之间是否有关系?为研究这一问题,一位研究者抽取了由研究者抽取了由8名学生构成的一个随机样本,取得的数据如名学生构成的一个随机样本,取得的数据如下:下:复习复习时间时间X X20201616343423232727323218182222考试考试分数分数Y Y646461618484707088889292727277776复习时间和考试分数存在正的线性相关关系复习时间和考试分数存在正的线性相关关系复习时间和考试分数存在正的线性相关关系要求:(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。7r=0.86

    4、212222 yynxxnyxxynr(2)计算相关系数,说明两个变量之间的关系强度。)计算相关系数,说明两个变量之间的关系强度。222222228(20*64 16*61.22*77)(20 16.22)*(6461.77)8*(2016.22)20 16.228*(6461.77)(6461.77)r811.3、根据一组数据建立的线性回归方程、根据一组数据建立的线性回归方程 要求:要求:1)解释截距)解释截距 的意义。的意义。1)解释斜率)解释斜率 的意义。的意义。2)当)当=6时的时的E(y)1)表示在没有自变量)表示在没有自变量X的影响时其他各种因素对因变的影响时其他各种因素对因变量量

    5、Y的影响为的影响为102)斜率的意义在于:自变量)斜率的意义在于:自变量X变化对变化对Y影响程度。回影响程度。回归方程中,当归方程中,当x增加一个单位时增加一个单位时,y将减少将减少0.5个单位。个单位。3)x=6时,代入方程,则,时,代入方程,则,y=10-0.5 6=7100.5yx10911.4 设SSR=36,SSE=4,n=18要求:1)计算判定系数R2并解释其意义回归直线对观测值的拟合程度为回归直线对观测值的拟合程度为0.9,说明变量,说明变量Y的的变异性中有变异性中有90%是由自变量是由自变量x引起的。引起的。2)计算估计标准误差 并解释其意义es2140.5218216niii

    6、eyySSEsn2360.940SSRSSRRSSTSSTSSE表示实际值与估计值之间的差异程度是表示实际值与估计值之间的差异程度是0.51011.5一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,他抽出了公司最近10个卡车的运货记录的随机样本,得到运送距离(单位:km)和运送时间(单位:天)的数据如下表:运送距离x825215107055048092013503256701215运送时间y3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态(2)计算线性相关系数,说明两个变量之间的关系强度

    7、。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。11根据图表显示,二者可能存在正线性相关关系(1)绘制运送距离和运送时间的散点图,判断二者之间的关系形态绘制运送距离和运送时间的散点图,判断二者之间的关系形态12x与y的简单相关系数是0.9489,两变量之间呈现高度正相关关系 运送距离运送距离x x运送时间运送时间y y运送距离运送距离x x1 1运送时间运送时间y y0.948940.948941 1(2)计算线性相关系数,说明两个变量之间的关系强度计算线性相关系数,说明两个变量之间的关系强度13最小二乘估计:y=0+1 xxyxxnyxyxnniniiiniiniinii

    8、i1012121111将表中数据代入公式得:=0.118129=0.003585 y=0.118129+0.003585x(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。y关于x的回归方程为y=0.118129+0.003585x表示运输距离每增加1公里,运送时间平均增加 0.003585天。14 11.6 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据:地区 人均GDP(元)人均消费水平(元)北京 辽宁 上海 江西 河南 贵州 陕西 22 460 11 226 34 547 4 851

    9、 5 444 2 662 4 549 7 326 4 490 11 546 2 396 2 208 1 608 2 03515要求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。产量和生产费用之间存在着正的线性相关关系16(2)计算两个变量之间的线性相关系数,说明两个变量之计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。间的关系强度。2222yynxxnyxxynr227*651007421 27101240510.9981237*1904918867857397*134690076631609说明两个变量之间高度相关说明两个变量之间高度相关

    10、 17(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。xyxxnyxyxnniniiiniiniiniii101212111104515.5714290.308683*12248.428127*651007421 2710124051=0.3086837*190491886785739=734.6928回归系数的含义:人均回归系数的含义:人均GDP每增加每增加1元,元,人均消费增加人均消费增加0.309元。元。18(4)计算判定系数,并解释其意义。niiniiniiniiyyyyyyyySSTSSRR1212121221人均人均GDP对人均消费的影响达到对人均消费的影响达到9

    11、9.6%。81444968.68=0.996381750763.7119(5)检验回归方程线性关系的显著性(a=0.05)。181444968.68 11331.6921(2)305795.03(72)SSRFSSE n20y=734.6928+0.308683 xy=734.6928+0.308683*5000=2278.1078 (6)如果某地区的人均GDP为5 000元,预测其人均消费水平。某地区的人均某地区的人均GDP为为5 000元,预测其人均消费元,预测其人均消费水平为水平为2278.1078元。元。21(7)求人均GDP为5 000元时,人均消费水平95的置信区间和预测区间。21

    12、305795.034361159.007225niiieyySSEsnnniiexxxxnsnty1220201)2(250004515.571412278.10782.5706*61159.007713625127.29人均GDP为5 000元时,人均消费水平95的置信区间为1990.74915,2565.46399 1990.74915t=2.201,拒绝,拒绝H0,回归,回归系数显著系数显著11(8)tts3)检验回归系数的显著性()检验回归系数的显著性(a=0.05)=2.20127213035.96519.449228niiieyySSEsnn208 02211(8)1 0eniix

    13、xytsxx037.66()70.619E y计算得计算得4)如果航班正点率为80%,估计顾客投诉次数8 0=4 2 9.8 9 7-4.7*8 0=5 4.2y5)求航班正点率为80%,顾客投诉次数95%的置信区间和预测区间28213035.96519.449228niiieyySSEsnn20802211(8)110eniixxytsxx07.572()100.707E y计算得计算得2911.8 下面是20个城市写字楼出租率和每平方米月租金的数据。设月租金为自变量,出租率为因变量,用excel进行回归,并对结果进行解释和分析。地区编号地区编号出租率(出租率(%)每平方米月租金(元)每平方

    14、米月租金(元)170.699269.874373.483467.170570.184668.765763.467873.5105971.4951080.71071171.2861262861378.71061469.5701568.7811669.5751767.78230回归统计Multiple R0.79508R Square0.632151Adjusted R Square0.611715标准误差8.568399观测值20方差析dfSSMSFSignificance F回归分析12271.0362271.03630.933182.8E-05残差181321.51473.41746 总计1

    15、93592.55 31CoefCoefficificientsents标准标准误差误差t t StatStatP-P-valuvalue eLoweLower r 95%95%UppeUpper r 95%95%下限下限 95.095.0%上限上限 95.095.0%InterceInterceptpt-94.294.249849832.032.079477947-2.932.938018010.000.0087928792-161.161.646646-26.826.8534534-161.161.646646-26.826.8534534X X VariablVariable 1e 12.

    16、532.53649264920.450.45605960595.565.56176117612.8E2.8E-05-051.571.57834783473.493.49463746371.571.57834783473.493.49463746373211.9 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果:方差分析表变差来源dfSSMSFSignificanceF回归2.17E09残差40158.07总计111642866.67参数估计表参数估计表Coefficients 标准误差tStatPvalueIntercept363.6

    17、89162.455295.8231910.000168XVariable11.4202110.07109119.977492.17E0933 (1)完成上面的方差分析表。变差来源dfSSMSFSignificanceF回归11602708.61602708.6399.10000652.17E09残差1040158.074015.807总计111642866.67SSR=SST-SSE=1642866.67-40158.07=1602708.6MSR=SSR/1=1602708.6MSE=SSE/10=4015.807F=MSR/MSE=399.100006534 (2)汽车销售量的变差中有多少

    18、是由于广告费用的变动引起的?汽车销售量的变差中有97.56%是由于广告费用的变动引起的 2SSR1602708.6R=0.9756SST1642866.67(3)销售量与广告费用之间的相关系数是多少?2r=R0.987735(4)写出估计的回归方程并解释回归系数的实际意义。=363.6891+1.420211*yx回归系数的意义:广告费用每增加一个单位,回归系数的意义:广告费用每增加一个单位,汽车销量就增加汽车销量就增加1.42个单位。个单位。(5)检验线性关系的显著性(a0.05)。p=2.17E09,显著。3611.10根据下面的数据建立回归方程,计算残差,判定R2,估计标准误差se,并分

    19、析回归方程的拟合程度。=13.6254+2.30293*yx372i1y=43.53094niiSSEy残差残差2143.53094=3.809241223niiieyySSEsnn估计标准误差估计标准误差se38本题判定系数R2=0.937348,可以看出拟合程度好。21212694.8651.2691651.26910.937348694.8niiniiSSTyySSRyySSRRSST判定判定R23911.11 从20的样本中得到的有关回归结果是:SSR=60,SSE=40。要检验x与y之间的线性关系是否显著,即检验假设:01:0H。(1)线性关系检验的统计量F值是多少?12SSRSSE

    20、n6014018解:(1)SSR的自由度为1;SSE的自由度为n-2=18;F=27 (2)给定显著性水平a0.05,Fa是多少?1,18F0.051,18F=4.41(3)是拒绝原假设还是不拒绝原假设?拒绝原假设,线性关系显著。40 (4)假定x与y之间是负相关,计算相关系数r SSRSSRSSE0.6r=0.7746 由于是负相关,因此r=-0.7746(5)检验x与y之间的线性关系是否显著?从F检验看线性关系显著。F=271,18F=4.41 4111.12从n=20的样本中得到的有关回归结果是:y=5+3x,=1 =2,es要求1)当x=4时,构建y的平均值的95%的置信区间x21()

    21、=20niiXXniiexxxxnsnty1220201)2(020.025x=4=5+12=17(2)=(18)=2.1009ytnt当时,2421172.1009*1*=17 1.050452020置信区间 15.94955,18.05045422)当x=4时,构建y的平均值的95%的预测区间020.025x=4=5+12=17(2)=(18)=2.1009ytnt当时,2002211(2)1+eniixxytnsnxx2421172.1009*1*1=172.34892020预测区间 14.6511,19.348943 11.13 一家公司拥有多家子公司,公司的管理者一家公司拥有多家子公

    22、司,公司的管理者想通过广告支出来估计销售收入,为此抽取了想通过广告支出来估计销售收入,为此抽取了8家家子公司,得到广告支出和销售收入的数据如下子公司,得到广告支出和销售收入的数据如下(单位:万元)(单位:万元)广告支出X12.5 3.721.6 6037.6 6.116.8 41.2销售收入Y1485533899454189126379建立线性回归模型,当建立线性回归模型,当x=40万元时,构建销售收入万元时,构建销售收入95%的置信区间的置信区间。4445y0=-46.2918+15.23977x当x=40万元时 E(y0)=-46.2918+15.23977*40=563.299t/2=t

    23、0.025(6)=2.4469217 0 9 0 9.2=1 0 8.7 5 7 5226niiieyyS S Esnnniiexxxxnsnty1220201)2(2214 02 4.9 3 7 515 6 3.2 9 92.4 4 6 9*1 0 8.7 5 7 51 02 4.9 3 7 5niix=563.299 121.74置信区间为置信区间为441.559,685.0394611.14从两个回归分析中得到的残差如下:绘制残差图,你会得出什么结论。47回归回归1:观察图像可以看出,残差值基本上集中在两条平行线之间,表明对于所有值,方差都相同,所以认定其假定描述变量x和y之间关系的回归

    24、模型是合理的。48回归回归2:对于不同的x值残差相差也较大,且其残差值基本上集中在两条曲线之间,这就意味着其违背了方差相等的,表明所选择的回归模型不合理,应该考虑曲线回归或多元回归。4911.15 随机抽取7家超市,得到其广告费支出和销售额数据如下:11.15 随机抽取7家超市,得到其广告费支出和销售额数据如下:超市 广告费支出(万元)销售额(万元)A B C D E F G l 2 4 6 10 14 20 19 32 44 40 52 53 5450解:(1)(1)用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。CoeCoeffifficiecientsnts标标准准误误差差

    25、t t StaStat tP-P-valvalueueLowLower er 95%95%UppUpper er 95%95%下下限限 95.95.0%0%上上限限 95.95.0%0%InterInterceptcept29.29.39939911114.84.807207253536.16.115515573730.00.0016016959517.17.041041676741.41.756756555517.17.041041676741.41.7567565555X X VariaVariable 1ble 11.51.547447478780.40.463463499993.33.

    26、338638688880.00.020520582820.30.356056016162.72.738938939390.30.356056016162.72.73893893939=29.399+1.54748*yx51(2)回归直线的F检验:显著。(2)检验广告费支出与销售额之间的线性关系是否显著(a0.05)。方差分析dfSSMSFSignificance F回归分析1691.7226691.722611.146840.020582残差5310.277462.05549总计61002 Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95

    27、.0%上限 95.0%Intercept29.399114.8072536.1155730.00169517.0416741.7565517.0416741.75655X Variable 11.5474780.4634993.3386880.0205820.3560162.7389390.3560162.738939aF=6.60811.14684F广告费支出与销售额之间的线性关系显著广告费支出与销售额之间的线性关系显著52显著。回归系数的t检验:(3)绘制关于绘制关于x的残差图,你觉得关于误差项的残差图,你觉得关于误差项的假定被满足了吗的假定被满足了吗?3).大约有大约有95%的标准化残差在的标准化残差在-22之间表明之间表明误差项假定的条件成立。从图中可以看出不误差项假定的条件成立。从图中可以看出不满足这个条件,所以关于误差项的假定没有满足这个条件,所以关于误差项的假定没有被满足。被满足。(4)你是选用这个模型,还是另寻找一个更好的模型你是选用这个模型,还是另寻找一个更好的模型?4).可考虑选用非线性模型可考虑选用非线性模型53

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:统计学一元线性回归课后习题答案教学课件.ppt
    链接地址:https://www.163wenku.com/p-4290793.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库