我们身边的统计学(第一讲)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《我们身边的统计学(第一讲)课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 我们 身边 统计学 第一 课件
- 资源描述:
-
1、1我们身边的统计学游家兴厦门大学经济学院计统系2课程内容p以案例为主介绍统计学基本知识;以案例为主介绍统计学基本知识;p运用统计知识观察分析身边的现象。运用统计知识观察分析身边的现象。3课程要求p学会运用统计学知识,观察身边的经济现象或社学会运用统计学知识,观察身边的经济现象或社会现象,搜集相关数据,进行统计分析。会现象,搜集相关数据,进行统计分析。p完成一篇小论文写作。完成一篇小论文写作。4希望你们做到的:p1、遵守课堂纪律;、遵守课堂纪律;p2、按时完成作业;、按时完成作业;p3、有疑问欢迎举手提问;、有疑问欢迎举手提问;p4、对教学方面的建议可写信反映:、对教学方面的建议可写信反映: 5
2、论文写作p观察生活,找出具有因果关系的经济或社会现象,观察生活,找出具有因果关系的经济或社会现象,搜集数据建立回归模型进行分析。搜集数据建立回归模型进行分析。p要求:要求:n(1)主题清晰,论述科学,结论有用;)主题清晰,论述科学,结论有用;n(2)数据真实,样本个数尽可能多;)数据真实,样本个数尽可能多;n(3)论文字数不少于)论文字数不少于2000字;字;n(4)分析至少包括描述统计、相关分析、回归分析)分析至少包括描述统计、相关分析、回归分析n(5)自由组队,)自由组队,1-6人一组;人一组;n(6)第三次课起交。从第四次课起,陆续挑选优秀论)第三次课起交。从第四次课起,陆续挑选优秀论文
3、上台报告,并进行适当加分。文上台报告,并进行适当加分。6论文一般框架p研究背景研究背景p理论分析与研究假设理论分析与研究假设p研究设计研究设计p实证结果实证结果p结论与讨论结论与讨论7引 例p今天,你小资了吗?今天,你小资了吗?n什么是小资?什么是小资?p概念清晰概念清晰p小资一般为小资一般为都市白领都市白领,在社会中有一定的,在社会中有一定的地位地位和和财财富富,又与,又与“中产阶级中产阶级”相差一定距离相差一定距离主要在经主要在经济方面。济方面。n怎样才算小资?怎样才算小资?p评价标准和指标体系评价标准和指标体系p一个真正的一个真正的“小资小资”必须具有必须具有一定的生活品位、思想水准和艺
4、一定的生活品位、思想水准和艺术鉴赏能力术鉴赏能力8【文学】【文学】p海明威、福克纳、马尔克斯、卡夫卡、普鲁斯特、海明威、福克纳、马尔克斯、卡夫卡、普鲁斯特、豪尔赫豪尔赫路易斯路易斯博尔赫斯、卡尔维诺、昆德拉、博尔赫斯、卡尔维诺、昆德拉、村上春树、徐志摩、曹雪芹等。村上春树、徐志摩、曹雪芹等。【音乐】【音乐】p古典音乐、爵士乐、西方流行音乐、电子休闲音古典音乐、爵士乐、西方流行音乐、电子休闲音乐、新世纪音乐、世界音乐、中国传统音乐等。乐、新世纪音乐、世界音乐、中国传统音乐等。【生活情趣】【生活情趣】p咖啡、家居、红酒、茶、笔记本电脑等。咖啡、家居、红酒、茶、笔记本电脑等。9【旅游】【旅游】p丽江
5、、西藏、马尔代夫共和国、欧洲、澳洲等【时装】【时装】p不求最贵,但求自我风格。【外语】【外语】p至少精通英语,通晓日语、法语、德语等更好。要有TOEFL,GRE,雅思等有效分数。【科技】【科技】p懂得充分利用互联网作为工作、生活的工具。10n什么决定小资?什么决定小资?p影响因素分析影响因素分析p收入、学历、性别、工作等等收入、学历、性别、工作等等n我小资了吗?我小资了吗?p建立建立Logistic判别模型判别模型p将自身相关因素代入模型进行判断将自身相关因素代入模型进行判断11怎样将上述问题进行数量分析呢?p第一步,提出问题第一步,提出问题n明确小资的定义(外延与内涵)明确小资的定义(外延与
6、内涵)n建立小资的评价标准(区分真小资与伪小资)建立小资的评价标准(区分真小资与伪小资)p第二步,搜集数据第二步,搜集数据n问卷访问或网上调查或其他方式问卷访问或网上调查或其他方式n一定数量的样本及相关资料一定数量的样本及相关资料n调查内容包括两大部分调查内容包括两大部分:1、评价指标(、评价指标(包括包括生活品位、思想水准和艺术鉴赏能力等等);生活品位、思想水准和艺术鉴赏能力等等);2、个人背景资料。、个人背景资料。12第三步,数据分析与讨论n通过评价指标,区分出真小资(取值为通过评价指标,区分出真小资(取值为1)与)与非小资(取值为非小资(取值为0)n估计回归模型:估计回归模型:n分析哪些
7、因素为关键因素,哪些不是?分析哪些因素为关键因素,哪些不是?n进行预测:将自身因素代入上述模型,比如收进行预测:将自身因素代入上述模型,比如收入水平、教育水平、生活特点等变量。入水平、教育水平、生活特点等变量。01(0,1)niiiLogistic Yx13第一讲 如何获得统计数据p一手资料:一手资料:n通过访问调查获得;通过访问调查获得;n首要问题:问卷设计。首要问题:问卷设计。p二手资料:二手资料:n年鉴资料:年鉴资料:中国统计年鉴中国统计年鉴、中国城市统计年中国城市统计年鉴鉴、中国金融年鉴中国金融年鉴等;等;n相关网站:中国统计局;中国人民银行;国际货币基相关网站:中国统计局;中国人民银
8、行;国际货币基金组织;各地政府部门等;金组织;各地政府部门等;n专业数据库:中经网;专业数据库:中经网;WIND数据库;数据库;CSMAR数据库;数据库;CCER数据库;锐思数据库;聚源数据库。数据库;锐思数据库;聚源数据库。14如何进行问卷设计?1516表头表头主体主体表尾表尾问卷第一问卷第一印象很印象很重要!重要!17调查问卷的设计p在问卷调查中,问卷设计是非常重要的一个环节,在问卷调查中,问卷设计是非常重要的一个环节,它决定了市场调查的成功与否。它决定了市场调查的成功与否。p 1 1、问卷的功能、问卷的功能 n能正确反映调查目的和具体问题,突出重点,能正确反映调查目的和具体问题,突出重点
9、,能使被调查者乐意合作,协助达到调查目的。能使被调查者乐意合作,协助达到调查目的。n能正确记录和反映被调查者回答的事实,提供能正确记录和反映被调查者回答的事实,提供正确的情报。正确的情报。n格式统一的问卷还便于资料的统计和整理。格式统一的问卷还便于资料的统计和整理。182、问卷的组成部分p一份正式的调查问卷一般包括以下三个组成部分:一份正式的调查问卷一般包括以下三个组成部分:p第一部分:前言。主要说明调查的主题、调第一部分:前言。主要说明调查的主题、调查的目的、调查的意义,以及向被调查者表查的目的、调查的意义,以及向被调查者表示感谢。示感谢。p第二部分:正文。这是调查问卷的主体部分,第二部分:
10、正文。这是调查问卷的主体部分,一般设计若干问题要求被调查者回答。一般设计若干问题要求被调查者回答。p第三部分:附录。这一部分可以将被调查者第三部分:附录。这一部分可以将被调查者的有关情况加以登记,为进一步的统计分析的有关情况加以登记,为进一步的统计分析收集资料。收集资料。193、问卷设计中的问题p(1 1)语言不规范。语言的问题很多,但主要还是)语言不规范。语言的问题很多,但主要还是设计者使用语言不规范。在问卷调查中,我们不设计者使用语言不规范。在问卷调查中,我们不能使用学术化语言,也不能用官方语言,我们的能使用学术化语言,也不能用官方语言,我们的语言必须贴近被调查者的生活。语言必须贴近被调查
11、者的生活。p如有这样的问题:如有这样的问题:您家属于以下哪种类型:您家属于以下哪种类型:1 1)核心家庭)核心家庭2 2)单身家庭)单身家庭3 3)联合)联合家庭家庭4 4)主干家庭)主干家庭5 5)其他)其他 p这样的问题就是明显的专业词汇的不合适运这样的问题就是明显的专业词汇的不合适运用。用。20n(2 2)问题带有倾向性。问卷中的问题必须保持)问题带有倾向性。问卷中的问题必须保持中立,不能提问带有倾向性的问题。中立,不能提问带有倾向性的问题。p如:如:动物保护很重要,你认为有进行动物保护的动物保护很重要,你认为有进行动物保护的必要吗?必要吗?1 1)有)有2 2)没有)没有3 3)说不清
12、)说不清p这样的问题是不应该出现在问卷中的。这样的问题是不应该出现在问卷中的。21p(3 3)问题引起回答者的焦虑。)问题引起回答者的焦虑。n如有这样的问题:如有这样的问题:你有没有在自然保护区内狩过猎?你有没有在自然保护区内狩过猎?1 1)有)有2 2)没有)没有 这样的问题容易引起回答者的焦虑,因为大部这样的问题容易引起回答者的焦虑,因为大部分人都知道保护区是不准狩猎的。分人都知道保护区是不准狩猎的。n这个问题可以这样问:这个问题可以这样问:在保护区狩猎是很普遍的事,你的情况是?在保护区狩猎是很普遍的事,你的情况是?22p(4 4)一题多义。一个问题只能提问一个方面的情)一题多义。一个问题
13、只能提问一个方面的情况,否则容易使回答者不知如何作答。况,否则容易使回答者不知如何作答。n如:如:你和你的配偶的文化程度是:你和你的配偶的文化程度是:1 1)小学及以下)小学及以下2 2)初中)初中3 3)高中)高中4 4)大专及以上大专及以上n这个问题就是一个题同时问两个人的情况,是这个问题就是一个题同时问两个人的情况,是让回答者不能回答的。让回答者不能回答的。23p(5 5)问题笼统。这是调查中存在的较多的问题。)问题笼统。这是调查中存在的较多的问题。n如有这样的问题:如有这样的问题:您对吸烟有害健康的了解情况是:您对吸烟有害健康的了解情况是:1 1)很了解)很了解2 2)了解)了解3 3
14、)一般)一般 4 4)不太了解)不太了解5 5)不了解)不了解24n我们对吸烟害处了解程度的衡量应该有一个标我们对吸烟害处了解程度的衡量应该有一个标准,一般的处理方式是用量表,即用相关的多准,一般的处理方式是用量表,即用相关的多个问题来综合测量。个问题来综合测量。n如:如:p你了解什么是二手烟吗?你了解什么是二手烟吗?p吸烟最会容易引起哪种疾病?吸烟最会容易引起哪种疾病?p你了解烟草中对人体危害的化学成分吗?你了解烟草中对人体危害的化学成分吗?25p(6 6)题支设计不合理。这包括设计的答案不穷尽、)题支设计不合理。这包括设计的答案不穷尽、问题相同或处于同一维度等。问题相同或处于同一维度等。n
15、如:如:您家庭收入的主要来源是:您家庭收入的主要来源是:1 1)土地收入)土地收入2 2)打工收入)打工收入n这个问题的答案就是题支没有穷尽,因为还有这个问题的答案就是题支没有穷尽,因为还有比如工作收入、生意收入、股票收入等。比如工作收入、生意收入、股票收入等。264 4、问卷设计的一些技巧、问卷设计的一些技巧p(1 1)问题顺序的排列。问卷的问题不应是杂乱排)问题顺序的排列。问卷的问题不应是杂乱排列的,应该有一定的顺序:列的,应该有一定的顺序:p从易到难:把简单易懂的问题放在前面,把从易到难:把简单易懂的问题放在前面,把复杂的问题放在后面,这样容易得到被调查复杂的问题放在后面,这样容易得到被
16、调查者的配合,使被调查者感到问题好回答;者的配合,使被调查者感到问题好回答;p从一般性到特殊性:一般性问题放在前面,从一般性到特殊性:一般性问题放在前面,特殊性问题放在后面;特殊性问题放在后面;p从感性到理性:先问行为方面的问题,再问从感性到理性:先问行为方面的问题,再问态度、观念性问题;态度、观念性问题;27p此外,此外,把能引起被调查者兴趣的问题放在前面,把能引起被调查者兴趣的问题放在前面,把枯燥的问题放在后面;把枯燥的问题放在后面;同类问题放在一起,这样回答者容易回答;同类问题放在一起,这样回答者容易回答;开放性问题,即完全由被调查者自己回答,开放性问题,即完全由被调查者自己回答,没有备
17、选答案的问题放在后面。没有备选答案的问题放在后面。28p(2 2)题支可以设计成半封闭半开放式)题支可以设计成半封闭半开放式n即在备选题后再加一项即在备选题后再加一项“其他其他”并要求选这一并要求选这一项的回答者说出内容。项的回答者说出内容。n这样可以弥补设计时的遗漏,而且我们在调查这样可以弥补设计时的遗漏,而且我们在调查中往往会遇到我们预料不到的情况,所以半开中往往会遇到我们预料不到的情况,所以半开放式问题给了我们空间。放式问题给了我们空间。29如何看待调查数据?30统计调查误差p评价统计调查质量的优劣,主要的评价标准之一评价统计调查质量的优劣,主要的评价标准之一是调查数据的准确性,常用调查
18、误差的大小来反是调查数据的准确性,常用调查误差的大小来反映。映。p按调查误差的性质和产生的原因划分,统计调查按调查误差的性质和产生的原因划分,统计调查误差可分抽样误差和非抽样误差。误差可分抽样误差和非抽样误差。31n抽样误差,指样本无法完全代表总体,由此产抽样误差,指样本无法完全代表总体,由此产生的误差。它只存在于抽样调查中,它不能完生的误差。它只存在于抽样调查中,它不能完全避免,但可以有效控制;全避免,但可以有效控制;n非抽样误差则存在于任何形式的调查中,比如非抽样误差则存在于任何形式的调查中,比如填写错误、样本重复或丢失而产生误差、被调填写错误、样本重复或丢失而产生误差、被调查者提供不实数
19、据而产生的计量误差。查者提供不实数据而产生的计量误差。32p抽样的原理很简单:用足够大的样本数量、样本抽样的原理很简单:用足够大的样本数量、样本抽取的随机性来保证样本对总体的代表性,但这抽取的随机性来保证样本对总体的代表性,但这有时并不容易做到。有时并不容易做到。p样本的选择,有时会有偏差,使得样本很片面地样本的选择,有时会有偏差,使得样本很片面地“代表代表”着总体。着总体。p这种偏差,可能出自无心,也可能出自有意。这种偏差,可能出自无心,也可能出自有意。33例例1 1 1936年美国大选:罗斯福年美国大选:罗斯福 vs.阿尔夫阿尔夫p1936年预测美国总统大选年预测美国总统大选n预测机构:美
20、国预测机构:美国文学文摘文学文摘杂志杂志n预测方法:抽样调查、民意调查预测方法:抽样调查、民意调查n样本选择:从样本选择:从1000万个电话用户和万个电话用户和文学文摘文学文摘的订户中随机抽样调查的订户中随机抽样调查n预测结果:阿尔夫以预测结果:阿尔夫以370:161的比例胜过罗斯的比例胜过罗斯福福34n实际结果呢?实际结果呢?罗斯福胜出!罗斯福胜出!n预测失败原因:预测失败原因:1936年时有能力安装电话、订年时有能力安装电话、订文学文摘文学文摘的人在经济上较为宽裕,不能很的人在经济上较为宽裕,不能很好代表美国社会各阶层好代表美国社会各阶层。p并不是样本越多就越能反映总体,关键在于所选并不是
展开阅读全文