大数据分析与挖掘课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据分析与挖掘课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 挖掘 课件
- 资源描述:
-
1、大数据分析与挖掘大数据与数据挖掘课程的背景2中国大数据发展调查报告(2018年):?2017年中国大数据产业总体规模为 4700亿元人民币,同比增长30%;预计2018-2020 年增速将保持在30%以上。大部分企业均已意识到数据分析对企业发展的重要性。?近四成的企业已经应用了大数据。与2016年相比上升4.5%金融等领域大数据应用增加趋势较为明显。?企业应用大数据所带来的主要效果包括实现智能决策、提升运营效率和改善风险管理。3我们身边的大数据4百度地图的定位数据对大数据的初步认识(1)?三十多年来,我国春运大军从1亿多人次到36 亿人次?春运的最热现象是逆向过年,即老人们到孩子工作的地方过年
2、。除夕夜 哈尔滨迁徙地图6对大数据的初步认识(2)大数据与交通拥堵?一卡通大量使用,乘客出行的海量数据?预埋传感器,收集车流量、客流量信息?卫星地图数据对道路交通情况进行分析?出租车提供实时数据,了解主要道路的路况?智能手机使用地图应用,分析出实时的道路交通拥堵状况、出行流7动趋势或特定区域的人员聚集程度对大数据的初步认识(3)大数据分析电信诈骗?根据2015年的统计数据,我国公民个人信息泄露数量已经达到40 亿条左右。?刚取了通知书就有助学金诈骗电话刚买了房就有无数装修公司的电话 8大数据的基本特征用4个V来总结:Volume、Variety、Value 和Velocity数据体量大:从 T
3、B 级别,跃升到 PB数据多样性:多为非结构型数据,如网络日志、视频、图片、地理位置信息价值密度低:以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒速度快:产生了大量的高速动态数据流,对数据流的实时分析与处理要求不断增加,数据处理的越及时,产生的价值越大。9大数据基本特征的第五个V:Veracity数据的不确定性10数据挖掘:Data Mining概念从大大量数据量数据中抽取出(隐含的、有潜在用途的、未知未知的、人们可以理解的)有价值的信息和模式的过程。这些新发现的规律、模式、信息和概念具有潜在使用价值。11?数据挖掘背后的大数据思维?寻找特效药:?科学家们通常需要分析疾病产生的原
4、因,寻找能够消除这些原因的物质,然后合成新药。是一个非常漫长的过程,而且费用非常高。有了大数据,寻找特效药的方法就和过去有所不同了。?斯坦福大学医学院发现,原来用于治疗心脏病的某种药物对治疗某种胃病特别有效。这种方法,实际上依靠的并非因果关系,而是一种强关联关系,即 A药对B病有效。至于为什么有效,接下来 3 年的研究工作实际上就是在反过来寻找原因。这种先有结果再反推原因的做法,和过去通过因果关系推导出结果的做法截然相反。无疑,这样的做法会比较快,当然,前提是有足够多的数据支持。?在大数据时代,我们能够得益于一种新的思维方法从大量的数据中直接找到答案,即使不知道原因。12数据挖掘背后的?大数据
5、思维-比100 米要多久时间,米用的多少时间做一个估计,而不会13在数据挖掘的思想中,知识的学习是不需要通过具体问题的专业知识建模。这其实是模拟了人的原始学习过程如你要预测一个人跑可以根据之前了解的他这样体型的人跑100使用牛顿定律来算。数据挖掘:Data Mining 一般流程14数据挖掘:Data Mining功能?关联规则?分类与预测?聚类分析?15数据挖掘:Data Mining关联规则16关联规则:零售业应用?几十年来,大型零售商塔吉特收集了海量的数据,记录了每一位经常光顾其各分店的顾客数据。发现女客户会在怀孕四个月左右,大量购买无香味乳液。由此挖掘出25项与怀孕高度相关的商品,制作
展开阅读全文