数据科学:探索数据界.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据科学:探索数据界.pptx》由用户(无敌的果实)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 科学 探索
- 资源描述:
-
1、数据科学与大数据技术教育论坛内容提要数据界数据科学数据科学家数据界作者、出版社生产信息图书、图书馆存储和传播信息第一次数据爆炸图书存储到计算机中技术的进步使得帮助人类记忆的设施获得重大发展无法过目不忘印刷术、造纸术图和文字帮助记忆第二次数据爆炸大脑记忆?第三次数据爆炸?新的设备计算机及存储设备更易共享,传播更快刻图刻字帮助记忆,易于传播、交流数据界数据界数据身数据界自然界Nature数据界DataNature数据表示自然界中存在的东西一些数据不表示自然界中任何东西所有自然界中东西都有数据表示;数据正确性真实性没有保证 数据一致性越来越困难 数据共享越来越困难数据综合症 表示自然界的任何东西数据
2、界探索数据界数据界有多大、有多少数据?数据以什么方式增长?数据增长对人类影响?数据界数据界的真实性看到的数据是否真实数据是否真实表示了现实看到的是搜索引擎展现的数据界数据界如何看到一个真实的数据界?搜索的问题 :隐藏了数据界的真实性数据界数据对象测度与数据代数1)布尔代数2)关系代数+=?内容提要数据界数据科学数据科学家数据科学数据科学:认识数据发展变化的规律新的科学新的研究对象新的科学问题新的科学问题、新的研究对象需要新的科学数据科学术语 1966 年,Peter建议将计算机科学称为数据科学(当时使用“Datalogy”一词),即“研究数据使用和本质的科学”; 1990年,CODATA将数据
3、科学描述为处理科学数据的科学,并于2002年将其创办的期刊命名为Data Science Journal; 1996年,Chikio将数据科学描述为数据统计、数据挖掘和相关方法的综合;Peter Naur 2001年,William提出将数据科学作为一个独立的学科的观点,所定义的数据科学是统计学的扩展。 2009年朱扬勇和熊贇将数据科学描述为研究网络空间中数据的形态、现象和规律的科学,即研究数据的科学或关于数据的科学; 2010年,Mike将数据科学描述为数据的应用及其产物,目标是从数据中提取出意义(信息和知识)和创造数据产品。The Scienceof Datalogy,CACM, 1966
4、:9(7)Datalogy: thescience ofthe natureand use of 数据科学在科学数据处理领域、计算机科学领域、统计学领域data.等都已经提出了相应的概念和观点。维基百科认为数据科学结合不同元素,并建立在不同领域的技术和理论之上,这些领域包括数学、统计、数据工程、模式识别和学习、高级计算等,使用所有可用的数据和相关的数据使非专业人士易于理解其阐述的内容是数据科学的目标。数据科学的一些观点观点一: Data science is the science of studying scientific data.CODATA regards data science
5、as the methods and technologies usedto conduct scientific research through management and utilization ofscientific data.The Committee on Data forScienceandTechnology(CODATA) launched the DataScience Journal in 2002.数据主要是指科学研究产生的数据,强调科学数据管理、处理和利用即 通 常 被 称 为 data-intensive scientific research or fourt
6、hparadigm of scientific research.数据科学的一些观点观点二: Data science is the science of studying business data.In 2010, Loukides discussed whatdata science is, arguing that datascience should enable the creationof data products rather thanworking as a simple applicationwith data.In 2013, Provost et al. pointe
7、d out,“extracting knowledge from datato solve business problems” is oneof the fundamental concepts ofdata science.从业务数据中获取知识辅助决策是数据科学的一个方面。许多BI科学家也被称为数据科学家。相比BI问题,数据科学更聚焦BI方法学。数据科学的一些观点观点三: The purpose of data science is to solve scientific andbusiness problems by extracting knowledge from data.In 2
展开阅读全文