人工智能与大数据开发入门背景知识简介-经典课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《人工智能与大数据开发入门背景知识简介-经典课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 数据 开发 入门 背景 知识 简介 经典 课件
- 资源描述:
-
1、基本知识入门简介基本知识入门简介电子科技大学电子科技大学学生:学生:岳清泉岳清泉指导老师:指导老师:鄢鄢 然然副教授副教授2018年年4月月人工智能及大数据开发人工智能及大数据开发精1主要内容主要内容1人工智能简介1.1AI的定义及研究目标1.2AI的产生与发展1.3AI研究中的三大学派1.4AI的两个不同层次1.5AI的应用2大数据简介2.1大数据的概念2.2大数据的特点2.3大数据面临的主要问题2.4大数据和人工智能的关系3相关算法基础3.1基于模拟机制的人工智能算法分类方法3.2人工智能知识网络系统总结3.3蒙特卡洛树搜索树算法简介4编程语言Python简介4.1认识Python4.2P
2、ython的应用领域精2主要内容主要内容4.3Python是人工智能首选语言5总结精3 人工智能简介1.1AI的定义及其研究目标的定义及其研究目标人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人类智能人类智能人工智能研究领域人工智能研究领域语言智能自然语言处理,如Siri,讯飞翻译逻辑判断机器证明及符号运算神经控制神经网络,如人机象棋视觉机器视觉和图像识别自然观察能力模式识别
3、多种智能组合人工智能精4 人工智能简介1.2AI的产生与发展的产生与发展精5 人工智能简介诞生与早期研究1950年,图灵发表了一篇划时代的论文,并提出著名的“图灵测试”:由艾伦麦席森图灵发明,指测试者与被测试者(一个人和一机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果有超出30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能1956年,达特茅斯会议:AI的诞生1957年,纽厄尔、肖(J.Shaw)和西蒙等人的心理学小组研制了称为逻辑理论机的数学定理证明程序。1962年,由塞谬尔在IBM704计算机上研制的具有自学习和适
4、应能力的西洋跳棋程序打败了一个州的冠军。挫折和教训1958年,西蒙曾预言:十年内,计算机将称为国际冠军;计算机将发现和证明有意义的数学定理;计算机将能谱写优美的乐曲;计算机将能实现大多数的心理学理论。后两个到目前为止都未能实现。在博弈方面,塞谬尔的程序与世界冠军比赛时,5局输了4局在定理证明方面,当时用归结原理证明两个连续函数之和还是连续函数时,推了10万步,也没有证明出来。精6 人工智能简介在神经生理学方面,发现人脑有1012以上的神经元,用机器从结构上根本无法模拟在其他方面,人工智能也遇到了不少的困难,因此那段时间,在全世界范围,人工智能陷入了低谷。以知识为中心的研究1972年,费根鲍勃开
5、始研究MYCIN专家系统,并于1976年研制成功,它可以协助内科医生诊断细菌感染疾病并提供最佳处方。1976年,斯坦福大学研制出地质勘探专家系统PROSPECTOR这一时期同时发展的还有计算机视觉和机器人,自然语言理解和机器翻译翻译等新的问题专家系统所存在的知识领域狭窄、缺乏常识性知识、知识获取难、推理方法单一、没有分布式功能、不能访问现存数据库的问题逐渐暴露出来第三次AI兴起浪潮2006年后,大数据的广泛应用使得机器学习迅速发展,并进一步产生了深度学习2016年3月,AlphaGo对战世界围棋冠军、职业九段选手李世石,并以4:1的总比分获胜。2017年5月23日至27日在中国嘉兴乌镇进行的三
6、番棋比赛,AlphaGo以总比分3比0战胜世界排名第一的柯洁。精7 人工智能简介1.3AI研究中的三大学派研究中的三大学派符号主义学派符号主义学派联结主义学派联结主义学派行为主义学派行为主义学派基于符号运算的人工智能学派。他们认为知识可以用符号来表示,认知可以通过符号运算来实现。如专家系统。从大脑和神经系统的生理背景出发模拟它们的工作机理和学习方式。之后,随着模糊逻辑和进化计算的逐步成熟,又形成了“计算智能”主要进行行为主义的模拟。如1991年,麻省理工学院布鲁克教授研究成功能较为自由活动的6条腿机器虫。奠基人:西蒙(CMU)奠基人:明斯基(MIT)奠基人:维纳(MIT)随着研究和应用的深入,
7、人们逐渐意识到,三个学派各有所长,各有所短,如今的人工智能研究是将这三大学派的方法加以相互结合。精8 人工智能简介1.4AI的两个不同层次的两个不同层次弱人工智能弱人工智能强人工智能强人工智能令机器进行智能的行动。弱人工智能经常是擅长某一单方面的人工智能。比如能战胜围棋世界冠军的人工智能,但它只会下棋,你问它其他事情,它就无法处理。另一个典型代表是微软小冰。它不仅安装在Windows系统的pc上,它还担任着东方卫视天气预报主持人的角色。强人工智能:令机器像人一样思考。其基本定义为:人类制造出的具有自主推理和解决一般性问题的智能程序。此类程序具备知觉和自我意识,可以完成自我编程和开发新人工智能的
8、工作。到目前为止,真正意义上的强人工智能还没有研制出来,并且很可能在最近几十年都还研制不出来精9 人工智能简介1.51.5AIAI的应用的应用AI在互联网领域类的应用精10 人工智能简介人工智能对社会经济的影响新时代下,机器人产业将迎来井喷式的增长,并开始充斥在社会的各个角落,成为推动社会进步的强大力量。可以预见,未来将会是商业、社会与机器人的联合大接轨。人工智能机器人将会在如下方面改变着人们的生活。(1)引领时尚生活的服务机器人:餐厅服务机器人、家庭扫地机器人、达芬奇手术机器人、助残机器人(2)风靡制造业的工业机器人:比如海尔美的中的六轴串联机器人,负责搬运工作(3)农业机器人:育苗、采摘、
9、蔬果分级练选、户外载具、畜产机器人(4)教育机器人,文化领域的助理(5)特种机器人,深入险地,执行特种任务(6)太空机器人,探索宇宙,开启神秘之旅(7)云机器人:云计算与机器人的联合(8)仿生机器人:仿鱼鸟等(9)仿人机器人对社会的影响产业变革:人工智能的发展势必形成产业变革,很多商业模式开始重新洗牌,对创业者来说既是机遇也是挑战精11 人工智能简介失业和社会保障问题:人工智能的大规模使用,尤其是机器人的出现,大量可重复性的工作将被机器人取代,导致很多人失业贫富差距问题:将会进一步加大,利用人工智能,有钱人将会更有钱,而穷人因为失去工作变的更穷地区发展不平衡问题:人工智能属于高科技产业,前期的
10、投入非常大,一旦大规模市场化,则可以帮助所在地区提高生产效率,这意味着,缺乏人工智能技术的地区,发展速度会比拥有人工智能地区慢很多,两地发展不平衡的差距将会越来越大产业结构调整:人工智能时代,人与机器的分工,会促进产业结构的调整人工智能时代的服务业:服务升级,下岗人员可以从事贴心的关爱型服务,同时提升企业的收益对个人的影响失业和社会保障问题心理层面的问题:人员的自我价值、人类的自我实现、人机协同时代的人类心理学精12 大数据简介2.1大数据的概念大数据的概念大数据(big data):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察
11、发现力和流程优化能力的海量、高增长率和多样化的信息资产。主要解决,海量数据的存储和海量数据的分析计算问题。2.2大数据的特点大数据的特点 Volume(大量):截至目前,人类生产的所有印刷材料的数据量是200PB,而历史上全人类总共说过的话的数据量大约是5EB。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。按顺序给出数据存储单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。精13 大数据简介 Velocity(高速):这是大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用
12、量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。天猫双十一:2017年3分01秒,天猫交易额超过100亿精14 大数据简介 Variety(多样):这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以数据库/文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。Value(低价值密度):价值密度的高低与数据总量的大小成反比。比如公安部门的天网监控视频中,每天每一分钟每一秒都在存储数据,但是公安部门关心的仅仅是发生交通事故时的那么几分钟的事发过程的视频内容。精
13、15 大数据简介2.32.3大数据面临的主要问题大数据面临的主要问题大数据时代已经来临,全球数据量正呈指数级的增长,其主要原因如下:(1)各种传感器的剧增及互联网产生的各类数据、高清晰度的图像和视频数据(2)自然科学研究产生的数据量剧增。(3)企业及商业活动产生的数据量剧增。大数据处理的一般流程包括大数据获取、大数据预处理、大数据存储于管理、大数据分析与挖掘及大数据可视化。基于大数据处理流程,大数据面临的主要问题为:获取问题、存储问题和管理问题获取问题、存储问题和管理问题第一阶段即大数据的获取、存储和管理。其中,大数据获取是指针对海量数据进行智能化识别、定位、跟踪及采集。大数据存储和管理是指如
14、何将采集到的大规模数据有效地存储起来,建立相应的存储机制,并进行管理和调用。(1)网络爬虫搜索策略(2)图像压缩编码问题检索问题、挖掘问题和发现问题检索问题、挖掘问题和发现问题第二个阶段是实现信息检索、数据挖掘和知识发现。这也是大数据处理流程的核心。(1)特征向量降维:高维的文本特征向量增加了数据处理时间和复杂精16 大数据简介度,需要降维。(2)挖掘方法效率和效果(3)模式评价及优化:对挖掘出的模式进行评价可视化和安全问题可视化和安全问题大数据处理的最后阶段即实现数据可视化和确保数据的隐私和安全。面对海量的数据,如何将数据或从数据中挖掘的知识清晰明朗的展现给用户是大数据处理面临的巨大挑战;此
15、外,如何在分享私人数据的同时,限制用户隐私的泄露,是大数据处理面临的另一个挑战。2.42.4大数据与人工智能的关系大数据与人工智能的关系任何智能的发展,其实都需要一个学习的过程。而近期人工智能之所以能取得突飞猛进的进展,不能不说是因为这些年来大数据长足发展的结果。正是由于各类感应器和数据采集技术的发展,我们开始拥有以往难以想象的的海量数据,同时,也开始在某一领域拥有深度的、细致的数据。而这些,都是训练某一领域“智能”的前提。如果我们把人工智能看成一个嗷嗷待哺拥有无限潜力的婴儿,某一领域专业的海量的深度的数据就是喂养这个天才的奶粉。奶粉的数量决定了婴儿是否能长大,而奶粉的质量则决定了婴儿后续的智
展开阅读全文