《人工智能基础与应用》教学课件—认知人工智能的应用技术.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《人工智能基础与应用》教学课件—认知人工智能的应用技术.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能基础与应用 人工智能 基础 应用 教学 课件 认知 应用技术
- 资源描述:
-
1、目目 录录教学目标教学目标教学要求教学要求内容概览内容概览相关知识相关知识3.1.1 图像识别技术的原理及应用3.1.2 人脸识别技术及应用3.1.3 OCR文字识别技术及应用练习与思考练习与思考任务一任务一 视觉智能视觉智能机器如何识字、看人机器如何识字、看人1掌握图像识别、人脸识别、文字识别的含义2理解图像识别、人脸识别、文字识别的原理、技术流程、应用及发展趋势3进行图像识别、人脸识别、文字识别的实训【教学目标教学目标】1.1.知识点知识点图像识别、视频识别、人脸识别、行为识别、文字识别的概念和技术流程2.2.技能点技能点掌握图像识别、人脸识别、文字识别的实训操作3.3.重难点重难点通过本
2、项目的学习,重点理解视觉智能包括哪些应用技术,过去的计算机视觉和现在的视觉智能有什么区别和联系,思考在生活和行业方面有哪些具体应用?从“看得见”到“看得清楚、看得明白”之间,需要我们怎么去训练机器?同时,结合每个任务后的实训项目进一步思考,尝试拓展更多实训任务。【教学要求教学要求】【内容概览内容概览】任务一 视觉智能机器如何识字、看人3.1.3 OCR文字识别技术及应用什么是OCR识别OCR识别的智能化OCR识别的应用3.1.2 人脸识别技术及应用是图像识别的一个应用场景,也叫做人像识别、面部识别,即基于人的脸部特征信息进行身份识别3.1.1 图像识别技术及应用什么是图像识别?技术流程:人脸图
3、像采集及检测、人脸图像预处理、人脸图像特征提取以及匹配与识别基于深度学习技术,将图片上的文字、符号智能识别出来并变为可编辑的文本优点:识别效率和准确率高、识别图像质量宽容度高通用文字识别、卡证文字识别、票据文字识别、场景文字识别、其他文字识别(图片数字、印章检测、表格文字、图片二维码等)识别流程:图像输入、图像预处理、版面分析、字符切割、字符特征提取、字符识别、后处理校正图像识别的技术流程图像识别的应用信息的获取、预处理、特征抽取和选择、分类器设计和分类决策应用领域:公共安全、生物、工业、农业、交通、医疗等延展介绍:视频识别及视频中的行为识别图像处理:图像采集、图像增强、图像复原、图像编码与压
4、缩、图像分割图像识别:统计法、模板匹配法和神经网络法等【相关知识相关知识】计算机视觉应用场景图像识别是人工智能行业应用的一个重要方向,也是机器学习最热门的领域之一。其目的是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。图像识别的发展经历三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别通过分类并提取重要特征并排除多余的信息来识别图像。图像的内容通常是用图像特征进行描述,包括:颜色特征、纹理特征、形状特征及局部特征点等。一、图像识别技术的原理及应用一、图像识别技术的原理及应用(一)(一)什么是图像识别?什么是图像识别?n 图像识别过程图像识别过程图像识
5、别过程分为图像处理和图像识别两个部分。一、图像识别技术的原理及应用一、图像识别技术的原理及应用(一)(一)什么是图像识别?什么是图像识别?n 图像识别过程图像识别过程1.1.图像处理图像处理分为模拟图像处理和数字图像处理。其目的是去除干扰、噪声,将原始图像进行特征提取,主要包括图像采集、图像增强、图像复原、图像编码与压缩和图像分割。一、图像识别技术的原理及应用一、图像识别技术的原理及应用(一)(一)什么是图像识别?什么是图像识别?环节环节内容内容图像采集图像采集主要借助于摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,与文字、图形、声音一起存
6、储。图像提取是将一个图像变换为适合计算机处理的形式的第一步。图像增强图像增强为突出图像中想抓取的部分,必须对图像进行改善,以缓解图像在成像、采集、传输等过程中,质量或多或少造成的退化。通过图像增强,减少图像中的干扰和噪声,改变原来图像的亮度、色彩分布、对比度等参数,为后期的图像分析和图像理解奠定基础。图像复原图像复原为提取比较清晰的图像,减少在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,需要对图像进行恢复。主要采用滤波方法,从降质的图像恢复原始图。另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。图像编码图像编码与压缩与压缩为快速方便地在网络
7、环境下传输图像或视频,必须对图像进行编码和压缩。如静态图像压缩标准JPEG,针对图像的分辨率、色彩等进行规范。由于视频可被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以缓解数据量和存储器容量问题、提高图像传输速度、缩短处理时间。图像分割图像分割技术技术图像分割是把图像分成一些互不重叠而又具有各自特征的子区域,每一区域是像素的一个连续集,这里的特性可以是图像的颜色、形状、灰度和纹理等。图像分割对图像中的目标、背景进行标记、定位,然后把目标从背景中分离出来。目前,图像分割的方法主要有基于区域特征的分割方法、基于相关匹配
8、的分割方法和基于边界特征的分割方法。在实际的图像中需根据景物条件的不同选择适合的图像分割方法。图像分割为进一步的图像识别、分析和理解奠定了基础。n 图像识别过程图像识别过程2.2.图像识别图像识别将经过处理的图像进行特征提取和分类,这就是图像识别。通常有几种常用的识别方法:统计法、模板匹配法和神经网络法。统计法统计法该方法是对研究的图像进行大量的统计分析,找出其中的规律并提取反映图像本质特点的特征来进行图像识别。缺点:当特征数量激增,给特征提取造成困难,分类也难以实现。模板匹配法模板匹配法即把已知物体的模板与图像中所有未知物体进行比较,如果某一未知物体与该模板匹配,则该物体被检测出来,并被认为
9、是与模板相同的物体。缺点:虽然简单方便,但应用有很大的限制,识别率过多地依赖于已知物体的模板,如果已知物体的模板产生变形,会导致错误的识别。一、图像识别技术的原理及应用一、图像识别技术的原理及应用(一)(一)什么是图像识别?什么是图像识别?n 图像识别过程图像识别过程2.2.图像识别图像识别神经网络法神经网络法指用神经网络算法对图像进行识别的方法。目前深度学习模型已应用于一般图像的识别和理解,不仅大大提升了图像识别的准确性,也避免了抽取人工特征时的时间消耗。什么是神经网络?什么是神经网络?神经网络侧重于模拟和实现人的认知过程中的感知过程、形象思维、分布式记忆和自学习自组织过程。神经网络的特征:
10、神经网络的特征:具有容错性强、独特的联想记忆及自组织、自适应和自学习能力,特别适合处理信息模糊或不精确问题。一、图像识别技术的原理及应用一、图像识别技术的原理及应用(一)(一)什么是图像识别?什么是图像识别?举例:垃圾邮件的判断图像识别的技术流程分以下几步:信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。一、图像识别技术的原理及应用一、图像识别技术的原理及应用(二)(二)图像识别的技术流程图像识别的技术流程信息获取信息获取 通过传感器,将光或声音等信息转化为电信息。即获取研究对象的基本信息并通过某种方法将其转变为机器能够认识的信息。预处理预处理 指图像处理中的去噪、平滑、变换等的操作
11、,从而加强图像的重要特征。特征抽取特征抽取和选择和选择 特征抽取:利用某种方法,研究各式各样的图像,获取图像所具有的本身特征 特征选择:从抽取的特征中,选择对本次识别有用的特征分类器设分类器设计计 通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别技术能够得到高识别率。分类决策分类决策 在特征空间中对被识别对象进行分类,从而更好地识别所研究的对象具体属于哪一类。视频监控、人脸检测和识别等都是图像识别最广泛的应用。从场境上,公共安全、生物、工业、农业、交通、医疗等均有广泛应用。存在的局限:存在的局限:图像识别技术在应用上还只是起着导盲犬性质的指引作用,需要通过人工添加标签
12、或注释,帮助机器来理解图片。未来的技术将朝着能够具有人一样的视觉、能够理解图像内容的人工智能发展。一、图像识别技术的原理及应用一、图像识别技术的原理及应用(三)(三)图像识别的应用图像识别的应用视频识别及视频中的行为识别是图像识别技术的重要应用。视频就是由图像连续播放形成的(1秒钟的视频包含25帧图像,每1帧都是1张图像),视频识别中一个重要内容是视频理解,主要包括:视频结构化分析:即是对视频进行帧、超帧、镜头、场景、故事等分割,从而在多个层次上进行处理和表达。目标检测和跟踪:如车辆跟踪,多是应用在交通安防领域。人物识别:识别出视频中出现的人物。动作识别:识别出视频中人物的动作。视频中的行为识
13、别是计算机视觉研究中的重要领域,将人的活动进行拆分并进行识别。一、图像识别技术的原理及应用一、图像识别技术的原理及应用(三)(三)图像识别的应用图像识别的应用n 什么是什么是人脸人脸识别识别?人脸识别是图像识别的一个应用场景,通常也叫做人像识别、面部识别。人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术,用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术。n 人脸识别技术的主要流程人脸识别技术的主要流程人脸图像采集及检测人脸图像预处理人脸图像特征提取匹配与识别。二、人脸识别技术及应用二、人脸识别技术及应用n 人脸识别
14、技术的主要流程人脸识别技术的主要流程(1)人脸图像采集及检测人脸图像采集:通过摄像镜头采集,比如静态图像、动态图像、不同的位置、不同表情等方面都可以得到很好的采集。人脸检测:主要用于人脸识别的预处理,即在图像中准确标定出人脸的位置、大小和特征。其目的就是把其中有用的信息挑出来,并利用这些特征实现检测。(2)人脸图像预处理基于人脸检测结果,对图像进行处理并最终服务于特征提取的过程。包括人脸对准,人脸图像的光线补偿,灰度变换、直方图均衡化、归一化(取得尺寸一致,灰度取值范围相同的标准化人脸图像),中值滤波(图片的平滑操作以消除噪声)以及锐化等。二、人脸识别技术及应用二、人脸识别技术及应用n 人脸识
15、别技术的主要流程人脸识别技术的主要流程(3)人脸图像特征提取也称人脸表征,是对人脸进行特征建模的过程。可使用的特征通常分为视觉特征、像素统计特征、人脸图像变换系数特征、人脸图像代数特征等。(4)匹配与识别提取的人脸特征值数据与数据库中存贮的特征模板进行搜索匹配,通过设定一个阈值,将相似度与这一阈值进行比较,来对人脸的身份信息进行判断。二、人脸识别技术及应用二、人脸识别技术及应用n 人脸识别技术的应用范围人脸识别技术的应用范围企业、住宅安全和管理:如人脸识别门禁考勤系统,人脸识别防盗门等电子护照及身份证公安、司法和刑侦自助服务信息安全:如计算机登录、电子政务和电子商务等其他类似常见技术还有指纹识
16、别、手掌几何学识别、虹膜和视网膜识别等,也广泛地应用于身份认证等场境,比如签证应用、身份识别、打卡应用等。二、人脸识别技术及应用二、人脸识别技术及应用OCR,全称Optical Character Recognition,光学字符识别。利用该识别技术,OCR文字识别可以代替人工录入,将图片上的文字、符号识别出来并变为可编辑的文本。人工智能时代的OCR,又被称为文字识别技术,它是基于深度学习技术,将纸张、图片等载体上的文字内容,智能识别成为可编辑的文本。三、三、OCROCR文字识别技术及应用文字识别技术及应用(一)(一)什么是什么是OCROCR识别?识别?n 1.1.智能智能OCROCR的优点的
17、优点为什么会出现智能OCR?深度学习技术进入视觉识别领域,一种全新的基于深度学习的OCR流程被提出来。优点:优点:从单字识别进化到整行识别,文字识别准确率大幅提升;极大提升对识别图像质量的宽容度,可以有效识别光照不均、图像模糊、复杂背景等低质量图像;无需扫描仪或高拍仪、手机、平板等移动设备拍摄的照片,都可以用于识别。甚至,手写字体的识别不再是“噩梦”。三、三、OCROCR文字识别技术及应用文字识别技术及应用(二)(二)AIAI时代,时代,OCROCR识别的蜕变识别的蜕变n 2 2.OCR.OCR技术的识别流程技术的识别流程三、三、OCROCR文字识别技术及应用文字识别技术及应用(二)(二)AI
18、AI时代,时代,OCROCR识别的蜕变识别的蜕变序号序号步骤步骤步骤内容步骤内容1图像输入采集所要识别的图像,比如名片、身份证、护照、行驶证、驾驶证、公文、文档等等2图像预处理包含二值化、去噪、倾斜度矫正等3版面分析对将要识别的文档分段、分行处理4字符切割定位出字符串的边界,然后分别对字符串进行单个切割5字符特征提取提取字符特征,为识别提供依据6字符识别将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配,识别出字符7版面回复将识别结果按照原来的版面排班,输出Word或pdf格式的文档8后处理校正根据特定的语言上下文的关系,对识别结果进行较正OCROCR识别:识别:包含通用文字识别、
19、卡证文字识别、票据文字识别、场景文字识别、以及其他文字(图片数字、印章检测、表格文字、图片二维码等)识别等几大类型场景的识别。三、三、OCROCR文字识别技术及应用文字识别技术及应用(三)(三)OCROCR识别的应用识别的应用n OCROCR识别的应用场境识别的应用场境智能OCR技术的身影已逐渐覆盖到智慧城市、智慧金融、智能交通、智慧医疗等越来越多的领域,如:网络信息安全企业根据网络爬虫网络图片,对照片上的文字识别剖析,进而判断其是不是带有特殊颜色信息内容;图书馆藏书的电子化,提高了效率和准确度;物流行业,通过手写体文字识别技术,自动识别出运单的收寄件人电话号码和地址等字段,大幅提升运单信息录
20、入效率和物流资源的调度匹配能力;身份证的管理和识别、发票识别、出生证明识别、不动产登记识别等等。三、三、OCROCR文字识别技术及应用文字识别技术及应用(三)(三)OCROCR识别的应用识别的应用【练习与思考练习与思考】选择题:选择题:1 1.以下哪些方法属于图像识别的方法?(多选题)以下哪些方法属于图像识别的方法?(多选题)A.模板匹配法 B.神经网络法 C.统计法 D.知识图谱2 2.以下哪个流程属于图像识别的正确流程?以下哪个流程属于图像识别的正确流程?A.特征抽取选择分类决策信息预处理B.信息预处理分类决策特征抽取选择C.信息预处理特征抽取选择分类决策D.分类决策特征抽取选择信息预处理
21、3 3.人脸识别包含以下哪些流程?(多选题)人脸识别包含以下哪些流程?(多选题)A.人脸图像采集及检测 B.人脸图像特征提取C.人脸图像预处理 D.人脸图像匹配与识别【练习与思考练习与思考】选择题:选择题:4 4.以下哪些均属于人物身份确认的常见技术?(多选题)以下哪些均属于人物身份确认的常见技术?(多选题)A.指纹识别B.人脸识别C.手掌几何学识别D.虹膜和视网膜识别5 5.人工智能人工智能OCROCR识别带来哪些优点?识别带来哪些优点?(多选题多选题)A.识别效率提升B.识别的图像质量宽容度低C.识别的准确率高D.手写字体也很容易识别【练习与思考练习与思考】选择题:选择题:6 6.OCRO
展开阅读全文