第12章多媒体人机交互技术课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第12章多媒体人机交互技术课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 12 多媒体 人机交互 技术 课件
- 资源描述:
-
1、本章导读本章导读 从多媒体技术的角度看,人机交互技术是在计算机具备从多媒体技术的角度看,人机交互技术是在计算机具备处理声音、图像、视频等多种媒体信息能力的基础上发展起处理声音、图像、视频等多种媒体信息能力的基础上发展起来的,是多媒体技术的不同应用。另一方面,人机交互技术来的,是多媒体技术的不同应用。另一方面,人机交互技术的研究又促进了多媒体技术的快速发展,充分表现了多媒体的研究又促进了多媒体技术的快速发展,充分表现了多媒体技术的交互性。技术的交互性。本章将从多媒体信息处理的角度,简单介绍本章将从多媒体信息处理的角度,简单介绍目前已经广泛应用的几种典型的人机交互技术目前已经广泛应用的几种典型的人
2、机交互技术,如触摸技术、,如触摸技术、手写识别技术、语音识别与合成技术、虚拟现实技术等。同手写识别技术、语音识别与合成技术、虚拟现实技术等。同时,还将介绍基于多媒体技术的人机交互界面的发展方向。时,还将介绍基于多媒体技术的人机交互界面的发展方向。本章主要内容本章主要内容12.1 12.1 人机交互技术概述人机交互技术概述 12.2 12.2 触摸屏技术触摸屏技术 12.3 OCR12.3 OCR与手写识别技术与手写识别技术 12.4 12.4 语音识别技术语音识别技术 12.5 12.5 语音合成技术语音合成技术 12.6 12.6 虚拟现实技术虚拟现实技术 12.112.1人机交互技术概述人
3、机交互技术概述12.1.1 12.1.1 人机交互简介人机交互简介 人机交互人机交互(Computer Human InteractionComputer Human Interaction,CHICHI)也称)也称HCIHCI(Human Computer InteractionHuman Computer Interaction),),是研究人、计算机及是研究人、计算机及其相互影响的技术其相互影响的技术,其核心是人机界面,它是计算机与人之间,其核心是人机界面,它是计算机与人之间通信和对话的接口,是计算机系统的重要组成部分。通信和对话的接口,是计算机系统的重要组成部分。人机交互技术是指通过计
4、算机系统的输入人机交互技术是指通过计算机系统的输入/输出设备,以输出设备,以有效的方式实现人与计算机系统之间信息交流的技术。有效的方式实现人与计算机系统之间信息交流的技术。目前,人们已经能够与计算机系统较为方便地进行交互,目前,人们已经能够与计算机系统较为方便地进行交互,具体应用的交互技术有具体应用的交互技术有键盘交互、手写文字交互、语音交互、键盘交互、手写文字交互、语音交互、图像与视频交互、多语言交互、虚拟现实系统中的交互图像与视频交互、多语言交互、虚拟现实系统中的交互等。等。12.1.2 12.1.2 多模态人机交互多模态人机交互1 1、模态、模态 是心理学领域中的一个标准术语,指感知信息
5、的感觉,是心理学领域中的一个标准术语,指感知信息的感觉,也就是感觉模态。也就是感觉模态。2 2、多模态人机交互、多模态人机交互 多模态(多模态(MultimodalityMultimodality)人机交互,就是基于智能接口)人机交互,就是基于智能接口技术,充分利用人的多种感知通道,技术,充分利用人的多种感知通道,以并行的、非精确的方以并行的、非精确的方式与计算机系统进行交互,旨在提高人机交互的自然性和高式与计算机系统进行交互,旨在提高人机交互的自然性和高效性效性。3 3、多模态人机交互的研究内容、多模态人机交互的研究内容 1 1)语音识别、)语音识别、2)2)理解及合成、理解及合成、3 3)
6、手势识别技术、)手势识别技术、4 4)人脸的研究、)人脸的研究、5 5)唇读的研究、)唇读的研究、6 6)人体动作的研究。)人体动作的研究。4 4、多模态人机交互的基本特点、多模态人机交互的基本特点 1 1)使用多个感觉和动作模态;)使用多个感觉和动作模态;2 2)三维的和直接操纵的要求;)三维的和直接操纵的要求;3 3)允许模糊交互;)允许模糊交互;4 4)交互双向性;)交互双向性;5 5)交互的隐含性;)交互的隐含性;12.1.3 12.1.3 可视化可视化 可视化是指充分利用人们对可视模式快速识别的自然能可视化是指充分利用人们对可视模式快速识别的自然能力,将数据信息和知识转化为一种视觉形
7、成的过程。力,将数据信息和知识转化为一种视觉形成的过程。可视化操作过程可视化操作过程可视化科学计算可视化科学计算可视化信息可视化信息可视化 利用计算机图形学和图像处理利用计算机图形学和图像处理技术,技术,将科学计算过程中(包括计将科学计算过程中(包括计算结果)的数据转换为图形或图像算结果)的数据转换为图形或图像在屏幕上显示出来,进行交互处理在屏幕上显示出来,进行交互处理的理论、方法和技术。的理论、方法和技术。层次信息可视化层次信息可视化多位信息可视化多位信息可视化文档(文本)信息可视化文档(文本)信息可视化 WebWeb可视化可视化 现代操作系统提供人机交现代操作系统提供人机交互环境的基本要求
8、,它通过互环境的基本要求,它通过GUIGUI技术来实现技术来实现 12.1.4 12.1.4 新型人机界面的主要特征新型人机界面的主要特征1 1)人性化)人性化 2 2)自然化)自然化 3 3)智能化)智能化4 4)高带宽)高带宽 5 5)不限制地点)不限制地点 6 6)图示编程)图示编程 (a)(a)交互墙交互墙(b)(b)交互桌交互桌(c)(c)交互椅交互椅图图12-1 12-1 物面用户接口举例物面用户接口举例12.212.2触摸屏技术触摸屏技术12.2.1 12.2.1 触摸屏简介触摸屏简介 触摸屏是一种定位装置,安装在显示屏幕前面,它的触摸屏是一种定位装置,安装在显示屏幕前面,它的功
9、能是报告手指(或物体)触摸到屏幕的位置。用户可以功能是报告手指(或物体)触摸到屏幕的位置。用户可以直接用手指触摸屏幕以实现与计算机的交互。直接用手指触摸屏幕以实现与计算机的交互。工作过程工作过程:手指或其他物体触摸触摸屏:手指或其他物体触摸触摸屏 触摸触摸屏控制器检测位置(以坐标形式)屏控制器检测位置(以坐标形式)通过计算机接口通过计算机接口送到送到CPUCPU确定用户所输入的信息。确定用户所输入的信息。触摸屏具有界面直观,操作简单,触摸屏具有界面直观,操作简单,“伸手即得伸手即得”的优的优点,大大改善了人与计算机的交互方式。点,大大改善了人与计算机的交互方式。l触摸屏是一种定位装置,安装在显
10、示屏幕前面,它的功触摸屏是一种定位装置,安装在显示屏幕前面,它的功能是报告手指(或物体)触摸到屏幕的位置;能是报告手指(或物体)触摸到屏幕的位置;l用户可以直接用手指触摸屏幕以实现与计算机的交互;用户可以直接用手指触摸屏幕以实现与计算机的交互;l工作过程:手指或其他物体触摸触摸屏,触摸屏控制器工作过程:手指或其他物体触摸触摸屏,触摸屏控制器检测位置(以坐标形式),通过计算机接口送到检测位置(以坐标形式),通过计算机接口送到CPUCPU,以确定用户所输入的信息。以确定用户所输入的信息。l触摸屏具有界面直观,操作简单,触摸屏具有界面直观,操作简单,“伸手即得伸手即得”的优点,的优点,大大改善了人与
11、计算机的交互方式。大大改善了人与计算机的交互方式。12.212.2触摸屏技术触摸屏技术12.2.1 12.2.1 触摸屏简介触摸屏简介12.2.2 12.2.2 触摸屏的主要类型触摸屏的主要类型l矢量压力传感技术触摸屏矢量压力传感技术触摸屏l电阻技术触摸屏电阻技术触摸屏l电容技术触摸屏电容技术触摸屏l红外线技术触摸屏红外线技术触摸屏l表面声波技术触摸屏表面声波技术触摸屏 等五种类型。等五种类型。其中矢量压力传感技术触摸屏已经被淘汰。其中矢量压力传感技术触摸屏已经被淘汰。依据所采用的技术原理,触摸屏可分为:依据所采用的技术原理,触摸屏可分为:1 1、电阻式触摸屏、电阻式触摸屏 如右图,当手指接触
12、屏幕,如右图,当手指接触屏幕,两层两层 OTIOTI导电层出现一个接触导电层出现一个接触点,因其中一面导电层接通点,因其中一面导电层接通Y Y轴轴方向的方向的5V5V均匀电压场,使得侦均匀电压场,使得侦测层的电压由零变为非零,控制测层的电压由零变为非零,控制器侦测到这个接通后,进行器侦测到这个接通后,进行A/DA/D转换,并将得到的电压值与转换,并将得到的电压值与5V5V相比,即可得触摸点的相比,即可得触摸点的Y Y轴坐标,轴坐标,同理得出同理得出X X轴的坐标。从而实现轴的坐标。从而实现屏幕定位。屏幕定位。图12-2 电阻式触摸屏 2 2、电容式触摸屏、电容式触摸屏 如右图,用户触摸屏幕如右
13、图,用户触摸屏幕时,由于人体电场,手指与时,由于人体电场,手指与导体层间会形成一个耦合电导体层间会形成一个耦合电容,四边电极发出的电流会容,四边电极发出的电流会流向触点,而电流强弱与手流向触点,而电流强弱与手指到电极的距离成正比,位指到电极的距离成正比,位于触摸屏幕后的控制器便会于触摸屏幕后的控制器便会计算电流的比例及强弱,准计算电流的比例及强弱,准确算出触摸点的位置。确算出触摸点的位置。图12-3 电容式触摸屏 3 3、红外线式触摸屏、红外线式触摸屏 红外线触摸屏由装在触摸屏外框上的红外线发射与接红外线触摸屏由装在触摸屏外框上的红外线发射与接收感测元件构成,在屏幕表面上,形成红外线探测网,任
14、收感测元件构成,在屏幕表面上,形成红外线探测网,任何触摸物体可改变触点上的红外线而实现触摸屏操作。何触摸物体可改变触点上的红外线而实现触摸屏操作。具体实现:在显示器上加上光点距离框,光点距离框具体实现:在显示器上加上光点距离框,光点距离框的四边排列了红外线发射管及接收管,在屏幕表面形成一的四边排列了红外线发射管及接收管,在屏幕表面形成一个红外线网(如图个红外线网(如图11-411-4所示)。所示)。当手指触摸屏幕某一点当手指触摸屏幕某一点时,便会挡住经过该位置的时,便会挡住经过该位置的横竖两条红外线,计算机便横竖两条红外线,计算机便可即时算出触摸点位置。可即时算出触摸点位置。图12-4 红外线
15、触摸屏 4 4、表面声波触摸屏、表面声波触摸屏 表面声波触摸屏由触摸屏、声波发生器、反射器和声波表面声波触摸屏由触摸屏、声波发生器、反射器和声波接收器组成,其中声波发生器能发送一种高频声波跨越屏幕接收器组成,其中声波发生器能发送一种高频声波跨越屏幕表面,当手指触及屏幕时,触点上的声波即被阻止,由此确表面,当手指触及屏幕时,触点上的声波即被阻止,由此确定坐标位置。定坐标位置。图12-5 表面声波触摸屏 12.2.3 12.2.3 触摸屏的基本技术特性触摸屏的基本技术特性 触摸屏通常应具备以下三个基本技术特性:触摸屏通常应具备以下三个基本技术特性:1 1、透明性能、透明性能 2 2、绝对坐标系统、
16、绝对坐标系统 3 3、检测与定位、检测与定位12.3 OCR12.3 OCR与手写识别技术与手写识别技术12.3.1 OCR12.3.1 OCR识别技术识别技术 OCR OCR(Optical Character RecognitionOptical Character Recognition,光学字符,光学字符识别)技术,识别)技术,是通过扫描等光学输入方式将文字转化为是通过扫描等光学输入方式将文字转化为图像信息,再利用文字识别技术将图像信息转化为可编图像信息,再利用文字识别技术将图像信息转化为可编辑的文本信息的计算机输入技术辑的文本信息的计算机输入技术。广泛应用于大量文字。广泛应用于大量文
17、字资料、票据、档案卷宗、文案的录入和处理等领域。相资料、票据、档案卷宗、文案的录入和处理等领域。相对一般文本,通常以最终识别率、识别速度、版面理解对一般文本,通常以最终识别率、识别速度、版面理解正确率及版面还原满意度正确率及版面还原满意度4 4个方面作为个方面作为OCROCR技术的评测依技术的评测依据;而相对于表格及票据,据;而相对于表格及票据,通常以识别率或整张通过率通常以识别率或整张通过率及识别速度为测定及识别速度为测定OCROCR技术的实用标准技术的实用标准。OCROCR的基本工作过程分为的基本工作过程分为图文扫描、预处理、单字识图文扫描、预处理、单字识别、后处理以及文档输出别、后处理以
18、及文档输出等五个环节,如图等五个环节,如图12-612-6所示。所示。图12-6 OCR的基本工作原理示意 12.3.2 12.3.2 手写识别技术手写识别技术 手写识别通过手写识别通过提取手写内容的结构特征来分割和识别字提取手写内容的结构特征来分割和识别字符符,从而达到手写输入的目的。,从而达到手写输入的目的。1 1、手写输入、手写输入 手写输入是把要输入的字符写在一块叫书写板的数字手写输入是把要输入的字符写在一块叫书写板的数字化设备上,这种设备将笔尖走过的轨迹按时间采样后发送到化设备上,这种设备将笔尖走过的轨迹按时间采样后发送到计算机中,通过手写识别技术,将手写内容识别成相应的字计算机中,
19、通过手写识别技术,将手写内容识别成相应的字符内容(如汉字、数字、字母等),从而达到手写输入的目符内容(如汉字、数字、字母等),从而达到手写输入的目的。的。2 2、手写识别、手写识别 就汉字识别而言,其方法基本上分为就汉字识别而言,其方法基本上分为统计识别统计识别、结构识别结构识别以及以及神经网络神经网络方法等几大类。大量的联机方法等几大类。大量的联机手写识别系统采用的都是结构识别方法。手写识别系统采用的都是结构识别方法。结构识别方法:结构识别方法:其出发点是汉字的组成结构,从汉字的构成上讲,汉其出发点是汉字的组成结构,从汉字的构成上讲,汉字是由笔划字是由笔划(点、横、竖、撇、捺等点、横、竖、撇
20、、捺等)、偏旁、部首构成,、偏旁、部首构成,通过把复杂的汉字模式分解为简单的子模式直至基本模式通过把复杂的汉字模式分解为简单的子模式直至基本模式元素,对子模式的判定,以及基于符号运算的匹配算法,元素,对子模式的判定,以及基于符号运算的匹配算法,达到对复杂模式的识别达到对复杂模式的识别。3 3、影响识别率的因素、影响识别率的因素目前影响识别率的因素主要有以下几个方面:目前影响识别率的因素主要有以下几个方面:1 1)笔顺问题)笔顺问题 2 2)连笔问题)连笔问题 3 3)相似字区分)相似字区分 4 4)对抗干扰能力的要求)对抗干扰能力的要求12.4 12.4 语音识别技术语音识别技术12.4.1
21、12.4.1 语音识别技术简介语音识别技术简介 语音识别(语音识别(ASR ASR:Automatic Speech RecognitionAutomatic Speech Recognition)技术,技术,是指通过计算机的识别和理解过程,将语音信号转是指通过计算机的识别和理解过程,将语音信号转换为相应的文字信息,从而识别说话人的语音指令以及文换为相应的文字信息,从而识别说话人的语音指令以及文字内容的技术字内容的技术。语音识别是一个多学科交叉的研究领域,涉及语言学、语音识别是一个多学科交叉的研究领域,涉及语言学、认知科学以及计算机科学等多个学科。认知科学以及计算机科学等多个学科。语音识别技术
展开阅读全文