04人机交互技术III课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《04人机交互技术III课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 04 人机交互 技术 III 课件
- 资源描述:
-
1、Lecture 424.4 多通道用户界面 n为适应目前和未来的计算机系统要求,人机界面应能支持时变媒体(time-varing media),实现三维、非精确及隐含的人机交互,而多通道人机界面是达到这一目的的重要途径。n80年代后期以来,多通道用户界面(Multimodal User Interface)成为人机交互技术研究的崭新领域,在国内外受到高度重视。Lecture 434.4多通道用户界面n多通道用户界面的研究是为了消除当前WIMP/GUI用户界面通信带宽不平衡的瓶颈,综合采用视线、语音、手势等新的交互通道、设备和交互技术,使用户利用多个通道以自然、并行、协作的方式进行人机对话,通过
2、整合来自多个通道的、精确的和不精确的输入来捕捉用户的交互意图,提高人机交互的自然性和高效性。多通道人机界面概念模型 Lecture 44n多通道人机界面主要解决科学计算可视化、虚拟现实对计算机系统提出的高效、三维和非精确的人机交互要求。n在多通道人机界面中,用户可以使用自然的交互方式,如语音、手势、眼神、表情等与计算机系统进行协同工作。n交互通道之间有串行/并行、互补/独立等多种关系,因此人机交互方式向人与人的交互方式靠拢,交互的自然性和高效性得到极大的提高。4.4多通道用户界面Lecture 454.4多通道用户界面n多通道用户界面主要关注人机界面中用户向计算机输入信息以及计算机对用户意图的
3、理解,所要达到的目标可归纳为如下方面:q(1)交互的自然性n使用户尽可能多地利用已有的日常技能与计算机交互,降低认识负荷;q(2)交互的高效性n使人机通讯信息交换吞吐量更大、形式更丰富,发挥人机彼此不同的认知潜力;q(3)与传统的用户界面特别是广泛流行的WIMP/GUI兼容。Lecture 464.4.1多通道用户界面的基本特点 n使用多个感觉和效应通道 n允许非精确的交互 n三维和直接操纵 n交互的双向性 n交互的隐含性 Lecture 474.4.1多通道用户界面的基本特点n1.使用多个感觉和效应通道q感觉通道侧重于多媒体信息的接受,效应通道侧重于交互过程中控制与信息的输入,两者密不可分、
4、相互配合。q一种通道(如语音)不能充分表达用户的意图时,需辅以其它通道(如手势指点)的信息;有时使用辅助通道以增强表达力。q交替而独立地使用不同的通道不是真正意义上的多通道技术,必须允许充分地并行、协作的通道配合关系。Lecture 484.4.1多通道用户界面的基本特点n2.允许非精确的交互q人类语言本身就具有高度模糊性,人类在日常生活中习惯于并大量使用非精确的信息交流;q允许使用模糊的表达手段可以避免不必要的认识负荷,有利于提高交互活动的自然性和高效性;q多通道人机交互技术主张以充分性代替精确性。Lecture 494.4.1多通道用户界面的基本特点n3.三维和直接操纵q人类的大多数活动领
5、域具有三维和直接操纵特点(数学的和逻辑的活动例外);q人生活在三维空间,习惯于看、听和操纵三维的客观对象,并希望及时看到这种控制的结果;q多通道人机交互的自然性反应了这种本质特点。Lecture 4104.4.1多通道用户界面的基本特点n4.交互的双向性q人的感觉和效应通道通常具有双向性的特点,如视觉可看、可注视,手可控制、可感触等;q多通道用户界面使用户避免生硬的、不自然的、频繁的、耗时的通道切换,从而提高自然性和效率;q视线跟踪系统可促成视觉交互双向性,听觉通道利用三维听觉定位器实现交互双向性。nEg:三维虚拟声音可使声响效果随用户头和身体的运动而改变n视觉通道交互双向性表现在眼睛既可以接
6、收视觉信息,又可以通过注视输入信息,形成视觉交互。Lecture 4114.4.1多通道用户界面的基本特点n5.交互的隐含性q追求交互自然性的多通道用户界面并不需要用户显式地说明每个交互成分,反之是在自然的交互过程中隐含地说明。q例如,用户的视线自然地落在所感兴趣的对象之上;又如,用户的手自然地握住被操纵的目标。Lecture 4124.4.2多媒体技术 n定义q多媒体(multimedia)的含义是使用计算机交互式综合技术和数字通信网技术处理多种表示媒体,如文本、图形、图像和声音,使多种信息建立逻辑连接,集成为一个交互系统。Lecture 4134.4.2多媒体技术n多媒体技术的组成部分包括
7、:q存储与访问技术;q表现与表达技术;q实时处理技术;q接口技术;q人机交互界面技术等。Lecture 4144.4.2多媒体技术n多媒体技术与人机交互技术q多媒体技术使人机交互技术最终要向着更接近于人的自然方式发展,使计算机具有听觉和视觉,以更自然的方式与人交互。q多媒体技术引入了动画、音频、视频等动态媒体,大大丰富了计算机表现信息的形式,拓宽了计算机输出的带宽,提高了用户接受信息的效率,使人们可以得到更直观的信息,从而简化了用户的操作,扩展了应用范围。Lecture 4154.4.2多媒体技术q它能提高人对信息表现形式的选择和控制能力。q能提高信息表现形式与人的逻辑和创造能力的结合程度,在
8、顺序、符号信息以及并行、联想信息方面扩展人的信息处理能力。q多媒体信息比单一媒体信息对人具有更大的吸引力,有利于人对信息的主动探索而不是被动接受。q另外,由于多媒体所带来的信息冗余性,重复使用别的媒体或并行使用多种媒体可消除人机通信过程中的多义性及噪声。Lecture 4164.4.3虚拟现实技术 n虚拟现实(Virtual Reality)q又称虚拟环境(Virtual Environment)。q虚拟现实系统向用户提供沉浸(immerse)和多感觉通道(multi-sensory)体验。q在虚拟现实中,人是主动参与者,复杂系统中可能有许多参与者共同在以计算机网络系统为基础的虚拟环境中协同工
9、作。n虚拟现实系统具有三个重要特点:q沉浸感(Immersion)q交互性(Interaction)q构想性(Imagination)Lecture 4174.4.3虚拟现实技术n虚拟现实中的基本要素:q计算机生成的虚拟世界(环境)必须是一个能给人提供视觉、听觉、触觉、嗅觉以及味觉等多种感官刺激的世界。目前虚拟现实通常由视觉、听觉和触觉三种刺激构成。q虚拟现实系统实质上是一种高级的人机交互系统。这里的交互操作是对多通道信息进行的,并且对沉浸式系统要求采用自然方式的交互操作,对于非沉浸式系统也可使用常规交互设备进行交互操作。Lecture 418虚拟世界的概念模型n虚拟世界的概念模型q虚拟现实是
10、人们可以通过视、听、触等信息通道感受到设计者思想的用户界面,由两部分组成:一部分是创建的虚拟世界(环境),另一部分是为介入者(人);q虚拟世界的核心是强调两者之间的交互操作,即反映出人在虚拟世界(环境)中的体验;q人机交互是虚拟现实的核心。介入者感知系统反应系统虚拟世界(环境)感官刺激信号反应动作Lecture 419虚拟现实的概念模型n理解虚拟现实的概念模型q从虚拟环境对人的作用来看,虚拟现实的概念模型可以看作为“显示/检测”模型。q从人对虚拟环境的作用来看,也就是从用户的角度看,上述概念模型可以看作“输入/输出”模型。n输入是指用户感知系统接受虚拟环境提供的各种感官刺激信号;n输出是指用户
11、对虚拟环境系统做出的反映动作。Lecture 420虚拟现实与多媒体及多通道q虚拟现实技术正是一种以集成为主的技术,其人机界面可以分解为多媒体、多通道界面。q从本质上说,多媒体用户界面技术侧重解决计算机信息表现及输出的自然性和多样性问题,而多通道技术侧重解决计算机信息输入及理解的自然性和多样性问题。4.4.4眼动跟踪(Eye-Gaze Tracking)n与视觉有关的人机交互自始至终都离不开视线的控制。n如果能通过用户的视线盯着感兴趣的目标,计算机便“自动”将光标置于其上,人机交互将更为直接,也省去了上述交互过程中的大部分步骤。n有关视觉输入的人机界面研究主要涉及两个方面q一是视线跟踪原理和技
12、术的研究;q二是在使用这种交互方式后,人机界面的设计技术和原理的研究。4.4.4眼动跟踪n早期的视线跟踪技术首先应用于心理学研究、助残等领域,后来被应用于图像压缩及人机交互技术。n视线追踪主要用于军事领域(如飞行员观察记录),阅读及帮助残疾人通信等。n视线跟踪技术有强迫式与非强迫式、穿戴式与非穿戴式、接触式与非接触式之分。nthe typical pattern of eye movement during readingYarbus(1967)Stanford University和The Poynter Institute合作研究人们对于Internet上新闻的注意程度 内 容注视率文章文
13、字(Articles text)92%简讯(Briefs)82%照片(Photos)64%标题广告(Banner Ads)45%图形(graphics)22%眼动跟踪用于图像抽象其他应用n广告效用测试n汽车驾驶模拟n婴幼儿行为分析1.眼动的主要形式 n眼动有三种主要形式(在人机交互中,眼动跟踪主要利用跳动和注视:q跳动(Saccades)n在正常的视觉观察过程中,眼动表现为在一系列被观察目标上的停留及在这些停留点之间的飞速跳跃。n在注视点之间的飞速跳跃称为眼跳动。q注视(Fixations)n停留时间至少持续100ms以上的称为注视。在注视中,眼也不是绝对静止不动,会有微小运动,但大小一般不会
14、超过1视角。n绝大多数信息只有在注视时才能获得并进行加工。q平滑尾随跟踪(Smooth Pursuit)n缓慢、联合追踪的眼动通常称为平滑尾随跟踪。2.眼动跟踪的基本要求 n在人机交互中眼动跟踪技术必须满足以下几点要求,才能满足实际需求:q不能妨碍视野;q不要与用户接触,对用户基本无干扰;q精度要高;q动态范围要从1弧分(六十分之一弧度)到45;q反映速度要快,实时响应;q能与获取的身体和头部运动相配合;q定位校正简单;q可作为计算机的标准外设。3.眼动跟踪的基本原理 n用红外摄像机摄取受试者眼睛图像,经过MPEG编码后送入计算机进行图像数据采集分析,实时计算出眼珠的水平和垂直运动的时间、位移
15、距离、速度及瞳孔直径、注视位置。n数据处理的目的是滤除噪声、识别定位及局部校准与补偿等,最重要的是提取出用于人机交互所必需的眼睛定位坐标。n但是由于眼动存在固有的抖动,以及眼睛眨动、头部剧烈的移动所造成的数据中断,存在许多干扰信号,提取有意眼动数据非常困难。解决此问题的办法之一是利用眼动的某种先验模型加以弥补。3.眼动跟踪的基本原理 n人眼的注视点由头的方位和眼睛的方位两个因素决定n1)以硬件为基础的视线跟踪技术q利用图像处理技术,使用能锁定眼睛的眼摄像机,通过摄入从人眼角膜和瞳孔反射的红外线连续地记录视线变化,从而达到记录分析视线跟踪过程的目的。需要用户戴上特制的头盔或者使用头部固定支架,对
16、用户的干扰很大。n(2)以软件为基础的视线跟踪技术q先利用摄像机获取人眼或脸部图像,然后用软件实现图像中人脸和人眼的定位与跟踪,从而估算用户在屏幕上的注视位置。4.主要的眼动测量方法 n(1)瞳孔-角膜反射向量法(基于注视点)q通过固定眼摄像机获取眼球图像,利用亮瞳孔和暗瞳孔的原理,提取出眼球图像内的瞳孔,利用角膜反射法校正眼摄像机与眼球的相对位置,把角膜反射点数据作为眼摄像机和眼球的相对位置的基点,瞳孔中心位置坐标就表示视线的位置。设置头镜校正眼摄像机一看距离,二看高度,三看偏斜,四看中心,五看焦距。n(2)眼电图法(EOG)基于眼动力学q眼球在正常情况下由于视网膜代谢水平较高,因此眼球后部
17、的视网膜与前部的角膜之间存在着一个数十毫伏的静止电压,角膜区为正,视网膜区为负。当眼球转动时,眼球的周围的电势也随之发生变化;将两对氯化银皮肤表面电极分别置于眼睛左右、上下两侧,就能引起眼球变化方向上的微弱电信号,经放大后得到眼球运动的位置信息。眼动测量方法 比较5.米达斯接触问题与解决方法n“米达斯接触(Midas Touch)”问题:q如果鼠标器光标总是随着用户的视线移动,可能会引起用户的厌烦,因为用户可能希望能随便看着什么而不必非“意味着”什么,更不希望每次转移视线都可能启动一条计算机命令。n避免“米达斯接触”问题的方法:在理想情况下,应当在用户希望发出控制时,界面及时地处理其视输入,而
18、在相反的情况下则忽略其视线的移动。n可采用其他通道(如键盘或语音)进行配合。ASL H-BN 6 型高速双目眼动系统n用来测量被试眼睛相对于头部的注视线。记录的数据包括时间、眼睛位置的x、y轴坐标以及瞳孔直径。能够识别注视,画出扫描模式,让用户在场景上定义感兴趣区域。n性能:q采样和输出速率:60Hz、120Hz和240Hz,无分辨率损失q测量原理:瞳孔-角膜反射q系统精确度:0.5度视角范围q分辨率:0.25度视角q头部移动:不受限制q视觉范围:水平50,垂直40q 重量(包括头箍、2个光学模块、2个单片镜片和场景摄像头组件):567克 ASL R6 型单目眼动系统n用于所提供的刺激物限于单
19、一平面(如计算机或视频监视器),且被试不希望用头戴式光学系 统的场合。该系统允许被试头部在约 1 平方英尺范围内运动,从而减少了对头部的限制。n性能:q采样和输出速率:50或可选60Hz、120Hz和240Hz;q测量原理:瞳孔-角膜反射;q系统精确度:0.5度视角范围;q分辨率:0.25o视角;q头部移动:1平方英尺;q光学系统距眼睛最大距离:40英寸;q视觉范围:水平50度,垂直40度;q尺寸(高/宽/厚):4英寸/5.5英寸/6英寸 重量:2.75磅 4.4.5手势识别(Gesture Recognition)n一个简单的手势蕴涵着丰富的信息,人与人可以通过手势传达大量的信息,实现高速的
20、通信。n将手势运用于计算机能够很好地改善人机交互的效率。n在多数情况下我们笼统地认为手势是人的上肢(包括手臂、手和手指)的运动状态。手势的分类 n交互性手势与操作性手势 q在交互性手势中手的运动表示特定的信息(如乐队指挥),靠视觉来感知;操作性手势不表达任何信息(如弹琴);n自主性手势和非自主性手势 q自主性手势与语音配合用来加强或补充某些信息(如演讲者用手势描述动作、空间结构等信息);n离心手势和向心手势 q离心手势直接针对说话人,有明确的交流意图,向心手势只是反应说话人的情绪和内心的愿望。中国手指字母集n手势样本集为中国手指字母集,共30个字母,如下所示:2002-1-25 43 计算机识
21、别和解释手势n利用计算机识别和解释手势输入是将手势应用于人机交互的关键前提,识别手势的手段有:q鼠标器和笔:n优点是仅利用软件算法来实现,从而适合于一般桌面系统;n缺点是只能识别手的整体运动而不能识别手指的动作。q数据手套:n主要优点是可以测定手指的姿势和手势;n相对而言较为昂贵,并且有时会给用户带来不便。q计算机视觉:n利用摄像机输入手势,优点是不干扰用户,这是一种很有前途的技术;n在技术上存在很多困难,还难以胜任手势识别和理解的任务。主要手势识别技术q模板匹配技术:n一种最简单的识别技术,将传感器输入的原始数据与预先存储的模板进行匹配,通过度量两者之间的相似度完成识别任务。q神经网络技术:
22、n一种较新的模式识别技术,具有自组织和自学习能力,具有分布性特点,抗噪声能力比较强,能处理不完整的模式,并具有模式推广能力。q统计分析技术:n通过统计样本特征向量来确定分类器的一种基于概率的分类方法。在模式识别中一般采用贝叶斯极大似然理论确定分类函数。WsphericalMPPIPDIPVIVIIIIIdirectivedirectivedirectiveflexiveflexiveflexive手模型的关节及运动类型 每一个手指()具有4个自由度,其中手指的基部(MP)有两个自由度,弯曲和旋转;手指的中间关节处(PIP)和末端关节处(DIP)分别各有一个自由度,主要是弯曲运动;大拇指除了与其
23、它4个手指一样具有4个自由度外,即其绕食指为轴的旋转运动和弯曲运动,它还有一个外展运动,所以大拇指具有5个自由度;手掌的前后左右运动具有2个自由度。因此,手运动总共具有23个自由度,即状态空间为23维。属性约简(北京航空航天大学)n利用粗集(rough set)理论进行约简实用的手势识别n手势特点:q手是弹性物体,因此同一手势之间差别很大;q手有大量冗余信息,由于人识别手势关键是识别手指特征,因此手掌特征是冗余的信息;q手的位置是在三维空间,很难定位;q手的表面是非平滑的,容易产生阴影。n 目前较为实用的手势识别是基于数据手套。因为数据手套不仅可以输入包括三维空间运动在内的较为全面的手势信息,
24、而且比基于计算机视觉的手势在技术上要容易实现。手势交互系统+从手势交互信息采集的途径是接触式还是非接触式的,或者障碍和非障碍式的,可将手势交互系统划分为基于传感器的和基于视觉的两类交互方式。1.基于传感器的手势交互+按照传感器的类型大致可以分为:加速度传感器、重力传感器、表面肌电信号数字传感器、数据手套等。1.1 加速度传感器+任天堂出品的Wii游戏设备在手柄里安装加速器传感器、陀螺仪和红外线(加速器传感器提供速度和位移数据,陀螺仪提供方位角信息,红外线用于定位,通过自然、直观的动作控制游戏中的方向、速度等操作。图1 Wii游戏1.2 表面肌电信号数字传感器+表面肌电信号数字传感器采集到的表面
25、肌电信号是神经肌肉系统在进行运动时产生的生物电变化经表面电极引导、放大、显示和记录得到的一系列的随时间变化的一维电压信号,可以反映出肌肉的活动状态、强度等信息,如:手臂和关节部位的弯曲度、肌肉阻抗等。1.3 数据手套+基于数据手套的手势输入通常是根据戴在人手上的装配有位置跟踪设备的数据手套利用光纤直接测量手指弯曲和手的位置来实现手势输入。数据手套可以采集手势在空间中的运动、手型和手指关节弯曲度等相关信息,易于携带,受环境影响小,有着较好的可移动性,且采集的信息稳定、丰富。图2 数据手套交互手势2.基于视觉的手势交互n利用视觉信息的手势交互原型系统的构建可以分为两类:n一类是采用颜色标记的手进行
展开阅读全文