书签 分享 收藏 举报 版权申诉 / 54
上传文档赚钱

类型数字视频处理第7章三维视频处理课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:5138873
  • 上传时间:2023-02-14
  • 格式:PPT
  • 页数:54
  • 大小:561.02KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《数字视频处理第7章三维视频处理课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    数字视频 处理 三维 视频 课件
    资源描述:

    1、第第7章章 三维视频处理三维视频处理 三维视频编码就对三维视频信号进行处理,即在普通二维视频图像信息的基础上增加深度信息,以更逼真地描述现实世界。7.1 立体感觉立体感觉 大量的立体视觉实验表明,人在观看空间物体时不论单眼或双眼都可以产生立体视觉,只是用单眼观看的辨别精度比用双眼时差,主体感较弱。因此,立体视觉有两大类两大类即:单眼立体信息和双眼立体信息。7.1.1 单眼立体信息单眼立体信息1)调节2)单眼运动视差3)视网膜像的相对大小4)线性透视5)视野6)光和阴影7)空气透视8)重叠7.1.2 双双眼立体信息眼立体信息 用双眼观看空间景物时,形成立体视觉的因素称为双眼立体信息双眼立体信息。

    2、双眼立体信息是人眼立体视觉的重要因素,包括双眼视差和辐辏。1 1双眼视差双眼视差 人眼在观看三维空间物体的时候,会产生立体感,也就是说人们不仅能够感觉到空间物体之间的距离,也能够感觉到空间物体与自己之间的距离。此外,即使是左、右两眼都能看到的前平面和上平面,在左、右眼视网膜上所成的像也稍有差异。图7-1 双目视差形成立体感觉 2 2辐辏辐辏 人用双眼观看物体时,如果物体所成的像不是落在左、右两眼视网膜的对应点上,那么所看到的是二重像(也称复像)。使这种二重像成为单像,在生理光学中称为融合。融合时,眼球必须作旋转运动。眼球的这种旋转运动被称为辐辏辐辏。图7-2 双眼辐辏的产生 图7-3 深度灵敏

    3、度与视距关系 对三维视频编码而言,深度感觉是一个非常对三维视频编码而言,深度感觉是一个非常重要的信息,人类视觉系统的重要的信息,人类视觉系统的深度感觉特性深度感觉特性是设计三维视频采集和显示系统的依据。是设计三维视频采集和显示系统的依据。7.2 7.2 立体成像原理立体成像原理 上一节讨论了视差的定义和人类视觉系统对三维视频图像的一些感觉特性,本节讨论视差和深度的关系,这是三维视频编码的理论基础之一。7.2.1 平行摄像机配置平行摄像机配置 (a)三维视图 (b)X-Z截面视图 图图7-4 平行摄像机配置平行摄像机配置 图7-5 平行配置时摄像机空间坐标与成像平面坐标关系 视差矢量为)0,()

    4、,(),(),(ZFByyxxddZYXdrlrlyx 在世界坐标系内坐标为 xrldxxBX2)(xdByY xdFBZ 7.2.2 会聚摄像机配置会聚摄像机配置 (a)三维视图 (b)X-Z截面视图图图7-6 会聚摄像机配置会聚摄像机配置 PlPrPBlCrCwClXlYlZwXwYwZrXrYrZwZrZlZlCrCwCPlxrxC CI I、C Cr r、C CW W的坐标满足的坐标满足 2/sin02/coscos0sin010sin0cosBBZYXZYXlll2/sin02/coscos0sin010sin0cosBBZYXZYXrrrcossin)2/(sincos)2/(ZB

    5、XZBXFxlcossin)2/(ZBXYFylcossin)2/(sincos)2/(ZBXZBXFxrcossin)2/(ZBXYFyr7.37.3视差估计视差估计 所谓视差估计视差估计,就是对右图中的每个像素,找到左图中与它“同源”的像素(以左图预测右图)。7.3.1 7.3.1 视差场的规律视差场的规律1偏振约束2空间相关性3时间相关性4水平方向性约束7.3.2 7.3.2 视差估计的方法视差估计的方法 用于视差估计主要有基于块的方法和基于网格的方法,二者既可以应用于基于变换的三维视频编码,加以处理后也可以应用于基于对象的三维视频编码。1.基于块的视差估计基于块的视差估计 基于块的视差

    6、估计首先把右图划分为适当大小的块,然后根据某种误差准则,在左图的搜索范围内为右图的每一个块寻找最优匹配的块,得到块的视差矢量。误差准则误差准则 均方误差准则 MSE=xl(i,j)-xr(i,j)2 修改 空间局部平滑特性:同一物体,其各个部分的视差应当是接近的 SMSE=xl(i,j)-xr(i,j)2+a|d-d|2 为当前块的一次因果邻域,共包含3块 a为加权系数,d,d 分别为当前块和邻域 块的视差矢量ABCD图7-9 一次因果邻域块块大小的确定块大小的确定 固定块的视察估计算法(FSBM):块大小为88或1616比较好 可变块尺寸匹配算法(VSBM):平坦区以大的块为单位进行视差估计

    7、,在非平坦区以小的块进行视差估计 分级块匹配算法(HBM):首先用大的块对整幅图像进行视差估计,然后检查每个块,将其归入估计成功和估计不成功两类;估计不成功的块则减小块的大小,再一次进行视差估计,直到所有块均估计成功或者已经到达设定的最小块尺寸为止。混合块匹配算法混合块匹配算法 VSBM匹配效果好,但是计算复杂度较大,而且也不能保证各个大小不定的块可以不重合的覆盖整个图像。混合块匹配算法结合固定尺寸和自适应尺寸算法各自的优点。步骤:(1)将图像划分为1616的宏块,对每个宏块计算其最佳的视差矢量,作为块中每一个像素的视差矢量。(2)对每一个宏块,根据e=fr(x,y)-fl(d,y)计算其视差

    8、补偿预测图像的误差e,式中d是该宏块的视差矢量。(3)取所有宏块平均误差的一半作为阈值T,根据 0,eT 1,eT 为每一个宏块做标记sign。(4)对上述标记为1的所有宏块,以其近似中心点(1616 宏块无中心点)建立一个33的基本窗口,按照窗口自适应扩张策略,以该窗口所在宏块为边界,扩张得到最后的矩形窗口。(5)对上述得到的矩形窗口重新进行匹配,得到的视差矢量作为该窗口中所有像素的视差矢量。处于当前宏块而不在矩形窗口内的像素,仍然使用步骤(1)中的视差矢量。(6)对矩形窗口的形状大小和视差矢量、其他像素的视差矢量等进行编码,获得码流。(7)重复步骤(4)(6),直到所有宏块处理完毕。sig

    9、n=2.基于网格的视差估计基于网格的视差估计 基于网格的视差估计首先给出网格节点(亦称特征点)的视差矢量,然后通过插值的方法获得其他像素点的视差矢量。网格的自适应确定和搜寻网格匹配节点是基于网格的视差估计的关键。网格的确定网格的确定 Delaunay三角形网格(DT)对于一个二维平面上给定的数据点集P1,P2,,Pn (1)对每一个点Pi定义区域Vi,使该区域内所有点与Pi的距离都小于与其他数据点集内的距离,即 d(Pi,p)=mind(Pj,p),j=1,2,n,pVi 显然,所有区域恰好不重合地覆盖了整个二维平面。(2)把所有存在共同边界线段的数据点连接起来得到DT网格,即若Vi与Vj存在

    10、公共边界,连接Pi与Pj图7-11 采用DT网格分割图像 7.3.3 7.3.3 视差估计的快速算法视差估计的快速算法1.利用视差矢量时空相关性的快速估计算法2.利用视差矢量、运动矢量相关性的快速估计算法 图7-13 基于视差矢量空间相关性快速算法实验结果(为全搜索法结果,为快速算法结果)图7-14 视差矢量与运动矢量相关性 7.3.4 7.3.4 视差估计残差图像的编码视差估计残差图像的编码1.基于小波变换的立体残差图像编码基于小波变换的立体残差图像编码 2.基于基于DCT的立体残差图像编码的立体残差图像编码 图7-15 基于小波变换的残差图像编码 图7-16 立体残差图像自适应DCT变换算

    11、法框图 图7-17 垂直扫描顺序 7.4 7.4 三维变换编码三维变换编码 三维变换编码对左通道图像(左视图)采用结合运动估计的变换编码,把每帧图像划分为宏块,每个宏块一个运动矢量,可以把图像作为I、P、B三种类型进行编码。图图7-18 基于变换的三维视频编码器基于变换的三维视频编码器 图7-19 MPEG-2立体视频编码图像结构 图7-20 多模式选择立体视频编码算法 7.5 7.5 基于对象的三维编码基于对象的三维编码 与二维编码相似,基于对象的三维视频编码比基于像素的编码更有潜力,能获得更高的编码效率。基于对象的三维视频编码的基本原理如图7-21所示.图7-18 基于对象的三维视频编码结

    12、构 7.6 7.6 基于模型的三维编码基于模型的三维编码 基于模型的三维编码与基于知识的编码非常类似,适用于场景中的大部分可能对象均已知的情况。由此可对每个可能的对象建立各自的模型,编码器不断的检测场景,当发现已有独立模型的对象时,就对它应用其独立模型进行处理。7.7 7.7立体视频显示技术立体视频显示技术7.7.1 1 借助辅助工具的立体显示技术借助辅助工具的立体显示技术 借助辅助工具的立体显示技术主要有分色式立体显示技术、偏光式立体显示技术和快门式立体显示技术。图7-22分色式立体电视系统的组成 图7-23偏振式立体电视系统的组成 图7-24快门式立体电视系统的组成 7.7.2 2 自由立

    13、体显示技术自由立体显示技术 自由立体显示技术主要有视差栅格技术、柱面透镜技术、数字微镜反射技术、分像素衍射技术、像素针孔阵列技术等.图7-25 视差栅格立体显示原理 图7-26 自动跟踪观众位置的视差栅格立体显示系统 图图7-27 柱面透镜技术原理柱面透镜技术原理 7.7.3 真实三维立体显示技术真实三维立体显示技术 真三维立体显示技术则采用在空间中直接形成三维图像的方法,克服了基于视差的立体显示技术的缺点,它允许多个观看者从任意角度像观看真实物体一样观看视频。真三维立体显示技术主要包括纵深再现显示技术和全息显示技术两大类。图7-28 新型的DepthCube立体显示系统结构图 图图7-29 Actuality三维立体显示器三维立体显示器

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:数字视频处理第7章三维视频处理课件.ppt
    链接地址:https://www.163wenku.com/p-5138873.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库