书签 分享 收藏 举报 版权申诉 / 19
上传文档赚钱

类型跨媒体检索技术培训课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4019068
  • 上传时间:2022-11-04
  • 格式:PPT
  • 页数:19
  • 大小:401.89KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《跨媒体检索技术培训课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    媒体 检索 技术培训 课件
    资源描述:

    1、摘要摘要v摘要当前多媒体信息检索技术正从基于内容特征相似性的单一媒体检索发展到基于多种媒体综合检索,实现跨媒体信息检索提出了多种跨媒体信息检索的系统结构,在分析各种媒体信息检索的基础上,设计并实现跨媒体搜索引擎及其查询分解策略和检索结果融合方法等。v关键词:多媒体;跨媒体;信息检索;检索机制11/4/20221跨媒体检索技术跨媒体检索技术跨媒体检索技术v第一章第一章 绪论绪论v在数字信息时代,人们对信息的需求表现出前所未有的强烈。单一形式的传播媒介不能满足受众的需求时,跨媒体传播便应运而生了。由于新技术(尤其是网络技术)的迅速发展也为跨媒体传播提供了必要的技术保障。v随着媒体每时每刻渗入到人们

    2、生活每个角落,人类从来没有感觉到媒介技术的力量如此巨大,以至于它能极大地改变和影响着现代人的生活,各种媒体为了寻求更好的生存环境和发展它们必定之间会合作、共生、互动与协调,这正是跨媒体传播的市场动因。v传媒一体化与合作化倾向正在成为历史潮流。跨媒体传播只是这种一体化与合作化的外部表象。许多传媒巨子不仅插手各种传播领域,也将传播范围覆盖到全世界。澳大利亚的默多克新闻集团、美国的CNN(美国有线电视新闻广播公司),英国的BBC等都是世界上传媒领域的大型“航空母舰”。在跨媒体传播方面,它们是最早的实践者,也是最大的受益者。v由于跨媒体的业务不断地扩张,基于跨媒体检索的方法也越来越多,本文着重介绍基于

    3、内容相关性的跨媒体检索方法。11/4/20222跨媒体检索技术v第二章第二章 一种基于内容相关性的跨媒体检索方法一种基于内容相关性的跨媒体检索方法v跨媒体信息检索系统结构跨媒体是在多媒体的基础上,利用各种媒体的形式和特征,对相同或相关的信息用不同的媒体表达形式进行处理,由此而产生存储、检索和交换等活动.在跨媒体信息环境下,用户提交一种媒体对象作为查询示例,检索系统不但可以返回相同种类的相似对象,而且还能返回不同种类的其他媒体对象,如利用图像示例检索语义相关的音频或视频片段等。v跨媒体信息检索系统需要最大限度地挖掘不同媒体之间相互表达、相互补充的语义关联性和协同效应,通过智能推理重构和新生知识,

    4、构建有效存储、管理和检索跨媒体信息的模型和系统.跨媒体信息检索的系统结构如图1所示,它包括跨媒体搜索引擎、跨媒体综合处理、数据存储和用户接口等模块。11/4/20223跨媒体检索技术11/4/20224跨媒体检索技术v2.1 相关性介绍相关性介绍v相同语义、不同模态的媒体数据在底层特征上具有潜在相关性,例如,“松鼠”图像的视觉特征和“松鼠”音频的听觉特征在统计意义上存在一定相互关联。采用典型相关分析(Canonical Correlation Analysis CCA)方法挖掘这种不同模态之间的典型相关性。v两个变量场与之间的相关性定义如下:设有个样本、个变量组成的变量场,记为,另有个样本、个

    5、变量组成的变量场,以最大限度地提取与之间相关性的主要特征为准则,从中提取组合变量,从中提取组合变量,如下所示:(1)v其中,为空间特征向量,又称为典型变量。按式(1)把具有较多个变量的变量场与之间的相关化为较少组合变量与间的相关,通过,的数值分布来确定与的空间相关分布形式,而,的数值大小则表示了所对应变量的重要程度。于是问题归结为如何求解典型变量,。定义相关系数为,在式(3)的约束下,使相关系数最优化 Xp mWn pn mXM,Yq mWn qn mYMmp mq 11/4/20225跨媒体检索技术v (2)v (3)v其中式(2)的表示和构成的协方差矩阵。结合式(2)和(3),使用拉格朗日

    6、乘子法可以得到,即将最优化问题转换为形如的特征根问题,并进一步根据式(1)得到最小变量组合,以最大限度地揭示,之间的相关性。,TXXYYTTXXXXYYYYW C Wr L MW CW W C W1TTTYYv MM MM Y YW11/4/20226跨媒体检索技术v2.2 同构子空间的映射同构子空间的映射v给定多个语义类别的图像和音频作为训练数据,设已知语义类别的个数为,未知每幅图像和每段音频例子与语义类别之间的所属关系,可以采用如下所示的半监督式相关性保持映射方法构建同时容纳图像和音频对象的同构子空间。v半监督式相关性保持映射。v1、对每个语义类别,随机选择一些图像和音频进行语义标注;v2

    7、、分别求出,聚类质心,;v3、分别以,为初始质心对图像数据集和音频数据集进K-Means聚类;v4、聚类结果中与初始聚类质心划分到相同类别的图像被赋予与相同的语义;v5、聚类结果中与初始聚类质心划分到相同类别的音频被赋予与相同的语义;v6、对每个语义类别中所有图像和音频数据提取视觉特征矩阵X和听觉特征矩阵Y,计算X,Y之间的典型变量,以此为基向量映射得到低维子空间。v上述方法在只对少量图像和音频数据进行语义v标注的情况下,通过K-Means聚类划分语义类别,分别求取每个类别的视觉和听觉典型变量,将典型变量映射得到的子空间命名为CCA子空间。11/4/20227跨媒体检索技术v2.3 CCA子空

    8、间中的跨媒体检索子空间中的跨媒体检索v2.3.1不同模态间的相关性度量不同模态间的相关性度量v设表示初始的视觉特征向量,表示初始的听觉特征向量。经过半监督式的相关性保持映射后生成大量复数,定义经过子空间映射后的向量为,同理可得对应CCA子空间中的映射结果。由于存在大量复数而无法直接在CCA子空间S*中计算距离,因此,将子空间中每一维上的坐标值转换为极坐标形式:v (4)v对也用式(4)的方法进行变换,则图像和音频之间的距离定义为每一维上极坐标距离的平方和的2次方根,即v (5)vv从而,对于用户提交的图像查询例子R,可以采用计算子空间中图像与音频对象之间的距离以衡量跨媒体相关性大小。然而,由于

    9、语义鸿沟的存在,子空间的映射过程虽然保留了视觉和听觉特征间的典型相关性,但是的计算结果不能准确反映整个数据集范围内的跨媒体语义关系。因此,需要对的结果进行修正,定义修正后的跨媒体相关性为v (6),ikikikxx22/,ikikarctg b axab1,2cosmijikjkikjkikjkkCCAdis x ysqrtxyxy,ijijijCrossCor xjCCAdis xjxj11/4/20228跨媒体检索技术v其中修正因子,表示子空间中不同模态样本之间与真实的跨媒体语义关系之间的差值。初始化为0,并在基于增量学习的相关反馈过程中通过提取用户交互中的先验知识进行更新。v2.3.2基

    10、于增量学习的相关反馈基于增量学习的相关反馈v相关反馈方法的使用可以结合用户的感知先验知识,以修正查询向量和整个数据集的拓扑关系,从而提高查询效率。基于增量学习的跨媒体相关反馈作用于子空间,而不是初始的视觉和听觉特征空间。因此,子空间中数据集的分布关系直接影响反馈算法的设计和效率。子空间是基于相关性保持映射而得到的,这种相关性保持特性使得图像和音频数据在子空间中形成一定的聚类效果,因此我们有如下假设:v假设,在子空间中,相似语义、相同模态的媒体对象分布在比较集中的区域。基于上述假设,以增量学习方式传播相关反馈中的跨媒体语义信息,修正图像和音频数据集在子空间中的拓扑结构,同时更新修正因子的取值,使

    11、得式(6)的计算结果更准确地反映图像和音频对象在语义上的跨媒体相关程度。设R为提交的图像查询例子,用户对返回的音频例子进行评判。得到音频正例集合P和音频负例集合N,相关反馈11/4/20229跨媒体检索技术v2.3.3 新媒体对象在新媒体对象在CCA子空间中的定位子空间中的定位v为了实现“新”媒体对象在子空间中的定位,需要结合用户反馈中的先验知识。设“新”媒体对象为Z,如果可以准确计算出Z的坐标,则以Z为查询例子的跨媒体检索可以用上述方法实现3。Z的坐标的计算如下:v(1)提取Z的底层特征,使用欧氏距离,检索与Z同模态的媒体对象数据库,找到Z的K-近邻作为返回结果;v(2)用户标注两个反馈正例

    12、,设 的坐标表示为,v则Z的坐标为,其中。v此外,还可以根据反馈正例对应的典型变量实现Z的子空间坐标映射。11/4/202210跨媒体检索技术v2.4 实验结果与分析实验结果与分析 v为了验证上述算法的有效性,我们在Win XP下用VC6。0实现了一个原型系统,支持图像和音频间的跨媒体检索。实验数据集包括10个语义(鸟类、狗、汽车、爆炸、老虎、飞机等等)的多媒体对象,每个语义类别中分别有100幅图像和70段音频数据,其中60幅图像和60段音频例子作为训练数据,其余共400幅图像和100段音频数据作为“新”媒体对象。v以下实验结果中的“平均”是指分别在每个语义类别中随机选择了10个不同的查询例子

    13、,得到检索结果的平均值。v2.4.1 不同方法得到的跨媒体检索结果不同方法得到的跨媒体检索结果v为验证本文方法对图像和音频两种不同模态之间跨媒体检索的有效性,实验根据视觉和听觉的方法分析视觉特征和听觉特征之间的典型相关性,并提取典型变量,映射得到保持相关性的子空间,用式(5)计算图像和音频在子空间中的距离,得出在没有相关反馈情况下的跨媒体检索结果。v实验与传统的PCA、ICA和PLS方法做了对比,分别用这三种方法通过相同的降维映射步骤实现跨媒体检索,过程如下:11/4/202211跨媒体检索技术v(1)计算视觉特征矩阵的子空间基向量,映射得到子空间S1;v(2)同样将听觉特征向量都映射到与S1

    14、相同维数的子空间S2中;v(3)根据图像和音频在S1,S2中的坐标计算两者间的欧氏距离,以度量跨媒体相关性从而实现检索。v图1列出了本文的方法与传统PCA,ICA以及PLS方法得到的跨媒体检索结果,其中查准率和查全率采用与基于内容的图像检索在性能检测时相同的方法计算。11/4/202212跨媒体检索技术v图1中的结果是以图像为查询例子检索音频和以音频为查询例子检索图像得到的平均值。可见,在选择相同的视觉和听觉特征作为输入的情况下,本文方法优于传统的PCA,ICA和PLS方法。这是因为典型变量的计算过程是根据视觉和听觉特征的协方差矩阵分析潜在的跨媒体相关性信息,从而映射得到的子空间可以更好地反映

    15、高层的语义关系;而传统的PCA,ICA和PLS方法虽然已证明在处理单一模态的特征矩阵时十分有效,但是难以挖掘两种不同的特征矩阵之间的潜在关联。v图2是一个具体的跨媒体检索例子,其中输入为一段5.3s的汽车音频,系统根据本文的方法计算相关性大小(见图2中每幅图像下方的数字),并返回前15个相似图像。可见,返回结果中有12幅图像与音频查询例子描述了相同语义。11/4/202213跨媒体检索技术图1没有相关反馈时的跨媒体检索结果对比图2 以汽车的音频为查询例子返回的相似图像 11/4/202214跨媒体检索技术v2.4.2相关反馈对跨媒体检索性能的改善相关反馈对跨媒体检索性能的改善v实验在每轮反馈时

    16、分别提供2个反馈正例和2个反馈负例,并设定基于增量学习的相关反馈算法中参数为:v (7)v由于在新一轮反馈之后的值随着的改变而更新(见第4节中式(6),因此参数可以根据不同的反馈情况而动态更新。v图3显示了当返回结果个数固定为15时,随着相关反馈中用户交互的不断融入,返回结果中正确结果个数的变化过程,包括以音频为查询例子检索图像(I-by-A)和以图像为查询例子检索音频(A-by-I)两部分。可以看到,经过两次相关反馈I-by-A和A-by-I得到的正确结果个数分别比反馈之前提高了44.9%和24.2%,当反馈次数大于等于3时,跨媒体检索结果趋于稳定。由此可见,本文的方法能够快速学习,并修正图

    17、像与音频数据集的拓扑结构,从而有效地提高跨媒体检索效率。Max CrossCorMin CrossCor11/4/202215跨媒体检索技术v2.4.3 相关性保持映射对单模态数据的聚类检测相关性保持映射对单模态数据的聚类检测v上述跨媒体检索结果反映的是全局范围上图像和音频数据集之间的拓扑关系,而在子空间中的单模态检索效率则取决于相关性保持映射得到的局部(即图像数据集内部和音频数据集内部)聚类效果。全局数据关系和局部数据关系在一定程度上相互影响,因此,单模态检索虽然不是本文的研究重点,但是为保持实验的完整性,除了验证全局意义上跨媒体检索的有效性之外,实验还从局部意义上说明了跨媒体检索可达到较好

    18、检索性能的原因。v图4显示了在相关性保持映射得到的CCA子当返回结果个数为35时,图像检索和音频检索结果。11/4/202216跨媒体检索技术第三章第三章 其他的跨媒体检索方法其他的跨媒体检索方法v3.1 基于语义的跨媒体信息检索技术基于语义的跨媒体信息检索技术v多媒体信息检索的传统方法是基于文本描述的,包括各种媒体的属性关键字和人工标注.但是,多媒体信息包含丰富的感知特征,这些感知信息难以用文本反映出来.于是,基于内容的多媒体检索技术应运而生,它们的研究主要集中在通过使用一些低层感知特征对多媒体内容建立索引,从而进行样例相似度检索.v基于内容的跨多媒体检索已获得一定成功,同时也可以应用到跨媒

    19、体信息检索中,但是多媒体信息中包含了丰富的图像、视频和音频等不同模态的媒体,且相互间具有语义关联.那么,是否可以通过语义关联来更好的跨越不同媒体之间存在的界限,使用户只需提交一种媒体的示例就能检索到想要的其他类型的媒体呢?v主要的媒体语义检索技术包括:图像语义检索、视频语义检索、音频语义检索。v3.2 一种支持海量跨媒体检索一种支持海量跨媒体检索v 随着Internet和多媒体技术的不断发展,特别是近几年来,Internet上多媒体信息的爆炸性增长,基于内容的海量多媒体检索成为一个热门的研究领域。11/4/202217跨媒体检索技术v结结 论论v应对社会经济、政治的需要,越来越多的新型传播媒体

    20、将不断涌上历史的舞台。回顾一下信息传播的历史,我们可以看到:从最原始的口头传播,到文字的形成、印刷术的发明,直到今天琳琅满目的电子传播媒介,这是一个非常漫长的历史发展过程。而如今,随着越来越多的传统媒体在网络上开辟出自己的天地,这两者之间的关系找到了新的突破口。无论是传统媒体互相整合成为新兴的媒体集团,还是传统媒体创办新媒体,都预示着“跨媒体”已经成为中国媒体寻求发展的敲门砖。11/4/202218跨媒体检索技术v参考文献:参考文献:v1 蔡平,王志强,傅向华.基于语义的跨媒体信息检索技术研究 J.微电子与计算机,2010-03:v2 庄 毅.一种支持海量跨媒体检索的集成索引结构J.软件学报,

    21、2008,19(10):2667-2680.v3 张 鸿,吴 飞,庄越挺,陈建勋.一种基于内容相关性的跨媒体检索方法J.计算机学报,2008,31(5):820-826.v4 胡 涛,武港山,吉亮.基于Ontology的跨媒体检索技术.计算机工程2009,35(8):266-268.v5 马修军.多媒体数据库与内容检索M.北京:北京大学出版社,2007.7.v6 Snoek C G M,Worring M,Geusebroek J M.Semantic video search engine Proceedings of the TRECVID Workshop.Gaithersburg,US

    22、A,2004:102-105.v7 Hansen L k,Larsen J Kolenda T.on independent component analysis for multimedia signals/Guan L,Kung S Y,Larsen J.Multimedia Image and Video Processing.London:RC Press,2000:175-200.v8 Ma Qiang,Akiyo Nadamoto,Katsumi Tanaka.Complemenry nformation ret-ieval for cross-media news content

    23、.Pro-ceedings of Information Systems,2006,31(7):659-678.v9 Adams W H,Iyengar G,Lin C Y.Semantic indexing multimedia content using visual,audio and text cues.Eurasip Journal on Applied Signal Processing,2003(2):170-185.v10 Joliffe I T.Principal Component Analysis.New York:Springer Verlag,6:74-81.11/4/202219跨媒体检索技术

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:跨媒体检索技术培训课件.ppt
    链接地址:https://www.163wenku.com/p-4019068.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库