跨媒体检索技术培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《跨媒体检索技术培训课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 媒体 检索 技术培训 课件
- 资源描述:
-
1、摘要摘要v摘要当前多媒体信息检索技术正从基于内容特征相似性的单一媒体检索发展到基于多种媒体综合检索,实现跨媒体信息检索提出了多种跨媒体信息检索的系统结构,在分析各种媒体信息检索的基础上,设计并实现跨媒体搜索引擎及其查询分解策略和检索结果融合方法等。v关键词:多媒体;跨媒体;信息检索;检索机制11/4/20221跨媒体检索技术跨媒体检索技术跨媒体检索技术v第一章第一章 绪论绪论v在数字信息时代,人们对信息的需求表现出前所未有的强烈。单一形式的传播媒介不能满足受众的需求时,跨媒体传播便应运而生了。由于新技术(尤其是网络技术)的迅速发展也为跨媒体传播提供了必要的技术保障。v随着媒体每时每刻渗入到人们
2、生活每个角落,人类从来没有感觉到媒介技术的力量如此巨大,以至于它能极大地改变和影响着现代人的生活,各种媒体为了寻求更好的生存环境和发展它们必定之间会合作、共生、互动与协调,这正是跨媒体传播的市场动因。v传媒一体化与合作化倾向正在成为历史潮流。跨媒体传播只是这种一体化与合作化的外部表象。许多传媒巨子不仅插手各种传播领域,也将传播范围覆盖到全世界。澳大利亚的默多克新闻集团、美国的CNN(美国有线电视新闻广播公司),英国的BBC等都是世界上传媒领域的大型“航空母舰”。在跨媒体传播方面,它们是最早的实践者,也是最大的受益者。v由于跨媒体的业务不断地扩张,基于跨媒体检索的方法也越来越多,本文着重介绍基于
3、内容相关性的跨媒体检索方法。11/4/20222跨媒体检索技术v第二章第二章 一种基于内容相关性的跨媒体检索方法一种基于内容相关性的跨媒体检索方法v跨媒体信息检索系统结构跨媒体是在多媒体的基础上,利用各种媒体的形式和特征,对相同或相关的信息用不同的媒体表达形式进行处理,由此而产生存储、检索和交换等活动.在跨媒体信息环境下,用户提交一种媒体对象作为查询示例,检索系统不但可以返回相同种类的相似对象,而且还能返回不同种类的其他媒体对象,如利用图像示例检索语义相关的音频或视频片段等。v跨媒体信息检索系统需要最大限度地挖掘不同媒体之间相互表达、相互补充的语义关联性和协同效应,通过智能推理重构和新生知识,
4、构建有效存储、管理和检索跨媒体信息的模型和系统.跨媒体信息检索的系统结构如图1所示,它包括跨媒体搜索引擎、跨媒体综合处理、数据存储和用户接口等模块。11/4/20223跨媒体检索技术11/4/20224跨媒体检索技术v2.1 相关性介绍相关性介绍v相同语义、不同模态的媒体数据在底层特征上具有潜在相关性,例如,“松鼠”图像的视觉特征和“松鼠”音频的听觉特征在统计意义上存在一定相互关联。采用典型相关分析(Canonical Correlation Analysis CCA)方法挖掘这种不同模态之间的典型相关性。v两个变量场与之间的相关性定义如下:设有个样本、个变量组成的变量场,记为,另有个样本、个
5、变量组成的变量场,以最大限度地提取与之间相关性的主要特征为准则,从中提取组合变量,从中提取组合变量,如下所示:(1)v其中,为空间特征向量,又称为典型变量。按式(1)把具有较多个变量的变量场与之间的相关化为较少组合变量与间的相关,通过,的数值分布来确定与的空间相关分布形式,而,的数值大小则表示了所对应变量的重要程度。于是问题归结为如何求解典型变量,。定义相关系数为,在式(3)的约束下,使相关系数最优化 Xp mWn pn mXM,Yq mWn qn mYMmp mq 11/4/20225跨媒体检索技术v (2)v (3)v其中式(2)的表示和构成的协方差矩阵。结合式(2)和(3),使用拉格朗日
6、乘子法可以得到,即将最优化问题转换为形如的特征根问题,并进一步根据式(1)得到最小变量组合,以最大限度地揭示,之间的相关性。,TXXYYTTXXXXYYYYW C Wr L MW CW W C W1TTTYYv MM MM Y YW11/4/20226跨媒体检索技术v2.2 同构子空间的映射同构子空间的映射v给定多个语义类别的图像和音频作为训练数据,设已知语义类别的个数为,未知每幅图像和每段音频例子与语义类别之间的所属关系,可以采用如下所示的半监督式相关性保持映射方法构建同时容纳图像和音频对象的同构子空间。v半监督式相关性保持映射。v1、对每个语义类别,随机选择一些图像和音频进行语义标注;v2
7、、分别求出,聚类质心,;v3、分别以,为初始质心对图像数据集和音频数据集进K-Means聚类;v4、聚类结果中与初始聚类质心划分到相同类别的图像被赋予与相同的语义;v5、聚类结果中与初始聚类质心划分到相同类别的音频被赋予与相同的语义;v6、对每个语义类别中所有图像和音频数据提取视觉特征矩阵X和听觉特征矩阵Y,计算X,Y之间的典型变量,以此为基向量映射得到低维子空间。v上述方法在只对少量图像和音频数据进行语义v标注的情况下,通过K-Means聚类划分语义类别,分别求取每个类别的视觉和听觉典型变量,将典型变量映射得到的子空间命名为CCA子空间。11/4/20227跨媒体检索技术v2.3 CCA子空
8、间中的跨媒体检索子空间中的跨媒体检索v2.3.1不同模态间的相关性度量不同模态间的相关性度量v设表示初始的视觉特征向量,表示初始的听觉特征向量。经过半监督式的相关性保持映射后生成大量复数,定义经过子空间映射后的向量为,同理可得对应CCA子空间中的映射结果。由于存在大量复数而无法直接在CCA子空间S*中计算距离,因此,将子空间中每一维上的坐标值转换为极坐标形式:v (4)v对也用式(4)的方法进行变换,则图像和音频之间的距离定义为每一维上极坐标距离的平方和的2次方根,即v (5)vv从而,对于用户提交的图像查询例子R,可以采用计算子空间中图像与音频对象之间的距离以衡量跨媒体相关性大小。然而,由于
9、语义鸿沟的存在,子空间的映射过程虽然保留了视觉和听觉特征间的典型相关性,但是的计算结果不能准确反映整个数据集范围内的跨媒体语义关系。因此,需要对的结果进行修正,定义修正后的跨媒体相关性为v (6),ikikikxx22/,ikikarctg b axab1,2cosmijikjkikjkikjkkCCAdis x ysqrtxyxy,ijijijCrossCor xjCCAdis xjxj11/4/20228跨媒体检索技术v其中修正因子,表示子空间中不同模态样本之间与真实的跨媒体语义关系之间的差值。初始化为0,并在基于增量学习的相关反馈过程中通过提取用户交互中的先验知识进行更新。v2.3.2基
10、于增量学习的相关反馈基于增量学习的相关反馈v相关反馈方法的使用可以结合用户的感知先验知识,以修正查询向量和整个数据集的拓扑关系,从而提高查询效率。基于增量学习的跨媒体相关反馈作用于子空间,而不是初始的视觉和听觉特征空间。因此,子空间中数据集的分布关系直接影响反馈算法的设计和效率。子空间是基于相关性保持映射而得到的,这种相关性保持特性使得图像和音频数据在子空间中形成一定的聚类效果,因此我们有如下假设:v假设,在子空间中,相似语义、相同模态的媒体对象分布在比较集中的区域。基于上述假设,以增量学习方式传播相关反馈中的跨媒体语义信息,修正图像和音频数据集在子空间中的拓扑结构,同时更新修正因子的取值,使
11、得式(6)的计算结果更准确地反映图像和音频对象在语义上的跨媒体相关程度。设R为提交的图像查询例子,用户对返回的音频例子进行评判。得到音频正例集合P和音频负例集合N,相关反馈11/4/20229跨媒体检索技术v2.3.3 新媒体对象在新媒体对象在CCA子空间中的定位子空间中的定位v为了实现“新”媒体对象在子空间中的定位,需要结合用户反馈中的先验知识。设“新”媒体对象为Z,如果可以准确计算出Z的坐标,则以Z为查询例子的跨媒体检索可以用上述方法实现3。Z的坐标的计算如下:v(1)提取Z的底层特征,使用欧氏距离,检索与Z同模态的媒体对象数据库,找到Z的K-近邻作为返回结果;v(2)用户标注两个反馈正例
展开阅读全文