C05信息资源的技术手段课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《C05信息资源的技术手段课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- C05 信息资源 技术 手段 课件
- 资源描述:
-
1、第五章第五章 信息资源管理的技术信息资源管理的技术 5.1 信息资源采集技术 5.2 信息资源压缩技术 5.3 信息资源存储技术 5.4 信息资源共享技术 5.1 信息资源采集技术文本文本5.1 信息资源采集技术 5.1.1文本生成 1、键盘录入、键盘录入 智能ABC、紫光、拼音加加、五笔字型 2、语音识别、语音识别 语音特征提取 模式匹配(识别算法)声学模型 语言模型 从说话者与识别从说话者与识别系统的相关性系统的相关性从识别系统的词从识别系统的词汇量大小汇量大小 特定人语音识别系统 非特定人语音系统 多人的识别系统 小词汇量语音识别系统 中等词汇量的语音识别系统 大词汇量语音识别系统5.1
2、 信息资源采集技术识别系统分类识别系统分类从说话的方式从说话的方式孤立词语音识别系统连接词语音识别系统连续语音识别系统5.1 信息资源采集技术 语音识别技术的应用可以分为两个发展语音识别技术的应用可以分为两个发展方向:方向:一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现,特别是近几年来迅速发展的语音信号处理专用芯片(Applicat
3、ion Specific Integrated Circuit,ASIC)和语音识别片上系统(System on Chip,SOC)的出现。5.1 信息资源采集技术 1920年代生产的“Radio Rex”玩具狗可能是最早的语音识别器 AT&T贝尔实验室开发的Audrey语音识别系统 卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx 电话通信的语音拨号 汽车的语音控制 工业控制及医疗领域 个人数字助理 智能玩具 家电遥控 3、手写输入、手写输入 手写输入方法,是把要输入的汉字写在一块叫书写板的设备上。汉字识别的方法基本上分为结构识别、统计识别以及神经网
4、络方法等几大类。联机手写识别系统采用的是结构识别方法。优点是区分相似字的能力强,缺点是抗干扰能力差。汉王联机手写识别系统,目前在中国的嵌入式中文手写技术市场上汉王占有90%以上的市场份额。手写识别手写识别-JHWRjHWR手写识别系统以先进的大容量字典技术为基础,是一种能够在任何时间、任何地点,向任何人实时、准确的提供手写识别服务的高效便捷手段,非常符合信息时代动态更新和个性化查询的需求。手写识别手写识别-eJHWR 运用句法结构自学习算法和基于特征统计算法的多核心融和技术。具有识别率高,识别速度快,无笔顺限制,数据字典大小可缩扩等特点。5.1 信息资源采集技术4、OCR识别识别 OCR是Op
5、tical Character Recognition的简称,指光学字符识别技术。是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR识别技术识别技术扫描输入图像图像版面的分析和理解基于单字图像的特征选择和提取将被分类的模式赋予识别结果图像的预处理基于单字图像特征的模式分类图像的行切分和字切分良好的硬件支持识别结果的编辑修改后处理 常用软件:尚书六号、清华紫光OCR辨识系统、蒙恬认识王、丹青中英文文件辨识系统 “尚书六号”使用步骤
6、:扫描图像文件 打开尚书六号读取扫描好的图像文件 被识别图片的预处理 开始进行识别 识别校对完成后,进行保存5.1 信息资源采集技术 5.1.2 图像扫描 图像扫描常用设备有扫描仪、图像采集卡、数码相机等。1 扫描仪 1)、什么是扫描仪 扫描仪是指把图像或文字用扫描方式数字化后输入计算机的一种设备。2)、扫描仪的种类 a.平板式扫描仪 它是由步进电机带动扫描头对图片进行自动扫描。其特点是扫描精度较高、使用方便、成像稳定,它适用于图稿幅面不太大,精度要求较高的场合。b.手持式扫描仪 它是以手动的方式推动扫描仪对图片进行扫描。其特点是体积小、携带方便、价格便宜,但由于手推进速度均匀性问题,容易造成
7、图像失真。它适用于图稿幅面小、精度要求不太高的场合。c.滚筒式扫描仪 它是采用扫描头固定、滚动式走纸机构移动图纸而自动完成扫描。它适用于大型工程图的输入,例如A0、A1大幅面图稿输入。3)、扫描仪的结构扫描仪的结构扫描仪主要由上盖、原稿台、光学成像部分、光电转换部分、机械传动部分组成。5)、CCD扫描仪扫描仪与CIS扫描仪扫描仪的比较 CCD(光电耦合器)CIS(接触式图像传感器)光学系统部件复杂,成本较高。冷阴极管做光源,需要预热1分钟左右才能稳定发光。部件模块化,结构、原理和光路都极为简单;LED发光二极管做光源,光色及均匀度上较差,色域较窄,光源的寿命较短。颜色还原通过一系列透镜、反射镜
展开阅读全文