1、多媒体技术多媒体技术上海理工大学计算机基础教研室2009.2相关知识相关知识一、多媒体技术所属学科计算机科学与技术计算机软件与理论计算机系统结构计算机应用技术人工智能专家系统数据库与MIS多媒体技术网络与通讯计算智能人机交互技术可视化技术二、多媒体技术涉及的交叉学科与技术1.图像处理技术2.计算机图形学3.数学4.物理学5.电子学6.仿生学7.数字化信息处理技术8.音频、视频技术9.可视化技术10.软件、硬件技术11.操作系统12.网络与通信13.人工智能14.人机交互技术15.模式识别概述概述 一、多媒体概念(concept of multimedia)1.媒体的概念及分类 媒体:媒体:信息
2、的多种多样的表现形式称为媒体。定义的媒体有5类:感觉媒体感觉媒体 如声音、图形、图像、文字、气味以及物体的质地、形状、温度、色彩等。表示媒体表示媒体 为了有效地加工、处理和传输感觉媒体而人为构造出的一类媒体:如对声音、图形、图像、文字、数据等信息的数字化编码表示。显示媒体显示媒体 分为输入显示媒体(键盘摄像机、话筒、扫分为输入显示媒体(键盘摄像机、话筒、扫描仪、数字化仪等)、输出显示媒体(显示器、描仪、数字化仪等)、输出显示媒体(显示器、发光管、打印机、绘图仪等)发光管、打印机、绘图仪等)存储媒体存储媒体 指存储设备,如磁盘、光盘、半导体存储器指存储设备,如磁盘、光盘、半导体存储器等。等。传输
3、媒体传输媒体 指传输介质,如线缆、光纤及其它通信信道。指传输介质,如线缆、光纤及其它通信信道。多媒体信息:多媒体信息:指图形、图像、文字、声音和视频信息及其载体。多媒体技术:多媒体技术:是能够实时地综合处理多媒体信息的技术。多媒体:多媒体:不仅指多钟媒体本身,还包括处理和应用多媒体信息的相应技术,因此“多媒体”常被人为是“多媒体技术”的同义词。多媒体计算机:多媒体计算机:具有多媒体处理技术功能的计算机称为多媒体计算机。2.多媒体的概念 信息媒体的多样化:信息媒体的多样化:视觉、听觉、触觉、嗅觉、味觉5个感觉空间,其中前3种占了媒体信息的95%。多样化体现在输入和输出两个方面。集成性:集成性:媒
4、体信息信息的集成集成和处理这些媒体的设备集成设备集成。交互性:交互性:交互性指更加有效地控制和使用信息的手段。能增加对信息的注意和理解、延长信息保存时间、使人们获取信息和使用信息的方式变被动为主动。3.多媒体的关键特点93.893.8:美国召开第一届多媒体国际会议。目前:目前:计算机及网络技术发展,多媒体在人机交互、自然语言理解、语音合成和识别、指纹和人像识别取得惊人发展并进入实用化阶段。4.多媒体发展简史8484年:年:Apple公司的Hyper Card,提出了bitmap位图、Icon图标的概念,可处理多媒体信息。8585年:年:Commodore公司研制的Amiga系统,包括动画制作、
5、音响处理和图形处理3个专用芯片。86.486.4:Philips/Sony联合推出光盘系统CD-I,,同时公布了CD-ROM的文件格式。可与计算机、家用电视机、录像机、音响设备连接。87.387.3:Intel/IBMIntel/IBM公司的公司的DVIDVI:DVI先由CRA公司推出,转让给IBM,后又转让给Intel公司。DVI用标准光盘存储和检索图像、动画、声音和其它数据。九一年获大奖。8080年代:年代:Xerox多媒体会议系统、Apple公司多媒体辅助教育项目、布朗大学的超媒体系统、MIT多媒体实验室很多研究项目。90.1190.11:Philips等14家公司成立多媒体市场协会,建
6、立MPC标准。娱乐娱乐教育与培训教育与培训多媒体办公系统多媒体办公系统身份鉴别身份鉴别通信通信工业领域与科学计算工业领域与科学计算医疗影像诊断系统医疗影像诊断系统咨询服务与广告咨询服务与广告电子出版物电子出版物5.多媒体的应用领域 数据量大数据量大 数据长度可变数据长度可变 多数据流多数据流 数据流的连续记录与数据流的连续记录与检索检索 连续采集和连续检索连续采集和连续检索6.多媒体的特性 文本文本 图形、图像图形、图像 视频视频 音频音频 动画动画7.多媒体的表现形式存储技术存储技术 存储面密度增长存储面密度增长50-60%/年,目前单个磁盘达到年,目前单个磁盘达到10TB,RAID磁盘阵列
7、容量更大。磁盘阵列容量更大。压缩编码与解码技术压缩编码与解码技术虚拟现实技术(虚拟现实技术(Virtual Reality,VR)多媒体数据库技术多媒体数据库技术网络与通信技术网络与通信技术智能多媒体技术(智能视听、智能表示与决策)智能多媒体技术(智能视听、智能表示与决策)多媒体信息检索(多媒体信息检索(asp,caj)8.多媒体关键技术 媒体及其分类媒体及其分类 多媒体及其关键技术多媒体及其关键技术 应用领域应用领域 人机交互人机交互 虚拟现实虚拟现实 多媒体技术在各领域应用的重要性多媒体技术在各领域应用的重要性9.复习题 多媒体信息的数字化 图形、图象信息的数字化和存储 矢量图优点:易移动
8、,缩放,旋转和扭曲等变换;放大不会出现马赛克现象。常用来做线框型的图画、工程制图、美术字等。与分辨率无关。常用软件:CorelDraw,Flash,Fireworks,3DSMAX 位图优点:由数字阵列信息组成。质量主要由图象的分辨率和色彩位数决定。适合表现含有大量细节的画面。常用软件:PHOTOSHOP具有多媒体功能的计算机具有多媒体功能的计算机多媒体信息的数字化多媒体信息的数字化 音频信息的数字化和存储 声音的振幅和频率 声波表示 波峰越高,声音越响,波峰间距越小,声调越高 身音的采样 按一定的时间间隔采集该时间点的音频信号幅度值,采用所得的数据以二进制的形式存储,播放时需要还原成模拟波形
9、。模拟声音的量化 采样得到的数据按一定的大小进行存储的过程便称为量化。量化级别可分为:8位,16位,32位。量化位数越大,声音的幅度分辨率就越高,还原时的声音品质就越好,占用空间也越大。多媒体信息的数字化 音频信息的数字化和存储 数字信号的编码和存储按一定的规则编码。编码位数=log2N (N为量化级)存储空间=(采样频率*量化位数)/8二、模拟语音信号的数字化二、模拟语音信号的数字化1.1.采样采样 模拟音频信号在时间上是连续波形,而数字音频信号是一个数据系列,在时间上不连续。把模拟声音变成数字声音时,首先需要对模拟音频信号每隔一个时间间隔取一个幅度值,这个过程称之为采样。声波实际上是连续信
10、号,或称连续时间函数X(t),用计算机处理这些函数时,必须先对连续信号采样,即按一定的时间间隔(T)取值,得到X(nT)(n为整数)T采样周期 1/T采样频率 X(n T)离散信号采样量化编码模拟音频数字音频 X(nT)是从连续信号上抽取的部分值,那么如何采样才能保证用X(nT)唯一确定地恢复x(t),即满足耐奎斯特(Nequist)采样定理:设连续信号X(t)的频谱为X(f),以采样间隔T采样得到离散信号X(nT),如果满足:T1/2 fc 或fc 1/2T则由X(nT)可唯一确定地恢复x(t)。其中 fc是信号的采样频率,当fN 1/2T时,fN 称为耐奎斯特频率,也叫采样截止频率。采样定
11、理采样定理 由X(nT)确定x(f):由X(nT)确定x(t):若采样频率小于fN,则X(nT)不能唯一地确定x(t)。)()(sinnT)(xX(t)nTtTnTtTnfnTjne2nT)(xTX(f)采样定理采样定理 任何一个不规则波形都可以用无穷个规则频率的任何一个不规则波形都可以用无穷个规则频率的波形叠加而成(傅氏变换、正弦变换、余弦变换的物波形叠加而成(傅氏变换、正弦变换、余弦变换的物理意义)。理意义)。采样信号的频谱:采样信号的频谱:X XT T(f)(f)是是 X(f)X(f)波形中各个频率的叠加。波形中各个频率的叠加。mcnmffTmff)2(X)(x)(XT采样原理采样原理
12、由于对模拟信号的采样所取得的数据只是音频信号幅度的模由于对模拟信号的采样所取得的数据只是音频信号幅度的模拟电压值,为了用数字化的值来表示电压,就要把电压值划分成拟电压值,为了用数字化的值来表示电压,就要把电压值划分成若干等级,每个等级可表示为一个数值,这就是量化。若干等级,每个等级可表示为一个数值,这就是量化。量化简单地说就是对声波波幅对应的电压分成级来表示,分量化简单地说就是对声波波幅对应的电压分成级来表示,分的级越多,数字声音质量就越高。通常用的级越多,数字声音质量就越高。通常用8 8位(位(256256级)或级)或1616位位(6553665536级)的方式来分级。级)的方式来分级。相同
13、采样频率情况下,量化维数越多,音效就越好;相同量相同采样频率情况下,量化维数越多,音效就越好;相同量化位数情况下,采样频率越高,声音效果越好。化位数情况下,采样频率越高,声音效果越好。通常我们把通常我们把8 8位(位(256256级)或级)或1616位(位(6553665536级)所表示的值级)所表示的值256256和和6553665536称为量化器。称为量化器。采样和量化的过程可由采样和量化的过程可由A/DA/D模数转换器来完成,每个模数转换器来完成,每个A/DA/D模数模数转换器的采样频率是固定的。播放时可由数模转换器将数字信号转换器的采样频率是固定的。播放时可由数模转换器将数字信号转换成
14、模拟信号。转换成模拟信号。量化量化 所谓编码,就是按照一定格式把离散的数字所谓编码,就是按照一定格式把离散的数字记录下来,并在有用数据中加入一些用于纠错、记录下来,并在有用数据中加入一些用于纠错、同步和控制数据。在数据回放时,可对适当错误同步和控制数据。在数据回放时,可对适当错误的数据纠正,然后播放。的数据纠正,然后播放。声音数据是以编码的形式存放和处理的。声音数据是以编码的形式存放和处理的。编码器传输、存储解码输入信号输出信号编码编码(1)PCM(Pulse Code Modulation)脉冲编码调制,1939由法国工程师Alec Reeves发明,即把连续的模拟信号转变成脉冲编码调制的信
15、号。PCM包括对连续信号采样、幅度的量化及用适当码字表示。按照量化方式的不同可以分为:均匀量化PCM 非均匀量化PCM 和自适应量化PCM 一般信号振幅小,则量化级降低;信号振幅大,则量化级增大。这样可以满足精度要求的情况下减少编码位数(2)DPCM(2)DPCM编码编码 这里,XN为tN时刻的亮度采样值;X”N 为根据tN时刻以前已知的像素亮度采样值X1,X2,X3,XN-1对XN所作预测值;eN =XN XN 为差值信号eN为量化器输出信号XN为接收端输出,XN =XN+eN因为:XN XN=XN(XN+eN)=(XN XN)eN =eN eN所以,DPCM系统中的误差来源是发送端的量化器
16、,而与接收端无关,若去掉量化器,使eN=eN,即实现信息保持编码。事实上,这种量化误差是不可避免的。(3)ADPCM(3)ADPCM编码编码 视频信息的数字化和存储 色彩空间表示RGB,YUV,YIQ 视频信息的数字化对标准的NTSC,PAL视频模拟信号,通过采用、量化、模数转换、色彩空间变换等过程进行视频信息的数字化。视频采集卡(1)主机 CPU 内存 高速缓存 总线(2)外部设备接口与驱动软件(3)外部设备具有多媒体功能的计算机具有多媒体功能的计算机一、多媒体系统组成 集成程度不断提高:系统级集成集成程度不断提高:系统级集成(on system)、主板级、主板级(on board)、芯片级
17、集成、芯片级集成(on chip)总线:总线:ISA(16bit,8Mhz,5Mb/s),EISA,VESA PCI(64bit)MMX技术(技术(MMX/166):MultiMedium Extentions 单指令多数据技术单指令多数据技术(SIMD),57条新指令、条新指令、8个个64bit宽的宽的MMX寄存器、寄存器、4种新的数据类型种新的数据类型 PII与与PIII:PIII又增加了又增加了70条新指令条新指令SSE(Streaming SIMD Extentions)PIV:4200万个晶体管(比万个晶体管(比PIII多多50%)新增新增144条多媒体指令(条多媒体指令(SSE2)
18、(1)CPU媒体处理芯片是可独立执行I/O处理的高速芯片,特点:体积小、功耗低、运算速度快、具有内部存储器、具有覆盖所应用领域的多种类型。Bill Gates预测:未来计算机只有3个主要元件,即存储模块、CPU、复杂I/O处理芯片(媒体处理芯片):Mpact、Trimedia、Mediaprocessor、TMS320C6X DSP数字信号处理器:DSP芯片(Digital Signal Processor)最高达16亿次/秒(2)媒体处理芯片 显卡显卡CGA:b/w:640X200;16c:320X200EGA:b/w:640X480;16c:640X200VGA:b/w:1024X768;
19、16c:800X600,256c:640X480HVGA:TVGAAGP图形加速器:把主存与显存直接连接,带宽32bit,速度:533Mb/秒加速芯片:16bit直到128bit,分辨率:640X480到1600X1200,色彩:16到16.7M真彩 声卡声卡8bits,16bits(声音从FM合成、表波合成、波导、杜比AC-3合成:多声道立体声的DVD播放标准)(3)多媒体设备接口与软件驱动程序)多媒体设备接口与软件驱动程序 视屏卡 具有MPEG-1和MPEG-2解码芯片,具有捕捉、压缩、存储、回放等功能 USB 通用串行总线(Universal Series Bus V1.1,V2.0),
20、速度从12Mb/s到480Mb/s;结点间距5米,最大距离100米,屏蔽双缴线连接;接口由两根电源线,两根信号线;即插即用,可热插拔。USB是基于令牌的总线,总线设备检测令牌中的地址确定操作设备,并进行数据发送,USB采用星型拓扑结构,内有集线器,最多可连接127个USB设备。(3)多媒体设备接口与软件驱动程序)多媒体设备接口与软件驱动程序(3)多媒体设备接口与软件驱动程序)多媒体设备接口与软件驱动程序 网卡 速度:10Mb/s,100Mb/s,1000Mb/s 接口:Rj45水晶口、BNC细缆口、AUI SCSI:50心接口 IDE:40心接口 影碟机(播放光碟)摄像机 录像机(录放磁带)电
21、视机 显示器(25,26,28,31,33,39)触摸屏 扫描仪 投影仪 FAX/MODEM 手写板 条码阅读器 音响设备 MIDI设备 音响 光盘 磁盘(磁盘阵列)打印机 通信设备 游戏手柄 鼠标、键盘 读卡器(4)多媒体外部设备大小:大小:14“,15”,17“,19”,21“点距:点距:0.39mm,0.33mm,0.31mm,0.28mm,0.26mm,0.25mm类型:电子阴极射线管类型:电子阴极射线管(CRT)液晶显示液晶显示(LCD,Liquid Crystal Display,2048X1536)等离子显示(等离子显示(PDP,Plasma Display,超大尺寸)超大尺寸)
22、显示器显示器分为:DRAM(动态内存,需要充电刷新)SRAM(不需充电刷新,速度快,成本高)ROM(只读)PROM(可编程ROM)EPROM(可紫外线察除的PROM)EEPROM(可电察除的PROM)Flash EPRO(直接可读写的PROM,BIOS)l内存内存高速缓存高速缓存 SRAM比DRAM快2到3倍,因此常称为外部高速缓存Cache。分为:分为:7种类型种类型RAID1:镜像结构:镜像结构RAID2:采用海明码的冗余纠错:采用海明码的冗余纠错RAID3:采用奇偶校验的冗余纠错,并行读写:采用奇偶校验的冗余纠错,并行读写RAID4:采用奇偶校验的冗余纠错,扇区读写:采用奇偶校验的冗余纠
23、错,扇区读写RAID5:采用奇偶校验的冗余纠错,扇区读写,:采用奇偶校验的冗余纠错,扇区读写,数据与冗余码同时写入扇区,适合事务处理数据与冗余码同时写入扇区,适合事务处理RAID6:采用奇偶校验的冗余纠错,扇区读写,:采用奇偶校验的冗余纠错,扇区读写,采用二维奇偶校验,可同时纠正两个盘的错误采用二维奇偶校验,可同时纠正两个盘的错误RAID7:在:在RAID6的基础上增加了高速缓存的基础上增加了高速缓存l磁盘阵列磁盘阵列(RAID)针式喷墨激光阵列l打印机打印机电阻式:屏幕是间隔0.25微米的两层透明导电层组成,触摸时,在X,Y点电阻变化。电容式:在触摸屏玻璃板上涂上金属层,触摸时电容发生变化,
24、格局连接的振荡器频率可计算位置红外线式:在屏幕四周成对安装红外发射与接收器,屏幕上形成红外阵列,当手指触摸时,可得出X、Y坐标。声表面波式:通过触摸屏、声波发生器、反射器、声波接收器组成。l触摸屏触摸屏指标:分辨率、亮度、尺寸指标:分辨率、亮度、尺寸使用:灯管最贵,使用时先开电源,电扇使用:灯管最贵,使用时先开电源,电扇工作,再开灯开关。关闭时:先关闭灯管工作,再开灯开关。关闭时:先关闭灯管电源,等电扇停止工作后,再关闭电源。电源,等电扇停止工作后,再关闭电源。l投影仪投影仪1.计算机总线有那些?计算机总线有那些?2.显示器有那些类型,显示原理及特点?显示器有那些类型,显示原理及特点?3.内存
25、有那些类型,特点?内存有那些类型,特点?4.USB设备的结构、性能参数?设备的结构、性能参数?5.MMX技术特点,不同类型的技术特点,不同类型的CPU的多的多媒体功能?媒体功能?6.什么是什么是DSP,具有那些优点?,具有那些优点?思考题:思考题:多媒体音频信号处理多媒体音频信号处理一、音频信号与质量 1.声音声音 是通过媒介传播的一种连续的波,叫声波。媒介可以是气体、液体或固体三种形式。2.音频信号的分类音频信号的分类 声波信号和超声波信号 3.声音信号基本参数声音信号基本参数 频率(周期)、幅度 频率:每秒钟波峰发生的数量(语音:3003000Hz)幅度:波峰相对于基线的距离,代表信号强弱
26、,用分 贝(dB)表示。周期:频率的倒数4.4.音频信号的应用音频信号的应用IPIP电话电话配音、配乐配音、配乐声音模拟声音模拟用声音控制的用声音控制的WebWeb、设备等、设备等电子读物的有声输出电子读物的有声输出声音识别声音识别语音识别语音识别语音合成语音合成音乐合成音乐合成人机通讯、交互人机通讯、交互一、音频信号与质量客观质量评价指标:客观质量评价指标:信噪比信噪比SNR SNR(Signal to Noise RationSignal to Noise Ration),信噪比是有用),信噪比是有用信号与噪声之比。信号与噪声之比。模拟声音信号经过离散数字采样、量化后与原来信号必然模拟声音
27、信号经过离散数字采样、量化后与原来信号必然产生误差,也就是信号中引入了噪声,不同的应用要求音频产生误差,也就是信号中引入了噪声,不同的应用要求音频信号的信噪比不同,不同电话要求信噪比大于信号的信噪比不同,不同电话要求信噪比大于35dB35dB。平均判分(平均判分(Mean Option Score,MOS)Mean Option Score,MOS):声音分声音分4 4级,优、良、中、差;分别对应:级,优、良、中、差;分别对应:1)1)超高保真(数字激光唱盘质量,超高保真(数字激光唱盘质量,101022k22k)2)2)调频无线广播(调频无线广播(FMFM,202015k15k)3)3)条幅无
28、线广播(条幅无线广播(AMAM,50507k7k)4)4)电话质量(电话质量(TelephoneTelephone,2002003.4k)3.4k)5.5.音频信号质量音频信号质量Wave 音频文件 波形音频特征 波形音频是多媒体计算机获得声音最直接、最简便的方式。以麦克风、立体声录音机或CD作为输入源。Wave音频文件 标准的WINDOWS数字音频文件.wav 缺点:文件太大,不适合长时间记录。采用PCM和ADPCM进行压缩。Wave音频文件的制作工具 系统自带的录音机软件MIDI合成音乐 合成器 利用数字信号处理器或其他芯片来产生音乐或声音的电子装置。合成器存在于声卡中,可分为调频FM合成
29、妻和波表合成器。前者用频率调制的原理产生声音,后者是对真实的乐器发出的声音进行采样。MIDI音乐产生原理 乐器和MIDI处理器之间有传递协议。存储的空间少,播放时间长,可以以音乐作为背景音响效果。常用系统带的媒体播放器播放MIDI音乐。声音的处理 声音的处理包含:录音,剪辑,去除杂音,混音,合成等等。录音 编辑位置的定位 更改声音效果音频数据压缩 音频编码与压缩 编码方法通常有:基于音频数据的统计特性编码,基于音频的声学参数编码,基于前两者的混合编码。压缩方法 有损压缩:波形编码,参数编码,混合编码 无损压缩:Huffman编码和行程编码 MPEG音频压缩 MPEG压缩标准 MPEG声音压缩技
30、术 应用:MP3 Winamp播放MP3文件语音合成与识别 语言合成技术 两种途径:一种预存语言信号,一种数字信号处理方法。智能计算机的研究热点。语音识别技术 涉及领域:信号处理,模式识别,概率论和信息论,发声机理和听觉机理,人工智能等。图象信息的处理技术图象信息的处理技术图形图像相关知识图形图像相关知识(一)图像和图形的概念(一)图像和图形的概念 图形是计算机在平面坐标系和空间坐标系中,通过对运算表达式进行矢量运算和对坐标数据进行描述而形成的运算结果。由于图形具有方向和长度,因此也被叫做“向量图”。图形主要用于表达事物和事件的变化过程、表达计算机的运行状态和运算结果、表达物体形态和运动姿态的
31、变化规律等。图像是自然界中的客观事物,在计算机中,图像用像素点进行描述。有序排列的像素点表达了自然景物的形象和色彩,而像素点又是二进制位进行描述的,因此图像又叫做“位图”。所谓图像,一般是指自然界中的客观景物通过所谓图像,一般是指自然界中的客观景物通过某种系统的映射,使人们产生某种系统的映射,使人们产生视觉感受视觉感受。例如,。例如,照片、图片和印刷品等。在自然界中,景和物照片、图片和印刷品等。在自然界中,景和物有两种形态,即动和静。有两种形态,即动和静。静止的客观景物叫做静态图像;活动的客观景静止的客观景物叫做静态图像;活动的客观景物叫做动态图像物叫做动态图像。计算机中的图像是一组数据的集合
32、,根据不同计算机中的图像是一组数据的集合,根据不同的开发者和不同的使用场合,数据的结构和格的开发者和不同的使用场合,数据的结构和格式也不尽相同,这就形成了多种数据格式的图式也不尽相同,这就形成了多种数据格式的图像文件。像文件。(二)(二)静态图像文件静态图像文件1.BMP格式的图像文件格式的图像文件 BMP是Bitmap的缩写,即“位图”。BMP格式的图像文件是美国微软公司特为Windows环境应用图像而设计的。为了更方便地使用BMP格式,在windows系统软件中,内置了大量支持BMP格式图像处理的API函数。常见的图像数据文件格式BMP格式的主要特点 BMP格式的图像文件以格式的图像文件以
33、”.bmp”为文件扩展为文件扩展名的。名的。文件结构简单,每个文件只能存放一幅图像,文件结构简单,每个文件只能存放一幅图像,因而该文件所表示的图像是静止的。因而该文件所表示的图像是静止的。根据需要,使用者可选择图像数据是否采用根据需要,使用者可选择图像数据是否采用压缩形式存放。一般情况是非压缩格式压缩形式存放。一般情况是非压缩格式 可以多种彩色模式保存图像,如可以多种彩色模式保存图像,如16色,色,256色、色、24bit真彩色,最新版本的真彩色,最新版本的BMP格式允许格式允许32bit真彩色。真彩色。数据排列顺序与其他格式的图像文件不同,数据排列顺序与其他格式的图像文件不同,从图像的左下角
34、为起点存储图像,而不是像从图像的左下角为起点存储图像,而不是像传统的那样,以图像的左上角为起点。传统的那样,以图像的左上角为起点。BMP格式的图像文件的结构文件头调色板图像数据 文件头的长度为固定的文件头的长度为固定的54个字节,调色个字节,调色板数据用于描述所有不超过板数据用于描述所有不超过256色的图像模色的图像模式,但是一旦图像采用式,但是一旦图像采用24bit 真彩色模式或真彩色模式或更高模式,该图像文件中的调色板数据却不更高模式,该图像文件中的调色板数据却不再描述相关信息。再描述相关信息。BMP格式的图像文件既可以采用压缩算格式的图像文件既可以采用压缩算法对其进行处理,也可以不压缩。
35、是否采用法对其进行处理,也可以不压缩。是否采用压缩算法取决于存放空间的大小和图像处理压缩算法取决于存放空间的大小和图像处理软件能否处理这两个因素。软件能否处理这两个因素。2.TIFF格式的图像文件格式的图像文件 TIFF(Tag Image File Format)是一种通用的位映射图是一种通用的位映射图像文件格式。由像文件格式。由Aldus 1986年推出,后来与微软联手,年推出,后来与微软联手,进一步发展了进一步发展了TIFF格式格式。TIFF格式图像文件的扩展名是格式图像文件的扩展名是”.tif”,支持从单色模式支持从单色模式到到32bit真彩色模式的所以图像。可用于多种操作平台真彩色模
36、式的所以图像。可用于多种操作平台和应用软件。使用于多种机型。数据结构是可变的,文和应用软件。使用于多种机型。数据结构是可变的,文件具有可改写性,使用者可向文件写入相关信息具有多件具有可改写性,使用者可向文件写入相关信息具有多种数据压缩存储方式非压缩的种数据压缩存储方式非压缩的TIF格式的文件是独立于格式的文件是独立于软硬件的。软硬件的。TIFF格式的图像文件版本所有权属于格式的图像文件版本所有权属于Aldus公司和美国公司和美国Microsoft公司,但是人们可以在公开场合自由免费公司,但是人们可以在公开场合自由免费地使用地使用TIFF格式的图像文件。格式的图像文件。IFH由由8个字节组成。包
37、含个字节组成。包含TIFF文文件其他部分的重要说明信息。件其他部分的重要说明信息。IFD标识的内容包括指示标识信息标识的内容包括指示标识信息的代号、数据类型说明、数据值、的代号、数据类型说明、数据值、文件数据量等。文件数据量等。数据区用来存放数据并指明压缩方数据区用来存放数据并指明压缩方法,数据排列,数据分割的信息。法,数据排列,数据分割的信息。文件头(IFH)标识信息区(IFD)图像数据(1)TIFF格式的图像文件的结构3.TGA格式的图像文件格式的图像文件 TGA(Targa Image Format),该格式图像文件由Truevision公司开发,最初的目的是支持本公司生产的Targa图
38、形卡。目前成为世界的通用格式,被应用到多个专门的领域(动画制作,模拟显示,影视画面合成)。(1)TGA格式的图像文件具有如下特点:格式的图像文件具有如下特点:TGA格式的图像文件的扩展名是.tga 支持任意尺寸的图像。支持1bit单色到32bit真彩色模式的所有图像,具有很强的颜色表达能力,特别适合影视广播级的动画制作。图像的存储具有可选择性,图像数据既可以按照从上到下、从左到右的顺序进行存储,也可以相反的顺序存储。TGA格式的图像对硬件的依赖性强,如果显示卡不具备24bit或32bit的显示能力,该格式的图像将不能正确显示。文件头包括文件头包括TGA文件的出处、颜色映象表文件的出处、颜色映象
39、表类型、图像数据存储类型、图像数据存储类型、图像数据存储类型、图像数据存储顺序等内容。顺序等内容。调色板数据块信息是可选择部分,其定义调色板数据块信息是可选择部分,其定义在文件头中说明。调色板数据块信息包括在文件头中说明。调色板数据块信息包括TGA图像文件格式的调色板数据块构成方图像文件格式的调色板数据块构成方式、图像数据的组织方式等。式、图像数据的组织方式等。图像数据区用于存储大量图像数据。图像数据区用于存储大量图像数据。数据补充区用于表明当前文件是新版本数据补充区用于表明当前文件是新版本(2.0)文件,分为开发者目录区和扩充数)文件,分为开发者目录区和扩充数据区。据区。文件头调色板数据块信
40、息图像数据数据补充区(2)TGA格式的图像文件格式格式的图像文件格式4.GIF 格式图像文件格式图像文件 GIF(Graphics Interchange Format),由,由Compuserve公司于公司于1987年推出,年推出,主要为了网络传主要为了网络传输和输和BBS用户使用图像文件而设计的用户使用图像文件而设计的。目前目前GIF格式的图像文件已经是网络传输和格式的图像文件已经是网络传输和BBS用用户户使用最频繁的文件格式使用最频繁的文件格式。GIF格式的图像文件适用于各种个人计算机和许多格式的图像文件适用于各种个人计算机和许多UNIX工作站工作站,并且可以在不同输入、输出设备之,并且
41、可以在不同输入、输出设备之间间方便地传送方便地传送。GIF格式图像文件是世界通用的图像格式,格式图像文件是世界通用的图像格式,特别适合于动画制作、网页制作以及演示文特别适合于动画制作、网页制作以及演示文稿制作等方面。稿制作等方面。(1)GIF格式图像文件的特点 扩展名是扩展名是.gif 对于灰度图像表现最佳对于灰度图像表现最佳 有有GIF87a和和GIF89a两个版本,两个版本,GIF89a是是89年推年推出的允许一个文件存多个图像,可实现动画功能。出的允许一个文件存多个图像,可实现动画功能。采用改进的采用改进的LZW压缩算法处理图像数据压缩算法处理图像数据 不支持不支持24bit彩色模式,最
42、多存储彩色模式,最多存储256色。色。5.PCX格式的图像文件格式的图像文件 PCX由由PC Paintbrush而得名,由而得名,由Zsoft公司推出,主要公司推出,主要用于该公司开发的用于该公司开发的Paintbrush绘图软件。美国微软公司绘图软件。美国微软公司后来将该绘图软件移植到后来将该绘图软件移植到Windows中成为一个重要的功中成为一个重要的功能模块。能模块。(1)PCX格式的图像文件特点格式的图像文件特点 PCX格式的文件的扩展名是格式的文件的扩展名是.pcx 历史悠久,几乎与个人计算机同步发展。历史悠久,几乎与个人计算机同步发展。四基色的色彩关系,一个文件存储一个图像。四基
43、色的色彩关系,一个文件存储一个图像。C(青)、(青)、M(品红)、(品红)、Y(黄)、(黄)、K(黑)(黑)图像的显示与计算机硬件的显示模式有关。图像的显示与计算机硬件的显示模式有关。6、JPEG格式的图像文件格式的图像文件 JPEG:全称是:全称是Joint Photogragh Coding Experts Group(联合照片专家组),(联合照片专家组),是一种基于是一种基于DCT的静止图像压缩和解压缩算法。的静止图像压缩和解压缩算法。它由它由ISO(国际标准化组织国际标准化组织)和和CCITT(国际电报电话咨询国际电报电话咨询委员会委员会)共同制定,并在共同制定,并在1992年后被广泛
44、采纳后成为国年后被广泛采纳后成为国际标准。它是把冗长的图像信号和其它类型的静止图像际标准。它是把冗长的图像信号和其它类型的静止图像去掉,甚至可以减小到原图像的百分之一(压缩比去掉,甚至可以减小到原图像的百分之一(压缩比100:1)。)。该格式文件在国际互联网上经常用于图像传输;在广告设计中,该格式文件在国际互联网上经常用于图像传输;在广告设计中,常作为图像素材使用,在存储容量有限的条件下进行携带和传输。常作为图像素材使用,在存储容量有限的条件下进行携带和传输。MPEG MPEG:是Moving Pictures Experts Group(动态图像专家组)的英文缩写,实际上是指一组由ITU和I
45、SO制定发布的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法,它提供的压缩比可以高达200:1,同时图像和音响的质量也非常高。数字图象数据压缩 无损压缩RLE Run-length encoding:游程长度编码 工作原理:用两个数替代图象文件中表示像素值的数字重复的序列,一个数指定了游程的长度,另外一个数则表示数值本身。PCX和BMP等采用该方法 有损压缩JPEG 原理:根据重要等级分离图象中的信息。数字图象的处理 数字图象的获取 扫描仪 数码相机 图象捕捉卡采集视频图象帧或静止画面 数字图象的处理图像处理实验步骤1:单击图片“plane.jpg”的标题栏,使之成为活动
46、窗口步骤2:利用魔术工具单击白色背景图像处理实验步骤3:执行菜单命令选择/反选,图中飞机被选中步骤4:执行菜单命令编辑/拷贝,步骤5:单击图片“cloud.jpg”的标题栏使之成为活动窗口步骤6:执行菜单命令编辑/粘贴,步骤7:选择移动工具,将飞机拖到适当的位置步骤8:在图层1将不透明度调整到70%步骤9:执行菜单命令图层/合并可见图层步骤10:执行菜单命令文件/存储为,输入文件名,文件类型*.jpg 打开图片“世界名兰.jpg”和“蝴蝶.jpg”。使“蝴蝶.jpg”窗口为活动窗口。鼠标单击选中工具箱中的仿制图章工具。按下Alt键(这时鼠标形状显示为橡皮图章的形状),鼠标在图片窗口中的蝴蝶上单
47、击,然后松开Alt键。使“世界名兰.jpg”窗口成为活动窗口。用鼠标在该图片窗口中拖动,逐渐把另一图片中的蝴蝶“涂抹”出来。使用“文件/存储”菜单命令将文件保存为newhudie.jpg,并在出现的对话框中单击“好”按钮完成。新建文档,在“新建”对话框中设置300像素300像素的图像大小、分辨率为72像素/英寸、RGB模式的图片文件,单击“好”按钮后出现新文档窗口。用“油漆桶工具”把图片背景填充为黑色。用椭圆选框工具配合Shift键在图片中央绘制一个圆形选区。提示:提示:如果工具箱中找不到椭圆选框工具,可以在其他选框工具上按下左键一会儿,在出现的菜单中选择。提示:提示:如果工具箱中找不到油漆桶
48、工具,可以在“渐变工具”上按下左键一会儿,在出现的菜单中选择。单击工具箱下面的“设置前景色”按扭,在随后弹出的“拾色器”对话框中把RGB值设为(255,0,255),如图12-5所示;单击“好”按扭关闭对话框,即可把前景色设置为粉红色。按住Alt键,单击工具箱下面的背景色设置按扭,用同样的方法把背景色设为白色,RGB值(255,255,255)。选择渐变工具,在如图12-6所示的选项栏单击“渐变类型选择”组中的第一个按钮“线性渐变”,单击“渐变色编辑与选择工具”,在打开的“渐变编辑器”对话框中,选择“前景色到背景色渐变”,即把渐变方式设置为从前景色到背景色。然后把鼠标从圆形选区的左上角拖动到圆
49、形选区的右下角,松开左键,产生渐变效果。再次用椭圆选择工具绘制一个小一点的圆形选区,调整位置使之与原来的圆形同心。选择渐变工具,渐变方式保持不变。然后把鼠标从圆形选区的右下角拖动到圆形选区的左上角。使用“选择/取消选择”菜单命令取消选区。把前景色设为黑色,用画笔工具在纽扣的中心位置采用单击的办法绘制四个黑色圆点(画笔大小根据所绘制圆的大小自己设定)。将文件保存为niukou.jpg。打开图片文件“Panda.jpg”。用椭圆选框工具在图片上绘制一个椭圆形选区。使用“选择/反选”菜单命令反选选区。单击图层调板下面的“创建新的图层”按扭,创建图层1 单击选中图层调板上的图层1,用油漆桶工具为选区填
50、色,前景RGB值设置为(154,180,186)。使用“选择/取消选择”菜单命令取消选区。确保图层1仍处于选中状态。选择“滤镜/杂色/添加杂色”菜单命令,在随后出现的“添加杂色”对话框中参数值设置如下:“数量”为12,“分布”选择“高斯分布”,选中“单色”复选框,单击“好”按钮后,确保图层1仍处于选中状态。选择“图层/图层样式/斜面与浮雕”菜单命令,在随后出现的对话框中使用默认设置,单击“好”按扭,图片制作完毕。使用“文件/存储为”菜单命令将文件保存为New Panda.JPG。打开图片文件“flower.jpg”。双击图层调板上的“背景”层缩览图,在“新图层”对话框中单击“好”按扭,背景层变