数据科学技术与应用7图像数据处理课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《数据科学技术与应用7图像数据处理课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 科学技术 应用 图像 数据处理 课件
- 资源描述:
-
1、图像数据处理图像数据处理 图像是人类获取信息、表达信息和传递信息的重要手段 早期:使用计算机绘制图像,建立三维模型 人工智能技术发展,计算机开始试图自动识别图像的内容 手写数字识别 车牌识别 人脸识别 数字图像 将图像进行数字化 使用给定大小的网格将连续图像离散化,每个小方格(像素)被记录为一种颜色 颜色矩阵表示数字图像 像素(Pixel)数字图像的最小单位 每个像素具有横和纵位置坐标,以及颜色值(a)灰度图像(b)图像局部(168)像素图 图像局部(168)的像素矩阵 像素也被用来表示整幅图像的网格数,如640480同样大小的图像,像素越大越清晰数字图像类型(1)二值图像 像素矩阵由0、1两
2、个值构成,“0”代表黑色,“1”代白色,用1位二进制表示 通常用于文字、线条图的扫描识别(OCR)和掩膜图像的存储灰度图像 灰度图像矩阵元素的取值范围通常为0,255“0”表示纯黑色,“255”表示纯白色,中间的数字从小到大表示由黑到白的过渡色 用8位二进制表示 二值图像可以看成是灰度图像的特例数字图像类型(2)RGB彩色图像 每个像素的颜色表示为:红(R)、绿(G)和蓝(B)三原色组合 图像用3个MN的二维矩阵 每个矩阵分别存放一个颜色分量,取值范围在0,255,表示该原色在该像素的深浅程度 每个像素的颜色使用38bit表示,也被称为24位图。图像压缩 直接存储数字图像的二维矩阵存储非常大,
3、通常将原始数据压缩后进行存储 常用格式 BMP、JPEG、TIF、GIF、PNG等数字图像处理(1)图像变换(Geometrical Image Processing)几何变换坐标变换,图像的放大、缩小、旋转、移动,多个图像配准,全景畸变校正,扭曲校正,周长、面积、体积计算等 空间变换傅里叶变换、离散余弦变换,小波缓缓将图像从时域变换到频域图像增强和复原(Image Enhancement&Restoration)目的:提高图像的质量 方法:去除噪声,提高图像的清晰度数字图像处理(2)图像重建(Image Reconstruction)通过物体外部测量的数据经数字化处理获得物体的三维形状信息
4、投影重建、明暗恢复形状、立体视觉重建和激光测距重建图像编码(Image Encoding)利用图像的统计特性、人类视觉生理学及心理学特性对图像数据进行编码 以较少的比特数表示图像或图像中所包含的信息常见有JPEG、TIFF等压缩格式数字图像处理(3)图像识别(Image Recognition)利用计算机对图像进行处理、分析和理解,识别各种不同模式的目标和对象空间变换 广泛地应用于导航、地图与地形配准、自然资源分析、天气预报、环境监测、生理病变研究等领域。7.2 Python图像处理 Python图像处理库 常用:PIL、Pillow、OpenCV以及Scikit-image等表7-1 Sci
5、kit-image的常用模块子模块名称子模块名称主要实现功能主要实现功能io读取、保存和显示图片或视频data图片和样本数据color颜色空间变换filters图像增强、边缘检测、排序滤波器、自动阈值等transform几何变换或其它变换,如旋转、拉伸和拉东变换等feature特征检测与提取等measure图像属性的测量,如相似性或等高线等segmentation图像分割restoration图像恢复util通用函数图像基本操作(1)图像读取和显示 用ndarray的多维数组表示图像 Scikit-image库的io库 图片输入输出 robot=io.imread(data/Robot.jpg
6、)robot.shape#图像像素和颜色字节数(372,400,3)type(robot)#数据类型 io.imshow(robot)io.show()图像基本操作(2)图像的坐标和颜色 使用(row,col)表示图像每个像素的坐标 起点(0,0)位于图像的左上角 给出一个坐标位置,即可获得图像中该像素的颜色。robot91,221#取指定坐标像素的颜色array(65 61 62,dtype=uint8)RGB彩色图像 每个像素的颜色用一个(R,G,B)三元组表示 可以只提取某个通道(分别用0、1、2表示)的颜色值。robot91,221,0#取指定坐标像素的R值65 图像基本操作(3)数组
7、的切片操作 可以访问图像中某一部分的颜色 robot77:80,221:231,0#取一部分图像的R值array(37 90 79 61 41 42 129 75 75 72 32 38 85 63 52 41 78 113 65 71 38 33 69 78 60 44 53 116 68 63,dtype=uint8)图像裁剪 提取数组的部分数据显示和保存 head=robot40:165,180:305#给出图像局部 head的坐标范围 io.imshow(head)io.show()io.imsave(data/RobotHead.jpg,head)#将图像数据保存为文件7.3 案例:
8、深度学习实现图像分类 图像特征提取 基于色彩特征 基于纹理 基于形状 基于空间关系等 深度学习算法 传统前馈神经网络 参数多 计算量大 CNN7.3 案例:深度学习实现图像分类 前馈神经网络 全连接 图像数据非常大 10001000像素的灰度图像 输入层有10001000=100万个节点 第一个隐层有1000个节点 有100010001000=1亿个权重参数需要学习卷积神经网络(CNN)图像每个像素与周围像素关联紧密,与离得远的像素之间关联很小 CNN网络引入特定隐藏层,减少网络参数 卷积层(Conventional Layer)由若干卷积单元组成 每个卷积单元仅仅连接输入单元的一部分 一组连
9、接可以共享同一个权重 池化层(Pooling layer)将卷积后的特征切成几个区域,取其最大值或平均值 得到新的、维度较小的特征,从而减少隐层结点数。通过全连接层把所有局部特征结合变成全局特征,输出识别或分类结果。卷积神经网络(CNN)无需对图像进行复杂的前期预处理 自动筛选出有利于分类的局部特征深度学习库Keras 用Python开发的多层神经网络API 能方便地集成其他开源深度学习库 Tensorflow CNTK后端等 在Anaconda集成环境中安装Keras,同时需要安装后端如Tensor low等 采用“模型”构建神经网络 pip install keras pip instal
10、l tensorflow 序贯(Sequential)模型 简单的线性模型 由多个神经网络层按输入输出顺序线性堆叠而成 只具有一个输出 函数式(Functional)模型在序贯模型基础上,允许用户定义多输出、非循环有向或具有共享层的结构序贯模型构建的神经网络 Dense层:全连接层,结点与下一层结点完全连接 Activation层:激活层,对上一层的输出施加激活函数。常用的激活函数有softmax、relu、tanh、sigmoid等 Dropout层:中断层 在训练过程中,每次更新参数时按照一定概率,随机断开指定百分比(p)的输入神经元连接,用于防止过拟合。使用Keras搭建神经网络 先定义
11、神经网络的结构,编译后方可用于模型学习、性能分析和预测。pile(loss,optimizer,metrics,)参数说明:loss损失函数,神经网络输出值与真实值之间的误差度量方法,mean_squared_error,hinge,categorical_crossentropy等optimizer优化器,神经网络的参数学习算法,有SGD,RMSprop,Adagrad,Adam等metrics列表,给出所需的性能评估指标,accuracy,例7-1:构建神经网络,为鸢尾花数据集训练分类器模型 鸢尾花数据集每个数据包含4个数据特征项,属于3种类型。神经网络输入层维度为4,输出层维度为3 中间
展开阅读全文