基于机器学习方法的前列腺病理切片图像识别培训课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《基于机器学习方法的前列腺病理切片图像识别培训课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习方法 前列腺 病理 切片 图像 识别 培训 课件
- 资源描述:
-
1、基于机器学习方法的前列腺病理切片图像识别第一章 绪论1.课题背景及意义2.前列腺形态组织特征简述3.国内外研究现状4.机器学习方法介绍2基于机器学习方法的前列腺病理切片图像识别1.1 课题背景及意义 最近几十年,随着人们生活水平的提高,健康越来越受到人们的重视随着人们生活水平的提高,健康越来越受到人们的重视,是当前社会最为关注的话题之一。男性生殖系统最常见的恶性肿瘤就是前列腺癌,前列腺癌在西方发达国家的发病率以及死亡率仅次于肺癌,位居男性癌症死亡的第二位。中国则是一直被认为前列腺癌发病率较低的国家,所以在前列腺癌的诊断和研究方面落后于国际水前列腺癌的诊断和研究方面落后于国际水平平,同时在国内也
2、落后于肝癌、胃癌、乳腺癌等相对高发病率肿瘤的研究。但近年来,饮食、生活习惯西化以及受到人口老龄化等因素的影响,我国前列腺癌的发病率逞上升我国前列腺癌的发病率逞上升趋势趋势,逐步成为威胁中老年男性身心健康的头号杀手。近年来,随着计算机技术以及机器学习方法的发展,计算机辅助诊断(CAD)系统成为临床辅助诊断的一个新趋势。CAD 系统对于病理诊断有许多优点:1)CAD 系统一旦核心算法确定,系统的准确率只与内部核心的算法有关,与人为因素无关,同一幅图像不管诊断多少次,都会是相同的结果;2)CAD 系统能够捕捉到切片的所有区域,避免出现遗漏;3)CAD 系统作为辅助,对提高医生诊断的敏感性和特异性有很
3、大帮助;4)CAD系统能让医疗水平欠发达的地区,也能享受到科技进步所带来的好处。所以,越来越多越来越多的专家、学者投入到这一领域中来,前列腺辅助诊断系统的核心算法也成为了研究的热的专家、学者投入到这一领域中来,前列腺辅助诊断系统的核心算法也成为了研究的热点。点。3基于机器学习方法的前列腺病理切片图像识别1.2 前列腺形态组织特征简述 l 正常的前列腺组织学特征正常的前列腺组织有四种明显的结构特征:1.分叶结构。腺腔和腺叶分割为小叶;2.大腺腔结构。腺腔内乳头突起使得腺腔呈梅花状结构,腺腔体积较大;3.腺腔上皮由内外层细胞构成双层的结构;4.腔内有淀粉样小体。上述结构特征一般不出现在有病变的前列
4、腺组织中。因此,上述四种结构特征弱化甚至消失就是前列腺癌诊断的重要依据。图 1-1 正常的前列腺病理切片图像 4基于机器学习方法的前列腺病理切片图像识别1.2 前列腺形态组织特征简述l 1.2.2 前列腺癌的病理特征有癌变的前列腺组织主要有以下特征:1.腺体结构的紊乱,浸润现象,细胞核的异型。2.前列腺癌病理图像对应的特征为:腺腔逐渐较小,且腺腔的边界变得平滑,没有凸起;3.间质纹理比较紊乱,方向不一致;4.细胞核变大且数量明显变多。图 1-2 前列腺癌病理切片图像5基于机器学习方法的前列腺病理切片图像识别1.3 国内外研究现状l 随着计算机医学图像处理技术的发展,在病理分析和细胞随着计算机医
5、学图像处理技术的发展,在病理分析和细胞组织形态等研究工作中,数字图像里处理技术的作用越来组织形态等研究工作中,数字图像里处理技术的作用越来越大,如何将图像处理、模式识别、机器学习等技术最新越大,如何将图像处理、模式识别、机器学习等技术最新的发展运用到医学图像上,已成为当前社会研究的热点之的发展运用到医学图像上,已成为当前社会研究的热点之一一。l 在国内,杨振森等人提出了前列腺直肠超声图像中纹理特征的提取方法,应用于前列腺癌的早期诊断,识别准确率达到 90%以上。总体来说,目前国内在前列腺病理切片图像研究方面还处于起步阶段。l 在国外,Ali Tabesh等人从前列腺病理切片图像中,提取了颜色直
6、方图、分形维数、分形编码特征、小波特征、颜色、形状和纹理等多特征融合,用于前列腺癌诊断和 Gleason 分级,分别取得了 94.5%和 77.6%的准确率。目前目前国外的研究人员和学者主要工作在特征集类别、分类器选国外的研究人员和学者主要工作在特征集类别、分类器选择以及前列腺癌的分类策略方面。择以及前列腺癌的分类策略方面。6基于机器学习方法的前列腺病理切片图像识别1.4 机器学习方法介绍l 近年来,计算机技术和机器学习方法都得到极大的发展,机器学习在图像上的应用也取得了相当大的突破。特别是在 2012 年 ImageNet 目标识别竞赛上,由 Geoff Hinton团队实现的基于神经网络的
7、深度学习的算法以 85%的准确率获得最佳算法,将历届最好成绩提高了 11%,这引起了学术界和工业界的又一波机器学习的热潮。本文在前列腺病本文在前列腺病理切片图像的识别方面采用了深度学习算法和支持向量机理切片图像的识别方面采用了深度学习算法和支持向量机(Support Vector Machine,SVM)分类算法)分类算法。7基于机器学习方法的前列腺病理切片图像识别1.4.1 深度学习简介 深度学习是一种无深度学习是一种无监督学习监督学习。深度学习的概念最开始来自于人工神经网络的研究。深度学习一般通过组合较低组合较低层的特征层的特征形成更为抽象的高层表示,从而发现数据特征的分布式表示,如图1-
8、3 所示。图 1-3 深度学习的特征层级对象模型对象的局部特征(边缘特征的组合)边缘特征8基于机器学习方法的前列腺病理切片图像识别1.4.1 深度学习简介l 深度学习算法是基于分布式表达分布式表达(在上世纪80年代和连接机制一起被引入)的方法。分布式表达所基于的假设是所观测到的数据是由多种因素所观测到的数据是由多种因素(并不是所有都被观测到)交互产生的,也就是从其他因(并不是所有都被观测到)交互产生的,也就是从其他因子组合中学习一个特殊的因子子组合中学习一个特殊的因子,这样往往可以推广到其他不可见因子的组合。深度学习加入了这些因子被组织成多层的这个假设(被视为一个先验的未知数据生成过程),对应
9、了不同层次的抽象或组成:高层次的表示是通过改造低层次的表示来获得的。这些因子之间的关系可以被看作类似字典或维基百科中词条之间的关系,尽管这些因子可能是数值的(比如人脸在图像中的位置)或类别的(比如是否是人脸),而在字典中的条目则是纯粹的符号。适当数量的层数和结构相关的因子,也是深度学习算法希望从样本中发现的。9基于机器学习方法的前列腺病理切片图像识别1.4.1 深度学习简介l 深度学习算法也涉及其他重要的思想,对应于这些未知潜未知潜在因子的广泛先验信念在因子的广泛先验信念。关于监督学习的有趣任务(比如,给定一张图像,预测出某人的脸是否出现在图像中),一个重要的先验信息就在因子中,解释了再输入的
10、观测变化(比如图像),有一些因子是和预测偏好高度相关的。l 许多深度学习算法实际上都是非监督学习的框架,比如用许多未标记的图像,并从这些图像中找他一组关于这些图像的好的表示。l 深度学习在图像分类、语音识别、手写识别等方面都取得了比较好的效果,甚至在一些标准数据库上的实验效果已经超过了传统模式识别的方法。10基于机器学习方法的前列腺病理切片图像识别1.4.2 支持向量机简介l SVM 广泛地应用于统计分类以及回归分析,是一种监督式监督式的学习方法的学习方法。l SVM 属于一般化线性分类器一般化线性分类器,这类分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区,因此支持向量机SVM 也
11、被称为最大边缘区分类器最大边缘区分类器。l SVM 是将较低维的向量映射到一个更高维的空间里较低维的向量映射到一个更高维的空间里,在这个高维空间里求得一个最大间隔超平面。在分开数据样本的超平面的两边得到两个互相平行的超平面,分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。11基于机器学习方法的前列腺病理切片图像识别第二章 深度学习的基本方法1.稀疏自编码2.受限波尔兹曼机(RBM)3.栈式自编码神经网络的训练 4.深度信念网络的训练12基于机器学习方法的前列腺病理切片图像识别l 深度学习算法需要构建深度的架构,有许多方法都可以用来进行构建深度架构,
12、常用的有稀疏自编码(Sparse Autoencoder)、受限玻尔兹曼机(Restrict Boltzmann Machine)、稀疏编码(Sparse Coding)等。l 本章详细介绍前面两种方法,并分别介绍基于稀疏自编码和受限玻尔兹曼机的深度网络的构建和训练。其中基于稀疏自编码的深度网络称作栈式自编码(栈式自编码(Stacked Autoencoders)神经网络)神经网络,基于受限玻尔兹曼机的深度网络被称作深度信念网络(深度信念网络(Deep Belief Networks,DBN)。第二章 深度学习的基本方法13基于机器学习方法的前列腺病理切片图像识别2.1 稀疏自编码 l 稀疏自
13、编码能有效构建出深度神经网络,从而对输入数据进行深度学习。稀疏自编码能够学习出输入数据的稀疏表示,达到降维的目的,该过程为无监督的学习。1.神经元2.神经网络模型3.反向传播算法4.稀疏自编码的含义14基于机器学习方法的前列腺病理切片图像识别2.1.1 神经元l 为了模拟人脑处理信息的特点,就用人工神经元类比生物神经元,人工神经元主要有以下基本特征:1.神经元之间的联接强度决定信号传递的强弱;2.神经元之间的联接强度可以随训练改变;3.信号可以是起刺激作用,也可以是抑制作用;4.一个神经元接受信号的累计效果决定该神经元的状态;5.每个神经元可以有一个阈值。15基于机器学习方法的前列腺病理切片图
14、像识别2.1.1 神经元l 对于样本集(x(i),y(i),神经网络算法提供了一种复杂又非线性的假设模型hw,b(x),它具有参数 W,b,可以用这两个参数来拟合我们的数据。神经元是神经网络中最基本的单元。如下图所示:图 2-1 神经元 16基于机器学习方法的前列腺病理切片图像识别2.1.1 神经元l 这个神经元是一个以x1,x2,x3及常数项 1 为输入值的运算单元,其输出为:l 其中函数 f:RR称为激活函数。激活函数将选用 Sigmoid 函数:(2-2)(2-1)17基于机器学习方法的前列腺病理切片图像识别2.1.1 神经元l 其实,这个神经元的输入这个神经元的输入输出的映射关系就是一
15、个输出的映射关系就是一个逻辑回归函数逻辑回归函数。l 对于公式(2-2),f(z)导数就如下所示,后面在求参数梯度的时候会用到。(2-3)18基于机器学习方法的前列腺病理切片图像识别2.1.2 神经网络模型 l 神经网络由大量的人工神经元联结进行计算。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。下图就是一个简单的神经网络:19基于机器学习方法的前列腺病理切片图像识别2.1.2 神经网络模型 l 如图所示,使用圆圈来表示
16、神经网络的输入,其中“+1”的圆圈称为“偏置单元”,也就是常数项。神经网络最左边的一层是输入层,最右的一层是输出层。中间所有节点组成的一层被称作隐藏层。图所表示的神经网络有 3 个输入单元(不包括常数项),3 个隐藏单元以及 1 个输出单元。图 2-3 基本的神经网络示模型 20基于机器学习方法的前列腺病理切片图像识别2.1.2 神经网络模型 l 用ai(i)表示第 l 层第 i 号单元的输出值。当 l1 时,ai(i)=x,也就是第 i 个特征的输入值。对于给定参数集合 W,b,我们的神经网络就按照函数hW,b(x)计算输出结果。图2-3 的神经网络的计算过程就由以下步骤表示:(2-4)21
17、基于机器学习方法的前列腺病理切片图像识别2.1.2 神经网络模型 l 用zi(l)表示第 l 层第 i 单元输入值的加权总和(包括偏置单元),这样我们就可以找到一种更简洁的表示法。这里将激活函数 f(.)扩展为用向量来表示,那么上面的等式我们就可以表示为:(2-5)以上步骤叫作正向传播。22基于机器学习方法的前列腺病理切片图像识别2.1.2 神经网络模型 l 神经网络也可以有多个输出单元。神经网络也可以有多个输出单元。比如,以下神经网络有两层隐藏层:L2及L3,并在L4 层中有两个输出单元。要求解这种神经网络就需要样本集(x(i),y(i),其中y(i)R2。如果想预测的输出是多个的,那这种神
18、经网络是很适用的。图 2-4 多个输出单位的神经网络 23基于机器学习方法的前列腺病理切片图像识别2.1.3 反向传播算法l 反向传播算法是一种监督学习算法反向传播算法是一种监督学习算法,常被用来训练多层感知机。反向传播算法主要由两个环节(激励传播、权重更新)反复循环迭代,直到网络的对输入的响应达到预定的目标范围为止。l 激励传播环节包含两个步骤:1.(前向传播阶段)将训练输入送入网络以获得激励响应;2.(反向传播阶段)将激励响应同训练输入对应的目标输出求差,从而获得隐层和输出层的响应误差。l 权重更新则按以下步骤进行更新:1.将输入激励和响应误差相乘,从而获得权重的梯度;2.将这个梯度乘上一
19、个比例并取反后加到权重上。24基于机器学习方法的前列腺病理切片图像识别2.1.3 反向传播算法l 反向传播算法的思路如下:给出一个样本(x,y),首先进行前向传导运算,计算出通过网络的所有激活值,包括hW,b(x)的输出值。之后,针对第L层的每一个节点 i,我们想要计算出残差 i(l)(德尔塔),该残差表明了该节点对最终输出值的残差产生了多少影响。对于最终的输出节点,可以直接得出网络产生的激活值与实际值之间的差距,将这个差距定义为i(nl),第n1层代表的是输出层。将基于节点残差的加权平均值计算,这些节点以ai(l)作为输入。下面将给出反向传播算法的细节:25基于机器学习方法的前列腺病理切片图
20、像识别2.1.3 反向传播算法26基于机器学习方法的前列腺病理切片图像识别2.1.4 稀疏自编码的含义 图 2-5 自编码神经网络27基于机器学习方法的前列腺病理切片图像识别2.1.4 稀疏自编码的含义 稀疏性数学意义可以按如下解释,如果当神经元的输出接近于 1 的时候我们认为它被激活,而输出接近于 0 的时候认为它被抑制,那么使得神经元大部分的时间都是被抑制的限制则被称作稀疏性限制。28基于机器学习方法的前列腺病理切片图像识别2.2 受限玻尔兹曼机(Restrict Boltzmann Machine)受限玻尔兹曼机(受限玻尔兹曼机(RBM)是一类具有两层结构、对称连接)是一类具有两层结构、
21、对称连接且无自反馈的随机神经网络模型,层间全连接,层内无连且无自反馈的随机神经网络模型,层间全连接,层内无连接接。RBM 是一种有效的特征提取方法,用于初始化前馈神经网络可明显提高泛化能力。堆叠多个堆叠多个 RBM 组成的深度组成的深度信念网络能提取更抽象的特征。信念网络能提取更抽象的特征。1.受限玻尔兹曼机的基本模型2.基于对比散度的 RBM 快速学习算法29基于机器学习方法的前列腺病理切片图像识别2.2.1 受限玻尔兹曼机的基本模型RBM 可以被看作是一种无向图模型可以被看作是一种无向图模型,如下图所示。v 是可见层单元,表示可以观测到的数据,h 是隐藏层单元,可看作特征检测器,通过观测数
22、据进入网络后生成隐藏特征,W 表示可见单元和隐藏单元之间的连接权重。RBM 的可见层单元和隐藏层单元可以是任意的指数族单元,如高斯单元、Softmax 单元、泊松单元等等。30基于机器学习方法的前列腺病理切片图像识别2.2.1 受限玻尔兹曼机的基本模型31基于机器学习方法的前列腺病理切片图像识别2.2.1 受限玻尔兹曼机的基本模型32基于机器学习方法的前列腺病理切片图像识别2.2.2 基于对比散度的 RBM 快速学习算法l 深度学习算法的发明者 Hinton提出了一个快速学习 RBM 的算法,即对比散度。本文所采用基于对比散度的快速学习算法步骤如下:33基于机器学习方法的前列腺病理切片图像识别
23、2.2.2 基于对比散度的 RBM 快速学习算法34基于机器学习方法的前列腺病理切片图像识别2.3 栈式自编码神经网络的训练栈式自编码神经网络是将多个稀疏自编码串联所成的深度栈式自编码神经网络是将多个稀疏自编码串联所成的深度神经网络,可以采用依次训练每一层的贪心分层算法来预神经网络,可以采用依次训练每一层的贪心分层算法来预训练深度神经网络训练深度神经网络。在本小节中,主要介绍如何将自编码网络以贪心分层的方式串联起来,以及如何预训练深度神经网络的参数。35基于机器学习方法的前列腺病理切片图像识别2.3.1 栈式自编码神经网络概述36基于机器学习方法的前列腺病理切片图像识别2.3.2 逐层训练37
24、基于机器学习方法的前列腺病理切片图像识别2.3.3 微调栈式自编码神经网络38基于机器学习方法的前列腺病理切片图像识别2.3.3 微调栈式自编码神经网络39基于机器学习方法的前列腺病理切片图像识别2.4 深度信念网络的训练 深度信念网络是由多个 RBM 串联所形成的深度神经网络。40基于机器学习方法的前列腺病理切片图像识别2.4 深度信念网络的训练 深度信念网络是一个生成深度信念网络是一个生成式模型式模型(以 P 的分布生成路径),是对输入进行多层表示的一种方法(以 Q 的分布识别路径)。最高的两层h2 和h3组成一个 RBM(受限玻尔兹曼机),较低的层组成一个有向图模型。倒数第二层的先验h2
25、是由顶层 RBM 提供。41基于机器学习方法的前列腺病理切片图像识别2.4 深度信念网络的训练 我们以逐层贪心的方式训练 DBN 的时候,用一个纯非监督的方式训练一个 DBN,在每一层单独训练过程中,都是利用前面提到基于对比散度的RBM 快速学习算法。42基于机器学习方法的前列腺病理切片图像识别2.4 深度信念网络的训练 算法 2.2 逐层贪心的 DBN 训练算法 43基于机器学习方法的前列腺病理切片图像识别第三章 基于深度学习的前列腺病理图像判断 1.非监督学习2.Softmax 回归分类器3.基于 ROC 曲线的全局判断 44基于机器学习方法的前列腺病理切片图像识别第三章 基于深度学习的前
展开阅读全文