深度学习的相关算法研究课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《深度学习的相关算法研究课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深度 学习 相关 算法 研究 课件
- 资源描述:
-
1、西安交通大学西安交通大学 数学与统计学院数学与统计学院张讲社张讲社 西安交通大学统计系西安交通大学统计系主要内容主要内容324151.1 1.1 深度学习的背景及意义深度学习的背景及意义最多含单个将原始信号转换到特定问题空间最多含单个将原始信号转换到特定问题空间特征的简单结构,特征的简单结构,。浅层学习的局限性浅层学习的局限性 在有限的样本和计算单元的情况下在有限的样本和计算单元的情况下对复杂函数的表示能力有限对复杂函数的表示能力有限 缺乏发现数据中复杂结构的能力缺乏发现数据中复杂结构的能力 针对复杂分类问题其针对复杂分类问题其泛化能力受到泛化能力受到一定限制一定限制 GoogleGoogle
2、的语音识别实验证明,面对的语音识别实验证明,面对大数据大数据,浅层结构算法,浅层结构算法经常处于严经常处于严重的欠拟合状态重的欠拟合状态。n 机器学习是使计算机具有人工智能的根本途径机器学习是使计算机具有人工智能的根本途径人类大脑的信息处理系统人类大脑的信息处理系统是一多层是一多层并行系统,它利用逐层的方式对数并行系统,它利用逐层的方式对数据进行特征提取,从低层到高层的据进行特征提取,从低层到高层的特征表示越来越抽象。抽象层面越特征表示越来越抽象。抽象层面越高,越能表现语义或者意图。高,越能表现语义或者意图。人类的认知过程是以深度的方式呈现的,层次化地人类的认知过程是以深度的方式呈现的,层次化
3、地组织思想和概念:首先学习简单的概念,然后使用组织思想和概念:首先学习简单的概念,然后使用学习到的简单概念表示抽象层面更高的概念。学习到的简单概念表示抽象层面更高的概念。面对复杂的感知数据,人类总能做出合理的判断面对复杂的感知数据,人类总能做出合理的判断n 人类大脑的结构和信息处理机制人类大脑的结构和信息处理机制n 人类的认知过程人类的认知过程1.1 1.1 深度学习的背景及意义深度学习的背景及意义提取抽象水平提取抽象水平较低的特征较低的特征提取抽象水平提取抽象水平较高的特征较高的特征1.1 1.1 深度学习的背景及意义深度学习的背景及意义深度学习的概念起源于人工神经网络的研究深度学习的概念起
4、源于人工神经网络的研究基于数据处理基于数据处理群方法训练群方法训练的网络模型的网络模型1965年年1979年年卷积神经卷积神经网络模型网络模型多层前向多层前向网网1986年年2006年年1.2 1.2 深度学习的发展深度学习的发展u 复兴复兴BPBP方法的局限性方法的局限性*深度结构的新发展深度结构的新发展8l 深度学习成熟条件深度学习成熟条件1 1数据集的增大数据集的增大图 6 数据集与年份9l 深度学习成熟条件深度学习成熟条件2 2神经元之间的连接数增大(本质原因神经元之间的连接数增大(本质原因是计算机硬件技术的飞速发展)是计算机硬件技术的飞速发展)图 7 神经元连接与年份10l 深度学习
5、成熟条件深度学习成熟条件3 3神经元个数的增加(本质原因是神经元个数的增加(本质原因是计算机硬件技术的飞速发展)计算机硬件技术的飞速发展)图 8 神经元个数与年份11l 好算法的出现:好算法的出现:2006 2006年,年,Geoffrey HintonGeoffrey Hinton在在ScienceScience上发表了一篇名为上发表了一篇名为Reducing with Reducing with Dimensionality of Data with Neural NetworksDimensionality of Data with Neural Networks的文章,从此,神经网络的
6、文章,从此,神经网络(主要是深度学习)便有焕发了新的青春。(主要是深度学习)便有焕发了新的青春。图 9 Geoffrey Hinton与他的学生在Science上发表文章1.2 1.2 深度学习的发展深度学习的发展u 在学术界的研究现状及应用在学术界的研究现状及应用子模型的选子模型的选取与建立取与建立深度结构的深度结构的整体训练整体训练语音和音频语音和音频信号处理信号处理图像识别图像识别和检索和检索自然语言处理自然语言处理和信息检索和信息检索 1.2 1.2 深度学习的发展深度学习的发展u 在工业界的发展在工业界的发展l 互联网界巨头进入深度学习领域互联网界巨头进入深度学习领域图 15 机器学
7、习界的执牛耳者与互联网的大鳄的联姻18(Hinton et al.2006,(Hinton et al.2006,BengioBengio et al.2007)et al.2007)1.3 1.3 深度信念网深度信念网RBMRBM(Hinton et al.2006,(Hinton et al.2006,BengioBengio et al.2007)et al.2007)1.4 1.4 深度信念网深度信念网RBMRBM(Hinton et al.2006,(Hinton et al.2006,BengioBengio et al.2007)et al.2007)1.4 1.4 深度信念网深
8、度信念网RBMRBM(Hinton et al.2006,(Hinton et al.2006,BengioBengio et al.2007)et al.2007)1.4 1.4 深度信念网深度信念网1.4 1.4 深度信念网深度信念网提出了一种用于训练多层前向网的新算法提出了一种用于训练多层前向网的新算法建立了基于率失真理论的深度学习模型建立了基于率失真理论的深度学习模型提出了对图像变换稳定的分类提出了对图像变换稳定的分类RBMRBM模型模型提出了用于训练提出了用于训练RBMRBM的等能量并行回火算法的等能量并行回火算法主要工作主要工作22稀疏连接稀疏连接稀疏响应稀疏响应神经元群神经元群刺
9、激刺激(Morris et al.2003(Morris et al.2003 Barlow,1972 Barlow,1972 OlshausenOlshausen et al.2004)et al.2004)(连接稀疏连接稀疏)(响应稀疏响应稀疏)2.1 2.1 稀疏响应稀疏响应训练方法训练方法稀疏响应稀疏响应BPBP网的结构网的结构输入向量输入向量隐隐 层层输出向量输出向量后向传播后向传播误差信号误差信号前向传播信息,计前向传播信息,计算网络的实际输出算网络的实际输出稀疏响应稀疏响应BPBP网网(SRBP)2.2 2.2 基于稀疏响应的多层前向网基于稀疏响应的多层前向网xy输入层输入层 隐
10、层隐层网络结构网络结构两类数据(红色,蓝色)两类数据(红色,蓝色)样本数:样本数:384384双螺旋数据双螺旋数据2.3 2.3 实验实验2.3 2.3 实验实验训练误差线训练误差线隐层神经元隐层神经元(第二个隐第二个隐层层)在所有样本上响应在所有样本上响应的直方图的直方图BP(Hinton et al.1986)RoBP(Hirasawa 2009)GaBP(Girosi et al.1995)LaBP(Williams 1995)EnBP2(Chauvin 1995)EnBP3(Chauvin 1995)EnBP1(Chauvin 1995)SaBP第第二二个个隐隐层层在在整整个个数数据据
11、区区域域上上的的响响应应情情况况SRBPBP2.3 2.3 实验实验2.3 2.3 实验实验Iris datasetHepatitis datasetGlass datasetWine datasetDiabetesUCIUCI数据集数据集2.3 2.3 实验实验2.3 2.3 实验实验Iris隐层神经元在四个训练样本上的响应柱状图隐层神经元在四个训练样本上的响应柱状图HepatitisClassWineDiabetesIrisHepatitisGlassWineDiabetes隐层神经元在所有训练样本上的响应直方图隐层神经元在所有训练样本上的响应直方图2.3 2.3 实验实验数据集数据集BP
12、GaBPLaBpRoBPEnBP1EnBP2EnBP3SRBPIris96.93%96.67%95.60%96.53%96.93%97.07%97.07%97.33%(4.90)(4.71)(7.08)(5.59)(0.24)(0.24)(0.24)(0.22)Hepatitis72.25%75.25%78.00%78.00%81.50%79.75%80.25%84.25%(22.77)(21.35)(15.48)(17.05)(1.61)(1.59)(1.22)(1.33)Glass93.75%93.37%93.85%93.65%92.88%93.26%93.55%94.01%(5.67)(
13、5.90)(5.88)(5.78)(0.28)(0.24)(0.24)(0.26)Wine97.52%97.63%97.86%98.08%98.08%97.97%98.19%98.19%(3.43)(3.03)(3.18)(2.70)(0.00)(0.10)(0.14)(0.14)Diabetes74.93%75.97%74.43%75.40%76.49%77.17%77.17%77.40%(6.14)(5.32)(7.47)(5.71)(0.26)(0.17)(0.18)(0.17)测试集分类精度,测试集分类精度,5050次实验的平均结果次实验的平均结果2.3 2.3 实验实验2.3 2.3
14、 实验实验2.3 2.3 实验实验大脑中每个大脑中每个神经元在响应时都会比不响应时消耗更多的能量神经元在响应时都会比不响应时消耗更多的能量。我们用新模型中所有隐层神经元的响应值与我们用新模型中所有隐层神经元的响应值与BPBP网隐层神经元的响应值的比值网隐层神经元的响应值的比值来判断在来判断在BPBP网中引入稀疏响应限制是否节省网络处理数据所需要的能量。网中引入稀疏响应限制是否节省网络处理数据所需要的能量。数据集数据集Two-spiralIrisHepatitisGlassWineDiabetesGaBP/BP1.00051.00730.83840.97370.99980.9981RoBP/BP
展开阅读全文