深度学习介绍(共63张PPT)(同名615).pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《深度学习介绍(共63张PPT)(同名615).pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深度 学习 介绍 63 PPT 同名 615
- 资源描述:
-
1、深度学习介绍目录 深度学习概述 深度学习常见场景 深度学习常用算法介绍 深度学习常用框架介绍 TensorFlow入门 深度学习未来和展望21.1 深度学习概述3深度学习(Deep Learning,DL)由Hinton等人于2006年提出,是机器学习(MachineLearning,ML)的一个新领域。深度学习起源于人工神经网络,它的定义:通过组合低层特征形成更加抽象的高层特征或类别,从而从大量的输入数据中学习有效特征表示,并把这些特征用于分类、回归和信息检索的一种技术。深度学习被引入机器学习使其更接近于最初的目标-人工智能AI,Artificial Intelligence。深度学习是学习
2、样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。1.2 与机器学习关系4如上图,人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动。1.3 根本概念5深度学习(Deep Learning,DL):通过组合低层特征形成更加抽象的高层特征或类别,从而从大量的输入数据中学习有效特征表示,并把这些特征用于分类、回归和信息检索的一种技术。人工神经网络:是一种模仿动物神经网络行为特征,进行分布式并行信
3、息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而到达处理信息的目的。深度神经网络:包含多个隐含层的神经网络。模型:可以理解成算法和数据的合集。模型训练:利用模型的算法,使用深度神经网络进行权值的训练,最终得出一个最优解。模型预测:使用训练完成的模型进行预测,得出分类识别结果。目录 深度学习概述 深度学习常见场景 深度学习常用算法介绍 深度学习常用框架介绍 TensorFlow入门 深度学习未来和展望62 深度学习场景7当前深度学习使用的场景主要在无人驾驶,人脸识别,拍照购,智能客服,文字识别,语音识别,目标检测,图片分类等方面。深度学习无人驾驶人脸
4、识别拍照购智能客服文字识别目标检测图像分类语音识别2.1 深度学习场景-无人驾驶8无人驾驶:深度学习利用其深层的神经网络,通过一定的算法能训练出一个识别率非常高的分类器,从而能够使环境感知局部高精度的完成,为驾驶决策模块提供正确的环境信息,保证无人驾驶正常的完成。2.2 深度学习场景-人脸识别9人脸识别:人脸信息的识别,是对人脸的信息加以提取然后进行识别的方法,一个最重要的目标就是分辨不同人的信息,区分身份。面部识别的主要方式有:几何结构、子空间局部特征以及深度学习。安防领域开户审核考勤门禁.2.3 深度学习场景-文字识别10文字识别:基于深度学习的文字识别系统的实现方法,属于图像处理技术领域
5、,将包含文字的图片进行预处理、切分、识别,重组成一段文本,从而实现图片到文本的转换。涉及到图像预处理、图片切分、图片识别和文字重组。审核车牌识别文档识别.2.4 深度学习场景-图像识别11图片识别:图像识别与人脸及文字识别类似,主要流程包括图像预处理,图像分割,图像特征提取和图像分类。图像审核拍照购工业医疗检测目标识别.2.5 深度学习场景-语音识别12语音识别:一个完整的语音识别系统可大致分为3局部:语音特征提取、声学模型与模式匹配和语言模型与语言处理。其中声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一局部。语音审核语音转文字语音控制.目录 深度学习概述 深度学习常见场景 深度
6、学习常用算法介绍 深度学习常用框架介绍 TensorFlow入门 深度学习未来和展望133.1 人工神经网络ANN14人工神经网络Artificial Neural Networks是一种模仿生物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点神经元之间相互连接的权重,从而到达处理信息的目的。3.1 人工神经网络ANN15神经网络3.1 人工神经网络ANN16人工神经网络的重要概念:1 权值矩阵:相当于神经网络的记忆!在训练的过程中,动态调整和适应。2 鼓励函数:3.1 人工神经网络ANN17人工神经网络的重要概念:鼓励函数很重要,无论是
7、对建立神经网络的模型,还是理解神经网络。首先要了解,它有以下几个影响:1 如何能更好的求解目标函数的极值!高等数学中求解函数极值的知识!可微,单调!2 如何提升训练效率,让梯度的优化方法更稳定;3 权值的初始值,不影响训练结果!3.1 卷积神经网络CNN18卷积神经网络Convolutional Neural Networks/CNNs/ConvNets与普通神经网络非常相似,它们都由具有可学习的权重和偏置常量(biases)的神经元组成。每个神经元都接收一些输入,并做一些点积计算,输出是每个分类的分数,普通神经网络里的一些计算技巧到这里依旧适用。与普通神经网络不同之处:卷积神经网络默认输入是
8、图像,可以让我们把特定的性质编码入网络结构,使是我们的前馈函数更加有效率,并减少了大量参数。3.1 卷积神经网络CNN19卷积操作:对图像不同的数据窗口数据和滤波矩阵一组固定的权重:因为每个神经元的权重固定,所以又可以看做一个恒定的滤波器filter做内积逐个元素相乘再求和的操作就是所谓的卷积操作,也是卷积神经网络的名字来源。3.1 卷积神经网络CNN203.1 卷积神经网络CNN213.1 卷积神经网络CNN22卷积层Convolutional layer,卷积神经网路中每层卷积层由假设干卷积单元组成,每个卷积单元的参数都是通过反向传播算法优化得到的。卷积运算的目的是提取输入的不同特征,第一
9、层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网络能从低级特征中迭代提取更复杂的特征。线性整流层Rectified Linear Units layer,ReLU layer,这一层神经的鼓励函数Activation function使用线性整流Rectified Linear Units,ReLUf(x)=max(0,x)。池化层Pooling layer,通常在卷积层之后会得到维度很大的特征,将特征切成几个区域,取其最大值或平均值,得到新的、维度较小的特征。全连接层 Fully-Connected layer,把所有局部特征结合变成全局特征,用来计算最后每一类的得分。3
10、.1 卷积神经网络CNN233.1 卷积神经网络CNN24在图像处理中,往往把图像表示为像素的向量,比方一个10001000的图像,可以表示为一个1000000的向量。在上一节中提到的神经网络中,如果隐含层数目与输入层一样,即也是1000000时,那么输入层到隐含层的参数数据为10000001000000=1012,这样就太多了,根本没法训练。所以图像处理要想练成神经网络大法,必先减少参数加快速度。就跟辟邪剑谱似的,普通人练得很挫,一旦自宫后内力变强剑法变快,就变的很牛了。3.1 卷积神经网络CNN25卷积神经网络有两种神器可以降低参数数目,第一种神器叫做局部感知。在下方右图中,假设每个神经元
11、只和1010个像素值相连,那么权值数据为1000000100个参数,减少为原来的万分之一。而那1010个像素值对应的1010个参数,其实就相当于卷积操作。3.1 卷积神经网络CNN26这样的话参数仍然过多,那么就启动第二级神器,即权值共享。在上面的局部连接中,每个神经元都对应100个参数,一共1000000个神经元,如果这1000000个神经元的100个参数都是相等的,那么参数数目就变为100了。怎么理解权值共享呢?我们可以这100个参数也就是卷积操作看成是提取特征的方式,该方式与位置无关。这其中隐含的原理那么是:图像的一局部的统计特性与其他局部是一样的。这也意味着我们在这一局部学习的特征也能
12、用在另一局部上,所以对于这个图像上的所有位置,我们都能使用同样的学习特征。3.1 卷积神经网络CNN27上面所述只有100个参数时,说明只有1个100*100的卷积核,显然,特征提取是不充分的,我们可以添加多个卷积核,比方32个卷积核,可以学习32种特征。在有多个卷积核时,如以下图所示:3.1 卷积神经网络CNN28池化,也称作下采样,可以实现降维。常用有最大值池化和均值池化。3.1 卷积神经网络CNN29全连接层:连接所有的特征,将输出值送给分类器如softmax分类器,最终得出识别结果。3.2 常见网络模型30LeNet3.2 常见网络模型31AlexNet3.2 常见网络模型32VGG1
13、64 计算图 Computational Graph深度学习起源于人工神经网络,它的定义:通过组合低层特征形成更加抽象的高层特征或类别,从而从大量的输入数据中学习有效特征表示,并把这些特征用于分类、回归和信息检索的一种技术。深度学习研究的热潮持续高涨,各种开源深度学习框架也层出不穷,其中包括TensorFlow、Caffe、Keras、CNTK、Torch7、MXNet、Leaf、Theano、DeepLearning4、Lasagne、Neon等等。线性整流层Rectified Linear Units layer,ReLU layer,这一层神经的鼓励函数Activation functi
14、on使用线性整流Rectified Linear Units,ReLUf(x)=max(0,x)。Google、Microsoft、Facebook等巨头都参与了这场深度学习框架大战,此外,还有毕业于伯克利大学的贾扬清主导开发的Caffe,蒙特利尔大学LisaLab团队开发的Theano,以及其他个人或商业组织奉献的框架。部署模型,提供预测效劳square(linear_model-y)Tensorflow编程包含两个步骤:与普通神经网络不同之处:卷积神经网络默认输入是图像,可以让我们把特定的性质编码入网络结构,使是我们的前馈函数更加有效率,并减少了大量参数。print(node1,node2
15、)以下图是各个开源框架在GitHub上的数据统计2021年初。构造一个简单的计算图:每个节点将0或多个tensor作为输入,输出一个tensor。adder_node:Tensor(add:0,dtype=float32)在有多个卷积核时,如以下图所示:首先要了解,它有以下几个影响:评估一个节点,必须在一个会话Session中运行计算图,会话封装了Tensorflow运行时的状态和控制核心层面向机器学习的研究人员,以及对模型控制精细的相关人员。3.2 常见网络模型33GoogleNet InceptionV43.2 常见网络模型34比较3.3 其他深度学习算法35自动编码器AutoEncode
16、r稀疏编码Sparse Coding限制玻尔兹曼机RBM目录 深度学习概述 深度学习常见场景 深度学习常用算法介绍 深度学习常用框架介绍 TensorFlow入门 深度学习未来和展望364.1 开源框架概述37深度学习研究的热潮持续高涨,各种开源深度学习框架也层出不穷,其中包括TensorFlow、Caffe、Keras、CNTK、Torch7、MXNet、Leaf、Theano、DeepLearning4、Lasagne、Neon等等。以下图是各个开源框架在GitHub上的数据统计2021年初。4.1 开源框架概述38Google、Microsoft、Facebook等巨头都参与了这场深度学
17、习框架大战,此外,还有毕业于伯克利大学的贾扬清主导开发的Caffe,蒙特利尔大学LisaLab团队开发的Theano,以及其他个人或商业组织奉献的框架。下表是主流深度学习框架在各个维度的评分。4.2 TensorFlow39TensorFlow最初是由研究人员和Google Brain团队针对机器学习和深度神经网络进行研究所开发的,目前开源之后可以在几乎各种领域适用。TensorFlow灵活的架构可以部署在一个或多个CPU、GPU的台式以及效劳器中,或者使用单一的API应用在移动设备中。4.3 Caffe40Caffe由加州大学伯克利的PHD贾扬清开发,全称Convolutional Arch
18、itecture for Fast Feature Embedding,是一个清晰而高效的开源深度学习框架,目前由伯克利视觉学中心Berkeley Vision and Learning Center,BVLC进行维护。贾扬清曾就职于MSRA、NEC、Google Brain,他也是TensorFlow的作者之一,目前任职于Facebook FAIR实验室。Caffe2脸书(Facebook)出品,为生产环境设计,提供在各种平台包括移动设备的运行。4.4 Torch41Torch是一个有大量机器学习算法支持的科学计算框架,其诞生已经有十年之久,但是真正起势得益于Facebook开源了大量Tor
展开阅读全文