《深度学习》课件第二章 基础知识.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《深度学习》课件第二章 基础知识.pptx》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深度学习 深度学习 课件第二章 基础知识 深度 学习 课件 第二
- 资源描述:
-
1、第二章基础知识2.1数值计算问题2.2估计、偏差与方差2.3神经网络结构of5212.4数据准备2.5超参数与验证集2.6规模与特征工程2.1 数值计算问题第二章 基础知识of522舍入误差往往会导致算法的失效,最常见的是上溢和下溢上溢和下溢当大量级的数被近似成+或-时,计算可能会发生上溢。例如:当我们遇到零除或是对零取对数时,得到-,如果继续对-进行运算,则会导致结果无意义。当逼近零的数被四舍五入到零时,计算可能会发生下溢。未经处理就将其代入下一步计算,则同样导致结果无意义。上溢下溢2.1 数值计算问题第二章 基础知识of523Softmax函数上溢和下溢分母中至少包含一个值为1的项,不会发
2、生下溢第二章基础知识2.2估计、偏差和方差2.1数值计算问题2.3神经网络结构of5242.4数据准备2.5超参数与验证集2.6规模与特征工程2.2 估计、偏差和方差第二章 基础知识of5252.2.1 点估计2.2 估计、偏差和方差第二章 基础知识of5262.2.1 点估计2.2 估计、偏差和方差第二章 基础知识of5272.2.1 点估计【例】【解】其其他他,010,)1()(xxxf 设总体 X 的概率密度为总体 X 的数学期望为 xxxfXEd)()(2()-1 1()E X=-E X 101d)1(xx ,21 .112XX 2.2 估计、偏差和方差第二章 基础知识of5282.2
3、.1 点估计似然函数为 其其他他,0),1(10,)()1()(1nixxLiniin ,ln)1ln(ln1 niixnL niixnL1ln1dlnd ,令令0.ln11 niiXn 2.2 估计、偏差和方差第二章 基础知识of5292.2.2 偏差和方差2.2 估计、偏差和方差第二章 基础知识of52102.2.2 偏差和方差2.2 估计、偏差和方差第二章 基础知识of52112.2.2 偏差和方差2.2 估计、偏差和方差第二章 基础知识of52122.2.2 偏差-方差窘境训练不足时,学习器拟合能力不强,偏差主导随着训练程度加深,学习器拟合能力逐渐增强,方差逐渐主导训练充足后,学习器的
4、拟合能力很强,方差主导第二章基础知识2.3神经网络结构2.1数值计算问题2.3估计、偏差和方差of52132.4数据准备2.5超参数与验证集2.6规模与特征工程2.3 神经网络结构第二章 基础知识of52142.3.1 神经元 神经元的信息传递和处理是一种电化学活动。树突由于电化学作用接受外界的刺激,通过胞体内的活动体现为轴突电位,当轴突电位达到一定的值则形成神经脉冲或动作电位,再通过轴突末梢传递给其它的神经元。从控制论的观点来看,这一过程可以看作一个多输入单输出非线性系统的动态过程。可据此构建相应的数学模型。数值计算问题2.3 神经网络结构第二章 基础知识of52152.3.1 神经元2.3
5、 神经网络结构第二章 基础知识of52162.3.2 激活函数常用的激活函数主要有sigmoid函数、Tanh函数和ReLU函数等。2.3 神经网络结构第二章 基础知识of52172.3.2 激活函数特点:取值范围为-1,1,在特征相差明显时tanh函数的表现效果会很好,在循环过程中会不断扩大特征效果。缺点:前向传播计算量大,在反向传播时,容易出现梯度消失2.3 神经网络结构第二章 基础知识of52182.3.2 激活函数特点:当输入信号小于0时,输出等于0,输入信号大于0 时,输出与输入相等。缺点:存在神经元参数不更新现象2.3 神经网络结构第二章 基础知识of52192.3.4 输出单元2
6、.3 神经网络结构第二章 基础知识of52202.3.4 架构设计架构主要包括网络的单元个数,以及这些单元之间的连接方式。2.3 神经网络结构第二章 基础知识of52212.3.5 张量 1.张量表示法 近代连续介质力学和理论物理中广泛采用张量,这不仅因为采用张量表示基本方法书写高度简练,物理意义鲜明,更重要的是因为连续介质力学中出现的一些重要物理量如应力、应变等本身就是张量。在笛卡儿直角坐标系中定义的张量称为笛卡儿张量,而在任意曲线坐标系中定义的张量则称为普通张量。对我们所研究的领域而言,有了笛卡儿张量方面的知识就已经够用了。2.3 神经网络结构第二章 基础知识of52222.3.5 张量下
7、面引进几种符号:(1)表示一个矢量,i 是自由指标;(2)约定求和法则:为了书写简便,约定在同一项中如有两个自由指标相同时,就表示要对这个指标从1到3求和,如:(3)符号定义为 也称为克罗内克尔(Kronecker)。ia332211babababaii时当,时当,jijiij 1 02.3 神经网络结构第二章 基础知识of52232.3.5 张量(4)置换符号定义为 等),为奇排列(如,等),为偶排列(如,时中有两个以上指标相同,132321213312231123 1 1 0 kjikjikjiijk如321333231232221131211kjiijkaaaaaaaaaaaaksjtk
8、tjsistijk(5)恒等式2.3 神经网络结构第二章 基础知识of52242.3.5 张量 2张量的定义 设 和 是旧的和新的直角坐标系。,分别是表示新旧坐标系中坐标轴上的单位矢量。则有 321xxxO321xxxO1e2e3e1e2e3eijjijieeee333232131132322212123132121111eeeeeeeeeeeeaaaaaaaaa 此外有下列关系:其中 ,则有:,jiijaee jijia ee jjiia ee;2.3 神经网络结构第二章 基础知识of52252.3.5 张量1)标量 对于标量来说,由于标量的数值不依赖于坐标系,于是有),(),(321321
9、xxxxxx 2)矢量 考虑矢量 ,设 ;分别是 在旧和新坐标轴上的投影。则有 a321,aaa321,aaaa31321211111aaaaaaaea32322212122aaaaaaaea33323213133aaaaaaaea 由此得 iijjjijiaaa aa a2.3 神经网络结构第二章 基础知识of52262.3.5 张量 上式给出矢量的另一种定义:即对于每个直角坐标系 来说有3个量 ,它们根据上式变换到另一坐标系 中的3个量 ,则此三个量定义为一新的量 ,称为矢量。称为一阶笛卡儿张量,简称一阶张量。通常用下面表示:321xxxO321,aaa321xxxO321,aaaa ii
10、jjjijiaaa aa a123(,)aa a a2.3 神经网络结构第二章 基础知识of52272.3.5 张量321xxxOlmpijiljmlmpa ap 3)二阶张量 如果对每一直角坐标系 来说有九个量 ,按下列公式 2321311121321221331322312122322222332323313123323223333233 lmlmpa a pa a pa a pa a pa a pa a pa a pa a paa a pap 例如:2.3 神经网络结构第二章 基础知识of52282.3.5 张量转换为另一直角坐标系中 的九个量则此九个量 ,定义为一新的量P,称为二阶笛卡
11、儿张量,简称二阶张量。通常用下面表示:321xxxOijp333231232221131211pppppppppppPijijijp 称为二阶张量的分量。2.3 神经网络结构第二章 基础知识of52292.3.5 张量 4)n 阶张量 设在每一坐标系内给出3n个数 ,当坐标变换时,这些数按公式 njjjp211 21 12 21 2nn nni iii ji ji jj jjpa aap转换,则此3n个数定义一个n 阶张量。标量为零阶张量,矢量为一阶张量。第二章基础知识2.4数据准备2.1数值计算问题2.3神经网络结构of52302.2估计、偏差和方差2.5超参数与验证集2.6规模与特征工程第
展开阅读全文