机器学习与深度学习实践-人工智能python课程课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《机器学习与深度学习实践-人工智能python课程课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 深度 实践 人工智能 python 课程 课件
- 资源描述:
-
1、假设参与此门课程的同学具有python基础及高等数学基础。不要求有深刻的算法基础,但对于基本的数据结构和算法要有一定了解。参考资料:取自于sklearn、tensorflow官方网站、斯坦福大学CS224d、CS231n课件、Github的部分代码仓库、部分来源于网络和搜索引擎,也有部分资料和代码是自行完成的。参考书籍:机器学习、统计学习方法、模式识别与机器学习、Hands-On Machine Learning With Scikit-Learn&TensorFlow等课后如果有问题,欢迎联系交流Day1大纲 线性回归,Logistic 回归,Softmax回归 多种决策树模型,Baggin
2、g,Boosting思想 自然语言处理,文本分类人工智能概述 从人工智能谈起智能设备、聊天机器人、无人驾驶、机器人.https:/ 什么是人工智能?人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它试图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。机器人语音识别图像识别自然语言处理专家系统知识工程机器学习人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样的思考,甚至超过人的智能。弱人工智能、
3、强人工智能、超人工智能弱人工智能Artificial Narrow Intelligence(ANI):弱人工智能是擅长于单个方面的人工智能。强人工智能Artificial General Intelligence(AGI):人类级别的人工智能。强人工智能是指在各方面都能喝人类比肩的人工智能,人类能干的脑力活它都能干。超人工智能Artificial Super Intelligence(ASI):知名人工智能思想家Nick Bostrom把超级智能定义为”在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能“。图灵测试 人工智能的历史1956年夏天:达特茅斯会议,提出“人
4、工智能“20世纪60年代:感知机20世纪70年代:专家系统、知识工程20世纪80年代:日本第五代机20世纪90年代:统计机器学习2006年:深度学习2012年:卷积神经网络.人工智能的历史AI发展现状?发展现状?机器是否具有真正的智能人眼中的图像 机器是否具有真正的智能计算机眼中的图像目前只能实现感知智能,尚无法实现推理智能 举个例子 还有很长的路要走计算机无法真正理解符号、数字背后的语义所有的行为都是在“猜”图像、语音:原始信息,感知智能语言、艺术:人工信息,推理智能 学习方法打好机器学习基础学会原理、注重联系动手实践分析数据,提升google机器学习教程:https:/ NG 机器学习、深
5、度学习等课程准备工作 安装anaconda3并配置pycharm安装sklearn/numpy/pandas/matplotlib/xgboost 安装pycharm,并设置python解释器路径 编写hello,world并成功执行人工智能中的数学基础 数学分析映射与函数 极限导数 导数是曲线的斜率,是曲线变化 快慢的反应;可导一定连续,反之不然思考:极值如何求解?数学分析常用函数求导公式动手实践(2):求sigmoid函数导数 数学分析泰勒展开式常用函数的泰勒展开)()(!)(f.)(!2)(f)(!1)(f)()(f00200000 xOnnxxnxxxxxxxxfx)x 特征值分解21
6、12222222221003222222222112非常重要且广泛的应用包括:控制系统推荐系统文本相似度处理图像压缩.线性代数分离技术-svd/NFM分解useritem 线性代数再看特征值分解相似矩阵1-PPA思考:(1)变换与逆矩阵(2)什么情况下有逆矩阵(3)P与P的逆乘积 线性代数行列式4321bbbbB4231*bbbbB333231232221131211cccccccccC ccc-ccc-ccc-ccccccccc332112322311312213322113312312332211C考察单位阵、旋转阵行列式的本质:线性变换的缩放因子变换是否降维(秩)nnkkkkaaaD.)
7、1-(2121 线性代数总结矩阵 线性变换特征值 缩放强度行列式 缩放强度 概率论概率与直观 不断抛掷一枚硬币,得到正面与反面的频率比例是多少呢?经过无数次抛掷,频率的极限趋近于X?抛掷趋于无穷次时,正反面频率一致,根据大数定理 概率论概率的计算已知A、B独立时)(1)(APAP)(*)()(BPAPBAP)(*)(-)()()(BPAPBPAPBAP 概率论条件概率全概率公式贝叶斯公式)(*)|(),(BPBAPBAPiiiBPBAPAP)(*)|()(jjjiiiBPBAPBPBAPABP)()|()(*)|()|(练习:小明有8支步枪,其中有5支校准过。校准过的枪支击准靶心的概率为0.8
8、,没有校准过的枪支击准靶心的概率为0.3,现小明随机的选一支枪,结果中靶,问该枪已被校准的概率。概率论根据贝叶斯公式?)|(8.0)|(2.0)|(3.0)|(7.0)|(8/5)(8/3)(111110010010AGPGAPGAPGAPGAPGPGP,8163.08/3*3.08/5*8.08/5*8.0)()|()(*)|()|(111111jjjGPGAPGPGAPAGP 概率论重温贝叶斯公式)()(*)|()|(APBPBAPABP)()()|(jAPBPBAPjj强调:这是一个非常重要的公式,记住它,基本就掌握了机器学习一半的内容jjjiiiBPBAPBPBAPABP)()|()(
9、*)|()|(概率论期望与方差iiixpxE)(dxxfxpxE)()()(E(x)表征了数据的加权平均值,D(x)表征了数据的波动程度)()x()(22xEExD 概率论变量的分布 有一类试验,比如抛掷硬币得到正面还是反面,项目成功或失败,产品是否有缺陷,只有两个可能结果。记这两个可能的结果为0和1,该分布就称为伯努利分布。pqpppXEXEXDpqpXE22222)1(01)()()(01)(概率论变量的分布 伯努利分布重复N次,就构成了二项分布。排列、组合数公式复习:袋子中有五个标号的小球,每次从中抽取一个,抽取三次,得到的排列方式有多少种呢?袋子中有五个标号的小球,每次抽取一个,抽取三
10、次,不考虑球之间的顺序,得到的编号组合有多少种呢?)!(!3*4*535nmmAAnm!)!(!1*2*33*4*535nnmmCCnmiiknkknpnpXiDXDnpXiEXEnkppCkX)1()()()()(,.1,0,)1(p,概率论变量的分布 高斯分布,服从中心极限定律,是非常重要的分布。xexux,0,21)(f222)(概率论练习 multi_guassian.py 概率论熵 世界杯比赛有32支球队参加,最少用多少bit信息表示出最后获胜的队伍?)(ln)(xpxpS 总结人工智能中的数学并不难,关键是掌握常用的思维方式练习推导,理解数学表达式所蕴含的现实意义 机器学习实践机器
11、学习实践机器学习基础理论和概念机器学习基本方法项目实战分析 机器学习基础机器学习主要是研究如何使计算机从给定数据中学习规律,并利用学习到的规律(模型)来对未知或无法观测的数据进行预测。机器学习基础从学习方式上讲,分为:监督学习无监督学习半监督学习强化学习 从学习结果上讲,分为:回归分类强调:目前主流学习技术是监督学习,半监督学习和强化学习在通用场景下还不是特别的work 机器学习基础从学习方式上讲,分为:监督学习无监督学习半监督学习强化学习 从学习结果上讲,分为:回归分类强调:目前主流学习技术是监督学习,半监督学习和强化学习在通用场景下还不是特别的work 线性回归线性回归是最基础的回归算法
12、train0123456789x0123456789y24.6-24.012.2-55.9-57.816.5-7.9-17.3-23.187.4思考:x与y符合什么关系呢?观察到x与y的关系(模型选择),y=ax+b,建立线性回归模型通过优化方法设法拟合数据,得到最优的a评估该模型是否准确,查看训练集上的准确率评估该模型的泛化性能,在测试集上的准确率 线性回归 基本概念 训练集 测试集(交叉验证法、自助法等)目标函数 损失函数 优化方法 拟合、过拟合 准确率、泛化性能 线性回归 目标函数、优化方法推导不可能有一个理想的线性函数经过所有训练集的数据点,这个问题怎么处理呢?高斯:“把偏移都看做误差
13、”这又是一个假设,但是机器学习的套路就是这样的iiTiiiiTiiiixyLxy)2)(exp(21)|(p)()2)(exp(21)|(p)2)(exp(21)(p22)()()(22)()()(22)()(线性回归 使用求极值方法求解目标函数)(21()()(21()()(21()()(21)J()2)(exp(21ln)|(pln)(ln)J(2)()(22)()()(XXXYYXYYJXYXYXYXYJxyxyLTTTTTTTTTTiiTiiiTiii 线性回归 使用求极值方法求解目标函数YXXXYXXXYXXXXXXYYXJXXXYYXYYJTTTTTTTTTTTTTTTT1)(0)
14、2)(21)()(21()(求驻点AAAAAATTTx)x(xxxx思考:XTX一定可逆吗?YXEXXTT1)(线性回归 直接采用极值方法求解,有什么缺点?如果不是拿到所有样本点再求解,仅仅只看眼前的梯度逐渐求解呢?线性回归 使用梯度下降法求解目标函数)()()()()()()()()()(2)()(22)()()()()()()()()()(21)J()2)(exp(21ln)|(pln)(ln)J(ijiTijjijiTijjiTiiTijiiTiiiTiiixxyxxyJxyxyJxyxyL:10J(0,1)线性回归只根据眼前的路径梯度下降求解的方法,称为随机梯度下降法(SGD)实际上使
15、用样本的过程中,出于效率和稳定性的考虑,我们使用MiniBatch-SGD方法,使用批处理平均来进行梯度更新,而不是对每一个数据都进行一次梯度更新 思考:目标函数一定有最小值吗?线性回归进一步分析 可以对样本是非线性的,对系数是线性的polynomial方法221010 xxyxy 线性回归准确度评估对于连续数据(回归问题),一般使用方差评估对于离散数据(分类问题)accuracy、precision/recall例:训练样本有100个,正负标记各50个,经过模型分类后,正负样本结果仍为各50个。在正样本中,分对40个,分错10个,负样本中,分对30个,分错20个,则:accuracy=(10
16、0-10-20)/100=0.7precision=40/50=0.8recall=40/60=0.66 线性回归准确度评估 )11(211RPFFNTPTPRFPTPTPP强调:F1越大越好,最大值是1,对于二分类问题,F1=0.5就等价于”胡猜”线性回归再谈准确度问题 训练集上的P、R达到100%,是最好的情况吗?线性回归避免过拟合,引入正则化技术 iiTiiiTixyxy2)()(2)()()(21)J(L2)(21)J(L1正则化项:正则化项:分别称为LASSO回归、Ridge回归LASSO具有稀疏作用,Ridge收敛更快我们说,目标函数仍然是不带正则化的原函数,经过改造的上式称为损失
展开阅读全文