书签 分享 收藏 举报 版权申诉 / 19
上传文档赚钱

类型机器学习和迁移学习课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4313638
  • 上传时间:2022-11-28
  • 格式:PPT
  • 页数:19
  • 大小:1.46MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《机器学习和迁移学习课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    机器 学习 迁移 课件
    资源描述:

    1、Machine Learning制作者:黄皓璇 陈韬2015年5月7日目录1234机器学习常见算法集成方法迁移学习21.机器学习1.1 概念简介 机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。由于机器学习是人工智能的一个核心领域,所以也有如下定义:“机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。31.机器学习1.2 分类(1)监督学习:从给定的训练数据集中学习出一个函数,

    2、当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类。(2)无监督学习:与监督学习相比,训练集没有人为标注的结果。常见的无监督学习算法为聚类。(3)半监督学习:介于监督学习与无监督学习之间,如迁移学习。(4)增强学习:通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。42.常见算法2.1 简介 分类算法:最近邻居法、朴素贝叶斯、决策树、人工神经网络、支持向量机等。聚类算法:K均值、DBSCAN算法、EM算法、模糊C均值、S

    3、OM(自组织映射)等。52.常见算法2.2 决策树(C4.5)62.常见算法2.2 决策树(C4.5)72.常见算法2.3 支持向量机(SVM)82.常见算法2.3 支持向量机(SVM)93.集成方法3.1 概念简介 集成方法(ensemble)是机器学习领域中用来提升分类算法准确率的技术,主要包括Bagging和Boosting即装袋和提升。前面介绍的决策树、朴素贝叶斯等均属于弱分类器,通过集成方法可以将不同的弱分类器组合起来,构造强分类器。比较有代表性的集成方法有:AdaBoost、随机森林(RandomForest)等。103.集成方法3.2 AdaBoost算法(1)在没有先验知识的情

    4、况下,初始的分布为等概分布,也就是训练集如果有n个样本,每个样本的分布概率为1/n,并设置迭代次数m。(2)每次训练后得到一个基分类器,并根据准确率计算其权值。接着提高错误样本的分布概率,即让分类错误的样本在训练集中的权重增大,分类正确的样本权重减小,使得下一次训练的基分类器能集中力量对这些错误样本进行判断。(3)最后通过级联m个基分类器形成一个强分类器。114.迁移学习在传统分类学习中,为了保证训练得到的分类模型具有准确性和高可靠性,都有两个基本的假设:(1)用于学习的训练样本与新的测试样本满足独立同分布的条件;(2)必须有足够可利用的训练样本才能学习得到一个好的分类模型。但是,在实际应用中

    5、我们发现,这两个条件往往无法满足。于是乎,迁移学 习应运而生。迁移学习,是一种运用已存有的知识对不同但相关领域的问题 进行求解的新的机器学习方法。4.1 概念简介124.迁移学习针对源领域和目标领域样本是否标注以及任务是否相同,可以把迁移学习划分为:1、归纳迁移学习 2、直推式迁移学习 3、无监督迁移学习而按照迁移学习方法采用的技术划分,又可以把迁移学习方法大体上分为:1、基于特征选择的迁移学习算法研究 2、基于特征映射的迁移学习算法研究 3、基于权重的迁移学习算法研究4.2 分类134.迁移学习TrAdaBoost算法的目标就是从辅助的源数据中找出那些适合测试数据的实例,并把这些适合的实例迁

    6、移到目标领域中少量有标签样本的学习中去。该算法的关键思想是利用Boosting技术过滤掉源领域数据中那些与目标领域中少量有标签样本最不像的样本数据。在TrAdaBoost算法中,AdaBoost被用于在目标领域里少量有标签的样本中,以保证分类模型在目标领域数据上的准确性;而Hedge()被用在源领域数据上,用于自动调节源领域数据的重要度。4.3 TrAdaBoost算法144.迁移学习4.3 TrAdaBoost算法机制训练数据TbT源训练数据辅助训练数据aT基本分类器AdaBoostHedge()154.迁移学习4.4 TrAdaBoost算法示意图164.迁移学习4.5 TrAdaBoos

    7、t算法描述输入:两个训练数据集 和 (训练数据集 ),一个基本分类算法以及迭代次数N。初始化:1.初始化权重向量 ,各个元素均为1。For 1.设置 满足:2.调用基本分类器,根据合并后的训练数据 以及 上的权重分布 ,得到 一个分类器 。3.计算 在 上的错误率:bTaTbaTTT)(1111111,.,.mnnnNt,.,1tpmnitittp1TTtpththbTmnnimnnitiiittitxcxh11174.迁移学习4.5 TrAdaBoost算法描述 4.令 和 5.按如下公式更新权重向量:输出:最终分类器ttt1Nnln211nimnnitiixcixthtiixcixthtti,.,1,.,1,1当当fh18谢谢聆听192022-11-28

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:机器学习和迁移学习课件.ppt
    链接地址:https://www.163wenku.com/p-4313638.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库