机器学习之模型评估与模型选择课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《机器学习之模型评估与模型选择课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 模型 评估 选择 课件
- 资源描述:
-
1、机器学习的模型评估与选择泛化误差 vs 经验误差v泛化误差:在“未来”样本上的误差v经验误差:在训练集上的误差,亦称“训练误差”训练数据模型新样本数据新样本属于什么类别?过拟合 vs 欠拟合模型选择v三个关键问题:如何获得测试结果 评估方法如何评估性能优劣 性能度量如何判断实质差别 比较检验评估方法v关键:怎么获得“测试集”?原则:测试集与训练集“互斥”v常见方法:留出法(hold-out)交叉验证法(cross validation)自助法(bootstrap)留出法v保持数据分布一致性(例如:分层采样)v多次重复划分(例如:100次随机划分)v测试集不能太大、不能太小(例如:1/51/3)
2、K-折交叉验证法当K=m时,则得到“留一法”(leave-one-out, LOO)自助法v基于“自助采样”(bootstrap sampling)Pull up by your own bootstraps有放回采样、可重复采样训练集与原样本集同规模数据分布有所改变约有36.8%的样本不出现包外估计:out-of-bag estimation模型选择 三个关键问题: 如何获得测试结果 评估方法 如何评估性能优劣 性能度量 如何判断实质差别 比较检验性能度量v性能度量(performance measure)是衡量模型泛化能力的评价标准,反映了任务需求v使用不同的性能度量往往会导致不同的评判结
展开阅读全文