人工智能机器学习及在金融行业应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《人工智能机器学习及在金融行业应用课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 机器 学习 金融 行业 应用 课件
- 资源描述:
-
1、人工智能机器学习及在金融行业应用人工智能机器学习及在金融行业应用 人工智能机器学习及在金融行业应用 内容?人工智能人工智能?机器学习机器学习AI分支分支?定义、流派定义、流派?任务任务?常见范式常见范式?算法介绍算法介绍?在金融中的(潜在)应用在金融中的(潜在)应用?总结:金融应用场景总结:金融应用场景 内容?人工智能?机器学习A I 分支?定义、流派?任人工智能(AI)?1956年,达特茅斯会议 (John McCarthy,19272011)约翰约翰.麦卡锡麦卡锡 AI 五十年留念(五十年留念(19562006)什么是什么是AIAI?(Marvin Minsky,19272016)马文马文
2、.明斯基明斯基-研究如何让计算机完成那些只有依靠人类智力才能完成的任务研究如何让计算机完成那些只有依靠人类智力才能完成的任务Mavin Mavin Minsky Minsky-实现人类智能的功能,途径并不一定与人类智力相同实现人类智能的功能,途径并不一定与人类智力相同John McCarthy John McCarthy-研究提升机器解决复杂任务能力的领域研究提升机器解决复杂任务能力的领域 人工智能(A I)?1 9 5 6 年,达特茅斯会议 (J o h n AI科学的分支 计算机计算机视觉视觉 语音语音识别识别 基于规则基于规则的系统的系统 机器学习机器学习 自然语言自然语言处理处理 机器
3、人学机器人学 A I 科学的分支 计算机视觉 语音识别 基于规则的系统 机器学机器学习无处不在 机器学习无处不在 机器学习?何为机器学习?何为机器学习?机器通过算法自动地从数据中学习知识机器通过算法自动地从数据中学习知识?两大派别两大派别?AIAI的一个分支的一个分支(计算机科学家)关注问题,不在乎手段(统计、代数、逻辑、几何)?应用统计学的分支应用统计学的分支(统计学家)关注算法、不在乎实用?经典统计学(频率主义)经典统计学(频率主义)机器学习机器学习?足够测量,无需构建模型?适合小型问题(少量参数)?可解释 统计学统计学AI分支分支?但复杂问题数据稀疏?举例但复杂问题数据稀疏?举例 分支分
4、支 机器学习?何为机器学习?机器通过算法自动地从机器学习 vs.经典统计学 欠拟合(偏差大)过拟合(方差大)参数优化 目前,金融行业模型 (特别是风险控制风险控制)?基于计量经济学理论?统计学统计学为主要分析方法 机器学习 v s.经典统计学 欠拟合(偏差大)过拟合(机器学习(AI分支)?“Machine Learning is the study of computer algorithms that improve automatically through experience.”Tom Mitchell,1997?从示例(从示例(instance)中学习)中学习?何为示例?标签?何为示
5、例?标签??特征工程(重要)特征工程(重要)机器学习(A I 分支)?“Ma c h i n e L e a r n i n g 金融领域的特征举例?多因子选股模型中常用的组合特征及逻辑 金融领域的特征举例?多因子选股模型中常用的组合特征及逻辑 股票因子池?特征建构特征建构?特征抽取特征抽取?特征选择特征选择 股票因子池?特征建构?特征抽取?特征选择 机器学习任务?分类、回归问题(有标签)分类、回归问题(有标签)预测性预测性 Data Supervised Semi-supervised Active Learning?聚类、相关性问题(无标签)聚类、相关性问题(无标签)描述性描述性 Unsu
6、pervised 机器学习任务?分类、回归问题(有标签)预测性 各种机器学习范式?监督学习?无监督学习?半监督学习?主动学习?迁移学习?多任务学习?多示例学习?多标记学习?强化学习?深度学习 各种机器学习范式?监督学习?无监督学习?半监督学习?监督学习(Supervised Learning)?两大任务两大任务?回归回归(regression)?分类分类(classification)观察数据分为不同的类别观察数据分为不同的类别?回归回归(区别于统计学的回归)解决过拟合,引入正则项 变量相关性、非线性变量相关性、非线性 惩罚回归模型(Lasso回归、岭回归等)、卡曼滤波?分类分类 准确率高、预
7、测意义大准确率高、预测意义大 Logistic回归、SVM、决策、随机森林、神经网络、boosting 监督学习(S u p e r v i s e d L e a r n i n g)?两大任分类算法Logistic(对数几率)回归?广义线性回归(线性变换+非线性函数)?sigmoid函数?应用:垃圾邮件分类、疾病判断 分类算法L o g i s t i c(对数几率)回归?广义线性回归Logistic回归在金融中的应用?信贷风险管理?资产价格变化方向的预测 L o g i s t i c 回归在金融中的应用?信贷风险管理?资产价分类算法-SVM(Support Vector Machine
8、)?思想:思想:找到最佳超平面使得正负样本间隔最大?采用核函数解决非线性问题(高维映射、低维内积)?适用于:小样本、非线性、高维度问题?缺点:数据敏感、非线性问题需选核函数、复杂度高 分类算法-S V M(S u p p o r t V e c t o r Ma c h i nSVM在金融中的应用?举例举例:资产价格变化方向的预测资产价格变化方向的预测 线性组合线性组合 SVM分类分类?举例:多因子选股举例:多因子选股(训练:因子暴露度和收益率)1.线性核收益分化明显(高斯核、多项式核、线性核)2.与传统多因子模型比无较大优势 S V M在金融中的应用?举例:资产价格变化方向的预测 算法介绍决
9、策树(Decision Tree)冷血冷血 表皮表皮 体温体温 恒温恒温 非爬行类非爬行类动物动物 鳞片鳞片 爬行类爬行类动物动物 非爬行类非爬行类动物动物?非企业投资决策技术?用于用于:分类和预测?方法:方法:寻找最优变量和分裂阈值(Gini系数、熵),最小化损失函数?特点特点:逻辑简单、鲁棒性差、可集合其他模型?算法介绍决策树(D e c i s i o n T r e e)决策树在金融中的应用?举例:决策树选股 因子暴露度与个股收益率存在非线性关系因子暴露度与个股收益率存在非线性关系 选用:动量(Mom)、波动率(Vol),市盈率(PE)三个因子 决策树在金融中的应用?举例:决策树选股
10、因子暴算法介绍贝叶斯?理论:主观判断,新信息修正信念理论:主观判断,新信息修正信念 P(A/B)=P(B/A)*P(A)/P(B)?用于:分类用于:分类 P(C=1|X1,X2,X3)P(C=2|X1,X2,X3)则判定类别为1;否则为2 找出最大的找出最大的P(X|C)P(C)P(X1,X2,X3|C=i)=P(X1|C=i)*P(X2|C=i)*P(X3|C=i)?贝叶斯网络贝叶斯网络 (贝叶斯公式+图论)?应用:应用:治病机制、投资策略、过滤垃圾邮件等?优势:优势:利用经验做合理判断和修正,适合金融市场 算法介绍贝叶斯?理论:主观判断,新信息修正信念 贝叶斯定理在金融中的应用?举例:风险
11、管理举例:风险管理(企业违约概率,CDS市场价)市场信息+投资者主观判断 举例:反洗钱举例:反洗钱(西交大张成虎等)贝叶斯定理在金融中的应用?举例:风险管理(企业违约概率,C无监督学习(Unsupervised Learning)?特点:数据无标签,学习分布特征特点:数据无标签,学习分布特征?两类:两类:?聚类(K-means、层次聚类、谱聚类)分成集群(簇),使集群内部有较高的相似性,分成集群(簇),使集群内部有较高的相似性,而集群之间相似度较低而集群之间相似度较低?降维(因子分析、PCA、ICA)在众多变量或指标中提取具有代表性的特征(因在众多变量或指标中提取具有代表性的特征(因子或因子组
12、合)子或因子组合)例如:在多资产组合中,识别出如动量、价值、波动性、流动性等主要驱动因素。无监督学习(U n s u p e r v i s e d L e a r n i n g)?聚类算法K-means?步骤:步骤:1、选择K个初始中心点 2、计算cost,组成簇 3、计算簇内所有点的均值作为新的聚类中心重复上面步骤直至聚类稳定。?优点:优点:逻辑清晰、高速?局限:局限:需给定K和初始中心点初始中心点 聚类算法K-m e a n s?步骤:1、选择K 个初始中心点聚类在金融中的应用?举例:股票分析(流通市值、波动率)聚类在金融中的应用?举例:股票分析(流通市值、波动率)聚类在金融中的应用?
展开阅读全文