书签 分享 收藏 举报 版权申诉 / 56
上传文档赚钱

类型Python金融大数据分析第六章金融时间序列课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:3726076
  • 上传时间:2022-10-07
  • 格式:PPTX
  • 页数:56
  • 大小:2.98MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《Python金融大数据分析第六章金融时间序列课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    Python 金融 数据 分析 第六 时间 序列 课件
    资源描述:

    1、 第六章 金融时间序列Python金融大数据分析本章按照如下主题组织:第一和第二步 我们使用非常简单和小型的数据集开始探索 pandas 的功能;然后使用 NumPy ndarray 对象并将其转换为 DataFrame 对象。在此过程中,介绍基本的分析和可视化功能 使用来自 CSV 文件的数据 逗号分隔值(CSV)文件是交换金融时间序列数据的全球标准之一;pandas 可以高效地从这些文件中读取数据。使用两种指数的数据,我们利用 pandas 实施一次回归分析。高频数据 近年来,可用的金融时间序列数据越来越多地从每日报价转向分时数据 每日分时股价数据盘通常超过30年间收集的每日报价数据量pa

    2、ndas 基础 在金融学中遇到的最重要数据类型之一是金融时间序列。这是以日期和/或时间作为索引的数据。例如,股价就表现为金融时间序列数据。类似地,美元-欧元汇率也是金融时间序列;汇率在短暂的时间间隔内报价,一组此类报价就是汇率的时间序列。没有一种金融学科不将时间作为重要因素考虑,这和物理学及其他科学相同。Python 中处理时间序列的主要工具是 pandas 库pandas 的主要作者 Wes McKinney 在大型对冲基 金 AQR 资本管理公司任分析师时开始开发这个库。正如本章所阐述的,DataFrame 和 Series 等基本类的灵感来自于统计分析语言 R,该语言无疑长于这类建模和分

    3、析工作。pandas 基础 从最根本的层面上看DataFrame 类设计用来管理具有索引和标签的数据,这些数据与来自 SQL 数据表或者电子表格应用中的工作表内的数据没有太多的不同。考虑如下代码创建的 DataFrame 对象:pandas 基础 这个简单的例子已经说明了 DataFrame 在存储数据上的主要特性:数据 数据本身可以用不同组成及类型提供(列表、元组、ndarray 和字典对象都是候选者)。标签 数据组织为列,可以自定义列名。索引 索引可以采用不同的格式(例如数值、字符串、时间信息)pandas 基础 下面是简单的例子,说明 DataFrame 对象上典型操作的工作方式:pan

    4、das 基础 一般来说,可以在 DataFrame 对象上进行和 NumPy ndarray 对象相同的向量化操作:在两个维度上同时扩增 DataFrame 对象是可能的:pandas 基础 也可以取整个 DataFrame 对象来定义一个新列。在这种情况下,索引自动分配:附加数据的方法也类似。但是,在下面的例子中,我们会看到通常必须避免的一个副作用一一索引被简单的编号索引代替:pandas 基础 附加一个 DataFrame 对象以提供正确的索引信息往往是更好的做法。下面的例子保留这种索引:pandas 基础 pandas 的优势之一是处理缺漏的信息。为此,考虑如下代码,这段代码添加一个新列

    5、,但是使用稍微不同的索引。我们在此使用相当灵活的 join 方法;pandas 基础 例中可以看到.pandas 默认只接受索引已经存在的值。我们丢失了索引为 y 的值,在 索引位置 z 可以看到 NaN(也就是不是一个数字)值。为了保留这两个索引,我们可以提供一个附加参数.告诉 pandas 如何连接。例子中的 bow=outer表示使用两个索引中所有值的并集:现在,索引确实是两个原始索引的并集。在扩增的新索引中,丢失的数据点都由 NaN 值代替。连接操作的其他选项包括 inner(索寻|的交集)、left(默认值,使用调用方法的对象中的索引值)以及 right(使用被连接对象的索引值)。p

    6、andas 基础 尽管有丢失的值,但是大部分方法调用仍然有效。例如:使用 DataFrame 类的第二步 从现在开始,我们将处理数值数据。我们将随着进程增加 DatetimeIndex 等功能,以管理时间序列数据。为了生成一个模拟数据集,按照下面的例子,生成一个包含 9 行 4 列标准正态分布伪随机数的 numpy.ndarray:使用 DataFrame 类的第二步 你可以更直接地构造 DataFrame 对象(正如前面所见),但是使用 ndarray 对象通常是 一个好选择,因为 pandas 将保留基本结构,只添加元信息(例如索引值)。这也代 表着金融应用和科学研究的一种典型用例。例如:

    7、使用 DataFrame 类的第二步 表 6-1 列出 了DataFrame 函数使用的参数。表中,类似数组意味着和 ndarray 对象类似的数据结构一一例如列表对象。索引是 pandas Index 类的一个实例,使用 DataFrame 类的第二步 和结构数组一样.我们已经看到.DataFrame 对象可以通过指定一个具有合适数量元素的列表,直接定义列名。下面的例子说明,可以随时定义/更改 DataFrame 对象的属性:使用 DataFrame 类的第二步 列名提供访问 DataFrame 对象中数据的高效机制,同样和结构数组类似:为了高效处理金融时间序列数据,还必须很好地处理时间索引

    8、。这也可以视为 pandas 的一个重要优势。例如,假定我们分为 4 列的 9 个数据项对应于 2015 年 1 月开始的月底数据然后,用 date_range 生成一个 Datetimelndex 对象:使用 DataFrame 类的第二步 在 6-2 列出 date_range 函数的参数使用 DataFrame 类的第二步 和列一样.我们将新生成的 Datetimelndex 作为新的 Index 对象,赋给 DataFrame 对象:使用 DataFrame 类的第二步 在 date_range 函数帮助下生成 DatetimeIndex 对象,频率参数 freq 有多种选择。表6-3

    9、 列出了所有选项。使用 DataFrame 类的第二步 通常可以从一个ndarray对象生成DataFrame对象。但是也可以使用NumPy的array函数从DataFrame生成一个ndarray基本分析 和 NumPy 数组一样.pandas DataFrame 类有多个便利的内建方法。例如,可以轻松地获得按列总和、平均值和累计总和:基本分析 还有一个通往多种常用数值数据集统计数字的捷径describe 方法:基本分析 也可以对 DataFrame 对象应用大部分 NumPy 通用函数:基本分析 一般情况下.绘制数据图表也只需要一行代码基本分析 表 6-4 列出了plot 方法的参数基本分

    10、析 表 6-4 列出了plot 方法的参数Series 类 目前,我们主要使用 pandas DataFrame 类:但是还有一个专用的 Series类。例如,在从 DataFrame 对象中选择单一列时,我们就 得到一个 Series 对象:Series 类 DataFrame 的主要方法也可用于 Series 对象,例如,我们可以和以前一样绘制结果图表GroupBy 操作 pandas 具备强大而灵活的分组功能,工作方式类似于 SQL 中的分组和I Microsoft Excel 中的透视表。为了进行分组,我们添加一列,表示对应索引数据所属的季度:GroupBy 操作 现在,我们可以根据“

    11、Quarter”列分组,输出单独的统计数字:GroupBy 操作 分组可以在多列上进行。为此,我们添加另一列,表示索引日期的月份是奇数还是偶数,可以使用上述附加信息,同时根据两列分组:金融数据 当今的 Web 本身提供了大量的免费金融信息。谷歌或者雅虎等 Web巨人提供全面的金融数据、尽管这些数据有些时候不能满足专业需求.例如拆股的处理,但是适合于阐述 pandas 的金融能力。金融数据 为了更好地概览指数的历史,可以再次用 plot 方法 生成一个图表金融数据 也可以使用向量化代码,在不使用循环的情况下得到相同的结果。在这方面,shift 方法很有用;它相对于索引向前或者向后移动 Serie

    12、s 或者整个 DataFrame 对象。为了实现我们的目标,必须将 Close 列移动一天,或者按照更一般的说法一个索引位置:金融数据 现在,我们来看看新生成的收益率数据。图 6-4 展示了权益收益率的两种典型事实:波动率聚集 波动率不是长期恒定的;既有高波动率时期(正收益和负收益都很高),也有低动率时期。杠杆效应 一般来说,波动性和股票市场收益是负相关的;当市场下跌的时候波动性升高,反之亦然。下面是生成图表的代码:金融数据金融数据 波动率对期权交易者特别重要,而(技术型)股票交易者可能对移动平均值(所谓趋势)更感兴趣。移动平均值很容易用 pandas 的 rolliog_mean 函数计算(

    13、还有其他一些“滚动”函数,如rolling_max,rolling_min 和 rolling_corr)金融数据 包含两种趋势的典型股价图表如图所示金融数据 回到期权交易者更喜欢的话题,对数收益率的移动历史标准差一一即移动历史波动率一一可能更有趣:下图进一步支持杠杆效应假设,说明市场下跌时历史移动波动率倾向于升高,而在市场上涨时波动率下降:回归分析 目前为止,我们提供的支持仅基于对金融数据图表的检验。使用 pandas,还可以在更正式的统计学基础上进行这类分析。最简单的方法是使用(线性)普通最小二乘回归(OLS)方法。我们从几个导入操作开始:用 pandas 的 read_csv 函数进行导

    14、入是合适的回归分析 表 6-6 列出了这个重要导入函数的参数。参数很多,其中大部分默认值为 None;当然,object 参数没有默认值,在任何情况下都必须指定回归分析 表 6-6 列出了这个重要导入函数的参数。参数很多,其中大部分默认值为 None;当然,object 参数没有默认值,在任何情况下都必须指定回归分析 表 6-6 列出了这个重要导入函数的参数。参数很多,其中大部分默认值为 None;当然,object 参数没有默认值,在任何情况下都必须指定回归分析 为了实施回归分析,我们只需要每个数据集中的一列,因此,我们生成一个新的 DataFrame 对象,在其中组合两个感兴趣的列,也就是

    15、主要的指数列。回归分析 同样,新数据集的图形表现可能提供一些深刻的认识。确实,下图表明两个指数之间似乎有某种负相关:回归分析 不过.为了得到更为正式的论据,我们应该再次使用两个金融时间序列的对数收益率。回归分析 我们已经有了实施回归分析的所有数据,接下来,将 S&P500收益率作为自变量,而将 VIX收益率作为因变量:回归分析 这个输入与原始对数收益率数据相结合,用于生成图 6-9 中的图表,该图表强烈支持杠杆放应:回归分析 作为最后的交叉检查,我们可以直接计算两个金融时间序列之间的相关性:回归分析 尽管在整个数据集上有强烈的负相关.但是不同时期之间有显著的不同.如图所示。该图使用了按年统计(

    16、252 个交易日)的相关性:高频数据 到目前为止,你应该对 pandas 处理金融时间序列数据的优势有了感性认识。这种方法的一个特征在金融分析圈已经十分普遍,对于某些市场参与者来说是很大的负担:高频数据。本小节简短地阐述如何处理分时数据(而非每日金融数据首先导入几个库和数据:高频数据 下图以图形形式展示了中间价列数据高频数据 通常,金融分时数据会导致无规律的 DateTimelndex。换句话说,两个观测点之间的时间间隔可能高度异质 鉴于这种背景重新采样这种数据集有时可能很有用.甚至需要根据手上的任务重新排列。下面.我们简单地采用重采样过程。高频数据 在本小节的最后,我们在新的数据集上应用自定义的 Python 函数。我们选择的是一个 任意的函数,没有任何经济学意义;它只是镜像了某个股价水平上的股票表现。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:Python金融大数据分析第六章金融时间序列课件.pptx
    链接地址:https://www.163wenku.com/p-3726076.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库