利用Python进行数据分析(原书第2版)课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《利用Python进行数据分析(原书第2版)课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 利用 Python 进行 数据 分析 原书第 课件
- 资源描述:
-
1、利用Python进行数据分析(原书第2版)演讲人2021-11-111 准备工作准备工作011 准备工作20171.1 本书内容0120181.2 为何利用Python进行数据分析0220191.3 重要的Python库0320201.4 安装与设置0420211.5 社区和会议0520221.6 快速浏览本书061 准备工作1.1 本书内容1.1.1 什么类型的数据1 准备工作1.2 为何利用Python进行数据分析1.2.1 Python作为胶水1.2.2 解决“双语言”难题1.2.3 为何不使用Python1.3 重要的Python库1 准备工作1.3.1 NumPy1.3.2 pand
2、as1.3.3 matplotlib1.3.6 scikit-learn1.3.5 SciPy1.3.4 IPython与Jupyter1 准备工作1.3 重要的Python库1.3.7 statsmodels1 准备工作1.4 安装与设置1.4.1 Windows011.4.2 Apple(OS X和macOS)021.4.3 GNU/Linux031.4.4 安装及更新Python包041.4.5 Python 2和Python 3051.4.6 集成开发环境和文本编辑器061 准备工作1.6 快速浏览本书011.6.1 代码示例1.6.2 示例数据021.6.3 导入约定031.6.4
3、术语042 Python语言基础、语言基础、IPython及及Jupyter notebook022 Python语言基础、IPython及Jupyter notebook2.1 Python解释器2.2 IPython基础2.3 Python语言基础2.2 IPython基础2 Python语言基础、IPython及Jupyter notebook2.2.2 运行Jupyter notebook2.2.4 内省2.2.6 执行剪贴板中的程序2.2.1 运行IPython命令行2.2.3 Tab补全2.2.5%run命令2 Python语言基础、IPython及Jupyter notebook
4、2.2 IPython基础CBA2.2.7 终端快捷键2.2.8 关于魔术命令2.2.9 matplotlib集成2 Python语言基础、IPython及Jupyter notebook2.3 Python语言基础2.3.1 语言语义2.3.2 标量类型2.3.3 控制流3 内建数据结构、内建数据结构、函数及文件函数及文件033 内建数据结构、函数及文件3.1 数据结构和序列A3.2 函数B3.3 文件与操作系统C3.4 本章小结D3 内建数据结构、函数及文件3.1 数据结构和序列3.1.1 元组013.1.2 列表023.1.3 内建序列函数033.1.4 字典043.1.5 集合053.
5、1.6 列表、集合和字典的推导式063.2 函数3 内建数据结构、函数及文件3.2.2 返回多个值3.2.4 匿名(Lambda)函数3.2.6 生成器3.2.1 命名空间、作用域和本地函数3.2.3 函数是对象3.2.5 柯里化:部分参数应用3 内建数据结构、函数及文件3.2 函数3.2.7 错误和异常处理3 内建数据结构、函数及文件3.3 文件与操作系统3.3.1 字节与Unicode文件4 NumPy基础:数基础:数组与向量化计算组与向量化计算044 NumPy基础:数组与向量化计算AEDFBC4.2 通用函数:快速的逐元素数组函数4.3 使用数组进行面向数组编程4.5 线性代数4.4
6、使用数组进行文件输入和输出4.6 伪随机数生成4.1 NumPy ndarray:多维数组对象4 NumPy基础:数组与向量化计算4.7 示例:随机漫步4.8 本章小结4 NumPy基础:数组与向量化计算4.1 NumPy ndarray:多维数组对象0102030405064.1.1 生成ndarray4.1.2 n d a r r a y的 数 据 类 型4.1.3 N u m P y数 组 算 术4.1.4 基础索引与切片4.1.5 布尔索引4.1.6 神奇索引4 NumPy基础:数组与向量化计算4.1 NumPy ndarray:多维数组对象4.1.7 数组转置和换轴4 NumPy基础
7、:数组与向量化计算4.3 使用数组进行面向数组编程4.3.5 唯一值与其他集合逻辑4.3.4 排序4.3.3 布尔值数组的方法4.3.2 数学和统计方法4.3.1 将条件逻辑作为数组操作4 NumPy基础:数组与向量化计算4.7 示例:随机漫步4.7.1 一次性模拟多次随机漫步5 pandas入门入门055 pandas入门015.1 pandas数据结构介绍025.2 基本功能035.3 描述性统计的概述与计算045.4 本章小结5 pandas入门5.1 pandas数据结构介绍5.1.1 Series5.1.2 DataFrame5.1.3 索引对象5.2 基本功能5 pandas入门5
8、.2.1 重建索引5.2.2 轴向上删除条目5.2.3 索引、选择与过滤5.2.4 整数索引5.2.5 算术和数据对齐5.2.6 函数应用和映射5 pandas入门5.2 基本功能AB5.2.8 含有重复标签的轴索引5.2.7 排序和排名5 pandas入门5.3 描述性统计的概述与计算15.3.1 相关性和协方差25.3.2 唯一值、计数和成员属性6 数据载入、存储数据载入、存储及文件格式及文件格式066 数据载入、存储及文件格式6.1 文本格式数据的读写6.2 二进制格式6.5 本章小结6.4 与数据库交互6.3 与Web API交互6 数据载入、存储及文件格式6.1 文本格式数据的读写6
9、.1.2 将数据写入文本格式026.1.4 JSON数据046.1.1 分块读入文本文件016.1.3 使用分隔格式036.1.5 XML和HTML:网络抓取056 数据载入、存储及文件格式6.2 二进制格式A6.2.1 使用HDF5格式6.2.2 读取Microsoft Excel文件B7 数据清洗与准备数据清洗与准备077 数据清洗与准备017.1 处理缺失值7.2 数据转换027.3 字符串操作037.4 本章小结047 数据清洗与准备7.1 处理缺失值7.1.1 过滤缺失值17.1.2 补全缺失值27.2 数据转换7 数据清洗与准备7.2.2 使用函数或映射进行数据转换7.2.4 重命
10、名轴索引7.2.6 检测和过滤异常值7.2.1 删除重复值7.2.3 替代值7.2.5 离散化和分箱7 数据清洗与准备7.2 数据转换A7.2.7 置换和随机抽样7.2.8 计算指标/虚拟变量B7.3 字符串操作7 数据清洗与准备7.3.1 字符串对象方法7.3.2 正则表达式7.3.3 pandas中的向量化字符串函数8 数据规整:连接、数据规整:连接、联合与重塑联合与重塑088 数据规整:连接、联合与重塑8.1 分层索引18.3 重塑和透视38.2 联合与合并数据集28.4 本章小结48 数据规整:连接、联合与重塑8.1 分层索引CBA8.1.1 重排序和层级排序8.1.2 按层级进行汇总
11、统计8.1.3 使用DataFrame的列进行索引8 数据规整:连接、联合与重塑8.2 联合与合并数据集8.2.1 数据库风格的DataFrame连接8.2.2 根据索引合并8.2.3 沿轴向连接8.2.4 联合重叠数据8 数据规整:连接、联合与重塑8.3 重塑和透视CBA8.3.1 使用多层索引进行重塑8.3.2 将“长”透视为“宽”8.3.3 将“宽”透视为“长”9 绘图与可视化绘图与可视化099 绘图与可视化9.1 简明matplotlib API入门9.2 使用pandas和seaborn绘图9.3 其他Python可视化工具9.4 本章小结DCAB9.1 简明matplotlib A
展开阅读全文