Python学习之数据分析与数据挖掘课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《Python学习之数据分析与数据挖掘课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 学习 数据 分析 挖掘 课件
- 资源描述:
-
1、Python学习数据分析与数据挖掘认识Python Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。Python由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。Python是纯粹的自由软件,源代码和解释器CPython遵循 GPL(GNU General Public License)协议 Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C+)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型,然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形
2、渲染模块,性能要求特别高,就可以用C/C+重写,而后封装为Python可以调用的扩展类库。Python优点有哪些 Python是一种开源的、解析性的,面向对象的编程语言 Python使用一种优雅的语法,可读性强 Python具有丰富的库,可以处理各种工作 Python支持类和多层继承等的面向对象编程技术 Python可运行在多种计算机平台和操作系统中,如Unix、Windows、MacOS、Ubuntu、OS/2等等为什么选择Python进行数据分析 在众多解释型语言中,Python最大的特点是拥有一个巨大而活跃的科学计算社区。进入21世纪以来,在行业应用和学术研究中采用python进行科学计
3、算的势头越来越猛。近年来,由于Python有不断改良的库(主要是pandas),使其成为数据处理任务的一大代替方案,结合其在通用编程方面的强大实力,完全可以只是用Python这一种语言去构建以数据为中心的应用程序。作为一个科学计算平台,Python的成功源于能够轻松的集成C、C+以及Fortran代码。大部分现代计算机环境都利用了一些Fortran和C库来是西安线性代数、优选、积分、快速傅里叶变换以及其他诸如此类的算法。课程内容1.Python环境搭建环境搭建 1.1 python1.1 python版本选择版本选择 1.2 python 1.2 python 安装安装2.Python基础基础
4、 2.1 python2.1 python基础语法基础语法 2.2 python2.2 python数据类型数据类型 2.3 2.3 条件和循环条件和循环 2.4 Python 2.4 Python 函数函数 2.5 Python 2.5 Python 模块模块 2.6 Python 2.6 Python文件文件I/OI/O3.Python库介绍库介绍 3.1 NumPy3.1 NumPy库介绍库介绍 3.2 Pandas 3.2 Pandas库介绍库介绍 4.数据处理与分析数据处理与分析 4.1 4.1 数据探索数据探索 4.2 4.2 数据预处理数据预处理 4.3 4.3 挖掘建模挖掘建模
5、5.实例分析实例分析 5.1 Titanic 5.1 Titanic数据集分析数据集分析 5.2 5.2 餐饮客户价值分析餐饮客户价值分析1.1 Python环境搭建 Python2.X和Python3.XPython的3.0版本,常被称为Python 3000,或简称Py3k。相对于Python的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0在设计的时候没有考虑向下相容,许多针对早期Python版本设计的程式都无法在Python 3.0上正常执行。大多数第三方库都正在努力地相容Python 3.0版本。即使无法立即使用Python 3.0,也建议编写相容Python
6、 3.0版本的程式,然后使用Python 2.6,Python 2.7来执行。In summary:Python 2.x is legacy,Python 3.x is the present and future of the language1.2 Python安装集成开发环境选择Pycharm软件界面编写我的第一个Python程序 Hello World程序 简单的计算器2.1 Python基本语法 Python标识符在 Python 里,标识符由字母、数字、下划线组成。在 Python 中,所有标识符可以包括英文、数字以及下划线(_),但不能以数字开头。Python 中的标识符是区分大
7、小写的。Python 可以同一行显示多条语句,方法是用分号;分开。以下划线开头的标识符是有特殊意义的。以单下划线开头 _foo 的代表不能直接访问的类属性,需通过类提供的接口进行访问,不能用 from xxx import*而导入以双下划线开头的 _foo 代表类的私有成员;以双下划线开头和结尾的 _foo_ 代表 Python 里特殊方法专用的标识,如 _init_()代表类的构造函数。Python 保留字符下面的列表显示了在Python中的保留字。这些保留字不能用作常数或变数,或任何其他标识符名称。所有 Python 的关键字只包含小写字母。andexecnotassertfinallyo
8、rbreakforpassclassfromprintcontinueglobalraisedefifreturndelimporttryelifinwhileelseiswith exceptlambdayield行和缩进学习 Python 与其他语言最大的区别就是,Python 的代码块不使用大括号 来控制类,函数以及其他逻辑判断。python 最具特色的就是用缩进来写模块。缩进的空白数量是可变的,但是所有代码块语句必须包含相同的缩进空白数量,这个必须严格执行。以下代码会执行错误:Python引号Python 可以使用引号()、双引号()、三引号(或 )来表示字符串,引号的开始与结束必须的
9、相同类型的。其中三引号可以由多行组成,编写多行文本的快捷语法,常用于文档字符串,在文件的特定地点,被当做注释。Python注释python中单行注释采用#开头python 中多行注释使用三个单引号()或三个双引号()。2.2 Python数据类型 标准数据类型Python 定义了一些标准类型,用于存储各种类型的数据。Python有五个标准的数据类型:Numbers(数字)String(字符串)List(列表)Tuple(元组)Dictionary(字典)Python数字数字数据类型用于存储数值。他们是不可改变的数据类型,这意味着改变数字数据类型会分配一个新的对象。当你指定一个值时,Number
10、对象就会被创建。可以通过使用del语句删除单个或多个对象的引用。例如:Python支持四种不同的数字类型:int(有符号整型)long(长整型也可以代表八进制和十六进制)float(浮点型)complex(复数)var1=1var2=10 del vardel var_a,var_b Python字符串字符串或串(String)是由数字、字母、下划线组成的一串字符。python的字串列表有2种取值顺序:从左到右索引默认0开始的,最大范围是字符串长度少1从右到左索引默认-1开始的,最大范围是字符串开头如果你要实现从字符串中获取一段子字符串的话,可以使用变量 头下标:尾下标,就可以截取相应的字符串
11、,其中下标是从 0 开始算起,可以是正数或负数,下标可以为空表示取到头或尾。s=a1a2an(n=0)S=ilovepythons1:5的结果是love。Python列表List(列表)是 Python 中使用最频繁的数据类型。列表可以完成大多数集合类的数据结构实现。它支持字符,数字,字符串甚至可以包含列表(即嵌套)。列表用 标识,是 python 最通用的复合数据类型。列表中值的切割也可以用到变量 头下标:尾下标,就可以截取相应的列表,从左到右索引默认 0 开始,从右到左索引默认-1 开始,下标可以为空表示取到头或尾。加号+是列表连接运算符,星号*是重复操作。如下实例:Python元组元组是
12、另一个数据类型,类似于List(列表)。元组用()标识。内部元素用逗号隔开。但是元组不能二次赋值,相当于只读列表。Python 字典字典(dictionary)是除列表以外python之中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集合。两者之间的区别在于:字典当中的元素是通过键来存取的,而不是通过偏移存取。字典用 标识。字典由索引(key)和它对应的值value组成。Python数据类型转换函数描述int(x,base)将x转换为一个整数long(x,base)将x转换为一个长整数float(x)将x转换到一个浮点数complex(real,imag)创建一个复数str(
13、x)将对象 x 转换为字符串repr(x)将对象 x 转换为表达式字符串eval(str)用来计算在字符串中的有效Python表达式,并返回一个对象tuple(s)将序列 s 转换为一个元组list(s)将序列 s 转换为一个列表set(s)转换为可变集合dict(d)创建一个字典。d 必须是一个序列(key,value)元组。frozenset(s)转换为不可变集合chr(x)将一个整数转换为一个字符unichr(x)将一个整数转换为Unicode字符ord(x)将一个字符转换为它的整数值hex(x)将一个整数转换为一个十六进制字符串oct(x)将一个整数转换为一个八进制字符串2.3 条件和
14、循环 Python 条件语句Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码块。Python程序语言指定任何非0和非空(null)值为true,0 或者 null为false。Python 编程中 if 语句用于控制程序的执行,基本形式为 Python 循环语句循环语句允许我们执行一个语句或语句组多次。Python提供了for循环和while循环(在Python中没有do.while循环)循环类型描述while 循环在给定的判断条件为 true 时执行循环体,否则退出循环体。for 循环重复执行语句嵌套循环你可以在while循环体中嵌套for循环演示
15、 Python while 语句执行过程2.4 Python 函数定义函数遵循的相关规则 函数代码块以 def 关键词开头,后接函数标识符名称和圆括号()。任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。函数的第一行语句可以选择性地使用文档字符串用于存放函数说明。函数内容以冒号起始,并且缩进。return 表达式 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回 None。函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数语法 实例2.5 Python 模块 定义模块好处 模块让你能够有逻辑地组织你的 Python 代码段。把相关
16、的代码分配到一个模块里能让你的代码更好用,更易懂。模块能定义函数,类和变量,模块里也能包含可执行的代码。Python 模块(Module),是一个 Python 文件,以.py 结尾,包含了 Python 对象定义和Python语句。模块的引入模块定义好后,我们可以使用 import 语句来引入模块,语法如下:比如要引用模块 math,就可以在文件最开始的地方用 import math 来引入。在调用 math 模块中的函数时,必须这样引用:import module1,module2,.moduleN 模块名.函数名 2.6 Python文件I/O 打印到屏幕最简单的输出方法是用print语
17、句,你可以给它传递零个或多个用逗号隔开的表达式。此函数把你传递的表达式转换成一个字符串表达式,并将结果写到标准输出如下:读取键盘输入Python提供了两个内置函数从标准输入读入一行文本,默认的标准输入是键盘。二者区别raw_input会提示你输入任意字符串,然后在屏幕上显示相同的字符串。input函数和 raw_input函数基本类似,但是 input 可以接收一个Python表达式作为输入,并将运算结果返回。raw_inputinput打开和关闭文件 open 函数 你必须先用Python内置的open()函数打开一个文件,创建一个file对象,相关的方法才可以调用它进行读写。语法:file
18、_name:file_name变量是一个包含了你要访问的文件名称的字符串值。buffering:如果buffering的值被设为0,就不会有寄存。如果buffering的值取1,访问文件时会寄存行。如果将buffering的值设为大于1的整数,表明了这就是的寄存区的缓冲大小。如果取负值,寄存区的缓冲大小则为系统默认。access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读(r)。Python 提供了必要的函数和方法进行默认情况下的文件基本操作。你可以用 file 对象做大部分的文件操作。fil
19、e object=open(file_name,access_mode,buffering)close()方法File 对象的 close()方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。当一个文件对象的引用被重新指定给另一个文件时,Python 会关闭之前的文件。语法:fileObject.close();write()方法 write()方法可将任何字符串写入一个打开的文件。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。write()方法不会在字符串的结尾添加换行符(n)。语法:fileObject.write(string);read
展开阅读全文