pandas详解(DataFrame篇)
文章目录引言:DataFrame:引言:什么是DataFrame?DataFrame:一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典至于对Series知识想进行回顾,请到我的这篇博文—pandas详解(Series篇)DataFrame:...
引言:
什么是DataFrame?
DataFrame:一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。
至于对Series知识想进行回顾,请到我的这篇博文—pandas详解(Series篇)
DataFrame:
DataFrame创建:
DataFrame创建的两种方式:
1. 通过二维数组创建
2. 通过字典的方式创建,此种方法创建同时还要注意:字典中的value值只能是一维数组 或 单个的简单数据类型,如果是数组,要求所有数组长度一致,如果是单个数据,则会使每行添加相同数据。
如图:
DataFrame索引:
DataFrame分为行索引和列索引,默认情况下是从0开始,也可以自定义索引,添加行索引使用 index ,添加列索引使用 columns ,此操作称“重置行列索引值”。如图:
索引对象:
- 不管是Series还是DataFrame对象,都有索引对象。
- 索引对象负责管理轴标签和其它元数据(eg:轴名称等等)
- 通过索引可以从Series、DataFrame中获取值或者对某个索引值进行重新赋值
- Series或者DataFrame的自动对齐功能是通过索引实现的
DataFrame获取数据和CRUD操作:
1. 可以直接通过列索引获取指定列的数据, eg: df[column_name],也可以通过打点调用eg: df.column_name,但是一般容易混淆,所以减少打点调用
2. 如果需要获取指定行的数据的话,需要通过ix方法来获取对应行索引的行数据,eg: df.ix[index_name]
ix、loc、iloc:
在进行行操作的时候,使用 ix 获取会报出来这样的信息,如图:
这是因为 ix 使用是再python2 中,之后使用 loc 或者 iloc 代替,详细请查阅 官方文档,这里我仅写一下个人理解:
- loc只能通过index和columns(行标签)来取,不能用数字
- iloc只能用数字(行号)索引,不能用索引名
- ix可以用数字索引,也可以用index和column索引(也是将loc和iloc结合)
- 更多区别也可以参考 ix、loc、iloc
更多推荐
所有评论(0)