引言:

       什么是DataFrame?
       DataFrame:一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。
       至于对Series知识想进行回顾,请到我的这篇博文—pandas详解(Series篇)


DataFrame:

DataFrame创建:

       DataFrame创建的两种方式:
       1. 通过二维数组创建
       2. 通过字典的方式创建,此种方法创建同时还要注意:字典中的value值只能是一维数组 或 单个的简单数据类型,如果是数组,要求所有数组长度一致,如果是单个数据,则会使每行添加相同数据。
       如图:
二维数组创建
字典方式创建


DataFrame索引:

       DataFrame分为行索引和列索引,默认情况下是从0开始,也可以自定义索引,添加行索引使用 index ,添加列索引使用 columns ,此操作称“重置行列索引值”。如图:
行列索引


索引对象:
  1. 不管是Series还是DataFrame对象,都有索引对象。
  2. 索引对象负责管理轴标签和其它元数据(eg:轴名称等等)
  3. 通过索引可以从Series、DataFrame中获取值或者对某个索引值进行重新赋值
  4. Series或者DataFrame的自动对齐功能是通过索引实现的

DataFrame获取数据和CRUD操作:

       1. 可以直接通过列索引获取指定列的数据, eg: df[column_name],也可以通过打点调用eg: df.column_name,但是一般容易混淆,所以减少打点调用
       2. 如果需要获取指定行的数据的话,需要通过ix方法来获取对应行索引的行数据,eg: df.ix[index_name]
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


ix、loc、iloc:

       在进行行操作的时候,使用 ix 获取会报出来这样的信息,如图:
ix
       这是因为 ix 使用是再python2 中,之后使用 loc 或者 iloc 代替,详细请查阅 官方文档,这里我仅写一下个人理解:

  1. loc只能通过index和columns(行标签)来取,不能用数字
  2. iloc只能用数字(行号)索引,不能用索引名
  3. ix可以用数字索引,也可以用index和column索引(也是将loc和iloc结合)
  4. 更多区别也可以参考 ix、loc、iloc
Logo

学大模型,用大模型上飞桨星河社区!每天8点V100G算力免费领!免费领取ERNIE 4.0 100w Token >>>

更多推荐