02.用于数据科学的 Python 基础知识之pandas(下)


下面来讲讲groupby之后的常见操作。

agg 聚合操作

聚合操作是groupby后非常常见的操作,会写SQL的朋友对此应该是非常熟悉了。聚合操作可以用来求和、均值、最大值、最小值等,下面的表格列出了Pandas中常见的聚合操作。

02.用于数据科学的 Python 基础知识之pandas(下)
02.用于数据科学的 Python 基础知识之pandas(下)
02.用于数据科学的 Python 基础知识之pandas(下)

dataframe新增列和插入列

新增列指在末尾新增一列,插入列表示在任意位置插入一列;

扩充列可以直接像字典一样,列名对应一个list,但是注意list的长度要跟index的长度一致。

这里的“E”加不加引号都可以,是数字还是字母也都可以,是单个字母或数字还是多个字母或数字也都可以,这里都表示要新增的列的名称。

df["E"]=[1,2,3,4,5,6]
02.用于数据科学的 Python 基础知识之pandas(下)

在任意位置插入一列

df.insert(1,"F",(11,22,33,44),allow_duplicates=False)

参数说明:

  1. 表示新列在新dataframe中的列顺序,0表示第一列,1表示第2列,以此类推,输入一个整数,而且该整数不能超过新dataframe的最大列数-1;
  2. “F”:表示的是新列的名称,可以是数字也可以是字母,但是必须加引号,因为是string类型;
  3. (11,22,33,44):表示的是新增列的数据,这个数据的个数必须与原来的列保持一致;
  4. allow_duplicates=False:表示是否允许新增列的名称与原来的列名称重复,False代表不允许重复,否则就会报错,True代表可以重复;
02.用于数据科学的 Python 基础知识之pandas(下)

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/02-yongyushujukexuede-python-jichuzhishizhipandasxia-2/.html

(0)
打赏 微信扫一扫 微信扫一扫
朋远方的头像朋远方
上一篇 2022年11月12日 下午12:49
下一篇 2022年11月13日 上午8:30

相关推荐

发表回复

登录后才能评论