02.用于数据科学的 Python 基础知识之pandas(下)


删除dataframe中的缺失值

dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回。

dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

参数说明:

  • axis:轴。0或’index’,表示按行删除;1或’columns’,表示按列删除。
  • how:筛选方式。‘any’,表示该行/列只要有一个以上的空值,就删除该行/列;‘all’,表示该行/列全部都为空值,就删除该行/列。
  • thresh:非空元素最低数量。int型,默认为None。如果该行/列中,非空元素数量小于这个值,就删除该行/列。
  • subset:子集。列表,元素为行或者列的索引。如果axis=0或者‘index’,subset中元素为列的索引;如果axis=1或者‘column’,subset中元素为行的索引。由subset限制的子区域,是判断是否删除该行/列的条件判断区域。
  • inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。

df_data.dropna(axis=0, how='all', inplace=True)

删除所有全部都是空的行

axis=0,表示操作的对象是x轴方向,也就是行。

how=”all”,表示该行中所有数据都是空才删除该行,如果是“any”的话,则只要该行中含有一个空数据,就删除整行;

inplace=True,表示在原DataFrame上进行操作,此时如果打印df_data的话,就是删除指定行之后的内容;

df_data.dropna(axis=1, how='all', inplace=True)

删除所有全部都是空的列

axis=1,表示操作的对象是y轴方向,也就是列。

02.用于数据科学的 Python 基础知识之pandas(下)
02.用于数据科学的 Python 基础知识之pandas(下)
02.用于数据科学的 Python 基础知识之pandas(下)

如果是不带任何参数的形式,则是删除所有含有空内容的行和列:

df.dropna()

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/02-yongyushujukexuede-python-jichuzhishizhipandasxia-2/.html

(0)
打赏 微信扫一扫 微信扫一扫
朋远方的头像朋远方
上一篇 2022年11月12日 下午12:49
下一篇 2022年11月13日 上午8:30

相关推荐

发表回复

登录后才能评论