删除dataframe中的缺失值
dropna()方法,能够找到DataFrame类型数据的空值(缺失值),将空值所在的行/列删除后,将新的DataFrame作为返回值返回。
dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
参数说明:
- axis:轴。0或’index’,表示按行删除;1或’columns’,表示按列删除。
- how:筛选方式。‘any’,表示该行/列只要有一个以上的空值,就删除该行/列;‘all’,表示该行/列全部都为空值,就删除该行/列。
- thresh:非空元素最低数量。int型,默认为None。如果该行/列中,非空元素数量小于这个值,就删除该行/列。
- subset:子集。列表,元素为行或者列的索引。如果axis=0或者‘index’,subset中元素为列的索引;如果axis=1或者‘column’,subset中元素为行的索引。由subset限制的子区域,是判断是否删除该行/列的条件判断区域。
- inplace:是否原地替换。布尔值,默认为False。如果为True,则在原DataFrame上进行操作,返回值为None。
df_data.dropna(axis=0, how='all', inplace=True)
删除所有全部都是空的行
axis=0,表示操作的对象是x轴方向,也就是行。
how=”all”,表示该行中所有数据都是空才删除该行,如果是“any”的话,则只要该行中含有一个空数据,就删除整行;
inplace=True,表示在原DataFrame上进行操作,此时如果打印df_data的话,就是删除指定行之后的内容;
df_data.dropna(axis=1, how='all', inplace=True)
删除所有全部都是空的列
axis=1,表示操作的对象是y轴方向,也就是列。
如果是不带任何参数的形式,则是删除所有含有空内容的行和列:
df.dropna()
原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/02-yongyushujukexuede-python-jichuzhishizhipandasxia-2/.html