02.用于数据科学的 Python 基础知识之pandas(下)


dataframe数据去重

这里的“去重”特指去除“重复行

df.drop_duplicates(subset=None, keep='first', inplace=False)
  • subset:指定是哪些列重复。
  • keep:去重后留下第几行,{‘first’, ‘last’, False}, default ‘first’,如果是False,则去除全部重复的行。
  • inplace:是否作用于原来的df。

df14.drop_duplicates(keep='last')

去除重复行,保留重复行中最后一行

02.用于数据科学的 Python 基础知识之pandas(下)

df14.drop_duplicates(subset=('c',))

去除’c’列中有重复的值所在的行

02.用于数据科学的 Python 基础知识之pandas(下)

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/02-yongyushujukexuede-python-jichuzhishizhipandasxia-2/.html

(0)
打赏 微信扫一扫 微信扫一扫
朋远方的头像朋远方
上一篇 2022年11月12日 下午12:49
下一篇 2022年11月13日 上午8:30

相关推荐

发表回复

登录后才能评论