dataframe数据去重
这里的“去重”特指去除“重复行”
df.drop_duplicates(subset=None, keep='first', inplace=False)
- subset:指定是哪些列重复。
- keep:去重后留下第几行,{‘first’, ‘last’, False}, default ‘first’,如果是False,则去除全部重复的行。
- inplace:是否作用于原来的df。
df14.drop_duplicates(keep='last')
去除重复行,保留重复行中最后一行

df14.drop_duplicates(subset=('c',))
去除’c’列中有重复的值所在的行

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/02-yongyushujukexuede-python-jichuzhishizhipandasxia-2/.html