02.用于数据科学的 Python 基础知识之pandas(下)

多个DataFrame数据合并

df.concat()的用法

pandas.concat()通常用来连接DataFrame对象。默认情况下是对两个DataFrame对象进行纵向连接, 当然通过设置参数,也可以通过它实现DataFrame对象的横向连接。


纵向连接DataFrame对象:

(1)两个DataFrame对象的列完全相同

pd.concat([df1, df2])
02.用于数据科学的 Python 基础知识之pandas(下)

从上面的结果可以看出, concat默认纵向连接DataFrame对象, 并且合并之后不改变每个DataFrame子对象的index值, 因此我们可以在合并之后的DataFrame中看到index的值0和1重复了两次。

如果希望重新设置合并之后的DataFrame对象的index值, 可以添加ignore_index=True参数:

02.用于数据科学的 Python 基础知识之pandas(下)

(2) 两个DataFrame对象的列不完全相同

pd.concat([df1, df3], sort=False)
02.用于数据科学的 Python 基础知识之pandas(下)

sort=False : 列的顺序维持原样, 不进行重新排序。

从结果可以看到, 因为df1中没有animal列, 所以在合并之后的DataFrame对象里, 所对应的元素都被设置成了NaN。

如果只想合并相同的列, 我们可以添加上join=’inner’参数:

pd.concat([df1, df3], join='inner')
02.用于数据科学的 Python 基础知识之pandas(下)

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/02-yongyushujukexuede-python-jichuzhishizhipandasxia-2/.html

(0)
打赏 微信扫一扫 微信扫一扫
朋远方的头像朋远方
上一篇 2022年11月12日 下午12:49
下一篇 2022年11月13日 上午8:30

相关推荐

发表回复

登录后才能评论