02.用于数据科学的 Python 基础知识之pandas(下)


数乘运算:

使用apply,数乘运算的意思就是让dataframe中的每一个值都同时乘以给到的这个数,这个数可以是整数也可以是小数,可以是负数,也可以是正数;

df.apply(lambda x: x*2)
02.用于数据科学的 Python 基础知识之pandas(下)

平方运算:

直接使用两个*,如果是平方后面就跟数字2,如果是立方后面就跟数字3,以此类推。

df**2
02.用于数据科学的 Python 基础知识之pandas(下)

对Dataframe进行数学运算

mean()函数

  Pandas中的df.mean()函数默认是等价于df.mean(0),即按轴方向求平均,得到每列数据的平均值。

  相反的df.mean(1)则代表按行方向求平均,得到每行数据的平均值。

data = {
		'A': [1, 2, 3],
		'B': [4, 5, 6],
		'C': [7, 8, 9]
}
df = pd.DataFrame(data)
02.用于数据科学的 Python 基础知识之pandas(下)

sum()函数

Pandas DataFrame.sum()函数用于返回用户所请求轴的值之和。如果输入值是索引轴, 则它将在列中添加所有值, 并且对所有列都相同。它返回一个序列, 其中包含每一列中所有值的总和。

在计算DataFrame中的总和时, 它还能够跳过DataFrame中的缺失值。

DataFrame.sum(axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs)

参数:

  • axis:{index (0), columns (1)} 0或”index”用于行, 而1或”columns”用于列;
  • skipna:布尔值, 默认为True,当计算结果时,排除NA / null值;
  • level:int 或 level name, 默认为None,并折叠成一个Series;
  • numeric_only:bool, 默认为None,只包括float,int,boolean列。如果 None,,将尝试使用一切,然后只使用数字数据。没有在Series中实现。
  • min_count:int, 默认为 0,执行操作所需的有效值数量。如果少于min_count非NA值,则结果将为NA。
  • ** kwargs:这是一个可选参数, 将传递给函数。

返回值:

如果指定级别, 则返回Series或DataFrame的总和。

02.用于数据科学的 Python 基础知识之pandas(下)

原创文章,作者:朋远方,如若转载,请注明出处:https://caovan.com/02-yongyushujukexuede-python-jichuzhishizhipandasxia-2/.html

Like (0)
Donate 微信扫一扫 微信扫一扫
朋远方的头像朋远方
Previous 2022年11月12日 下午12:49
Next 2022年11月13日 上午8:30

相关推荐

发表回复

Please Login to Comment