在 Pandas 中计算 DataFrame 列中某个值的频率

pandasserver side programmingprogramming更新于 2024/9/29 3:13:00

要在 Pandas 中计算 DataFrame 列中某个值的频率,我们可以使用 df.groupby(column name).size() 方法。

步骤

  • 创建一个二维、大小可变、可能异构的表格数据 df

  • 打印输入 DataFrame,df

  • 打印列的频率,x

  • 打印列的频率,y

  • 打印列的频率,z

示例

import pandas as pd

df = pd.DataFrame(
   {
        &"x": [5, 2, 1, 5],
      &"y": [4, 10, 5, 10],
      &"z": [1, 1, 5, 1]
   }
)

print "Input DataFrame is:
", df col = &"x"; count = df.groupby('x').size() print "列中值的频率", col, "is:
", count col = "y" count = df.groupby('y').size() print "列中值的频率", col, "is:
", count col = "z" count = df.groupby('z').size() print "列中值的频率", col, "is:
", count

输出

输入 DataFrame 为:
   x  y  z
0  5  4  1
1  2 10  1
2  1  5  5
3 5  10  1

x 列中值的频率为:
   x
1  1
2  1
5  2
dtype: int64

y 列中值的频率为:
   y
4  1
5  1
10 2
dtype: int64

z 列中值的频率为:
   z
1  3
5  1
dtype: int64

相关文章