Pandas DataFrame groupby() 方法

实例

找出每个汽车品牌的平均二氧化碳消耗量:

  1. import pandas as pd
  2. data = {
  3. 'co2': [95, 90, 99, 104, 105, 94, 99, 104],
  4. 'model': ['Citigo', 'Fabia', 'Fiesta', 'Rapid', 'Focus', 'Mondeo', 'Octavia', 'B-Max'],
  5. 'car': ['Skoda', 'Skoda', 'Ford', 'Skoda', 'Ford', 'Ford', 'Skoda', 'Ford']
  6. }
  7. df = pd.DataFrame(data)
  8. print(df.groupby(["car"]).mean())

定义与用法

groupby() 方法允许您对数据进行分组,并在这些组上执行函数。


语法

  1. dataframe.transform(by, axis, level, as_index, sort, group_keys, observed, dropna)

参数

axis, level,as_index, sort,group_keys, observed,dropna 都是 关键字参数

参数描述
by 必填。标签、标签列表或用于指定如何对 DataFrame 进行分组的函数
axis0
1
'index'
'columns'
可选, 需要进行分组的轴, 默认值为 0。
levellevel
None
可选。 指定是否应按指定级别进行分组。默认为 None
as_indexTrue
False
可选, 默认值 True。如果结果不应使用组标签作为索引,则设置为 False
sortTrue
False
可选, 默认值为 True。如果结果不应对组键进行排序,则设置为 False(以提高性能)
group_keysTrue
False
可选, 默认值为 True。如果结果不应将组键添加到索引中,则设置为 False
dropnaTrue
False
可选, 默认值为True。如果结果应包括组键为空值的行/列,则设置为 False

返回值

被执行 groupby() 并对其中对行/列进行分组的 DataFrame 。

分类导航