Pandas DataFrame groupby() 方法
实例
找出每个汽车品牌的平均二氧化碳消耗量:
import pandas as pddata = {'co2': [95, 90, 99, 104, 105, 94, 99, 104],'model': ['Citigo', 'Fabia', 'Fiesta', 'Rapid', 'Focus', 'Mondeo', 'Octavia', 'B-Max'],'car': ['Skoda', 'Skoda', 'Ford', 'Skoda', 'Ford', 'Ford', 'Skoda', 'Ford']}df = pd.DataFrame(data)print(df.groupby(["car"]).mean())
定义与用法
groupby() 方法允许您对数据进行分组,并在这些组上执行函数。
语法
dataframe.transform(by, axis, level, as_index, sort, group_keys, observed, dropna)
参数
axis, level,as_index, sort,group_keys, observed,dropna 都是 关键字参数。
| 参数 | 值 | 描述 |
|---|---|---|
| by | 必填。标签、标签列表或用于指定如何对 DataFrame 进行分组的函数 | |
| axis | 0 1 'index' 'columns' | 可选, 需要进行分组的轴, 默认值为 0。 |
| level | levelNone | 可选。 指定是否应按指定级别进行分组。默认为 None |
| as_index | True False | 可选, 默认值 True。如果结果不应使用组标签作为索引,则设置为 False |
| sort | True False | 可选, 默认值为 True。如果结果不应对组键进行排序,则设置为 False(以提高性能) |
| group_keys | True False | 可选, 默认值为 True。如果结果不应将组键添加到索引中,则设置为 False |
| dropna | True False | 可选, 默认值为True。如果结果应包括组键为空值的行/列,则设置为 False |
返回值
被执行 groupby() 并对其中对行/列进行分组的 DataFrame 。