Pandas DataFrame describe() 方法

实例

将每行的值与前一行的值相乘:

  1. import pandas as pd
  2. data = [[10, 18, 11], [13, 15, 8], [9, 20, 3]]
  3. df = pd.DataFrame(data)
  4. print(df.describe())

定义与用法

describe() 方法返回 DataFrame 中数据的描述。

如果 DataFrame 包含数字数据,则说明包含每列的以下信息:

  • count - 非空值的数量。
  • mean - 平均值。
  • std - 标准差。
  • min - 最小值。
  • 25% - 25% 的百分位数*。
  • 50% - 50% 的百分位数*。
  • 75% - 75% 的百分位数*。
  • max - 最大值。

*百分位含义:有多少值小于给定的百分位。对此可以访问 机器学习 章节学习更多相关知识。


语法

  1. dataframe.describe(percentiles, include, exclude, datetime_is_numeric)

参数

percentile, include, exclude, datetime_is_numeric 都是 关键字参数

参数描述
percentilenumbers between:
0 and 1
可选, 要包含在结果中的百分比列表,默认为 :
[.25, .50, .75]。
includeNone
'all'
datatypes
可选, 结果中允许的数据类型列表
excludeNone
'all'
datatypes
可选, 结果中不允许的数据类型列表
datetime_is_numericTrue
False
可选, 默认值为 False。设置为 True 可将日期时间数据视为数字

 返回值

具有每行统计信息 DataFrame 对象。

分类导航