Pandas DataFrame describe() 方法
实例
将每行的值与前一行的值相乘:
import pandas as pd
data = [[10, 18, 11], [13, 15, 8], [9, 20, 3]]
df = pd.DataFrame(data)
print(df.describe())
定义与用法
describe()
方法返回 DataFrame 中数据的描述。
如果 DataFrame 包含数字数据,则说明包含每列的以下信息:
- count - 非空值的数量。
- mean - 平均值。
- std - 标准差。
- min - 最小值。
- 25% - 25% 的百分位数*。
- 50% - 50% 的百分位数*。
- 75% - 75% 的百分位数*。
- max - 最大值。
*百分位含义:有多少值小于给定的百分位。对此可以访问 机器学习 章节学习更多相关知识。
语法
dataframe.describe(percentiles, include, exclude, datetime_is_numeric)
参数
percentile
, include
, exclude
, datetime_is_numeric
都是 关键字参数。
参数 | 值 | 描述 |
---|---|---|
percentile | numbers between: 0 and 1 | 可选, 要包含在结果中的百分比列表,默认为 : [.25, .50, .75]。 |
include | None 'all' datatypes | 可选, 结果中允许的数据类型列表 |
exclude | None 'all' datatypes | 可选, 结果中不允许的数据类型列表 |
datetime_is_numeric | True False | 可选, 默认值为 False。设置为 True 可将日期时间数据视为数字 |
返回值
具有每行统计信息 DataFrame 对象。