R 语言百分位数

百分位数

在统计学中,百分位数用于给出一个数字,该数字描述了给定百分比值低于的值。

如果我们看看 mtcars 数据集中 wt(重量)变量的值:观察wt(重量):

按照重量(wt)排序:

1.5131.6151.8351.9352.1402.2002.3202.465
2.6202.7702.7802.8753.1503.1703.1903.215
3.4353.4403.4403.4403.4603.5203.5703.570
3.7303.7803.8403.8454.0705.2505.3455.424

75% 的车辆的重量是多少?答案是 3.613610 磅,这意味着 75% 或更少的汽车重量 3610 磅,或更少:

实例
  1. Data_Cars <- mtcars
  2. # c() specifies which percentile you want
  3. quantile(Data_Cars$wt, c(0.75))

结果如下:

如果在不指定 c() 参数的情况下运行 quantile() 函数,将得到 0、25、50、75 和 100 的百分位数:

实例
  1. Data_Cars <- mtcars
  2. quantile(Data_Cars$wt)

结果如下:

     0%     25%     50%     75%    100%

1.51300 2.58125 3.32500 3.61000 5.42400

四分位数

四分位数是按升序排序时分为四部分的数据:

  1. 第一个四分位数的值会截断前 25% 的数据
  2. 第二个四分位数的值会截断前 50% 的数据
  3. 第三个四分位数的值会截断前 75% 的数据
  4. 第四个四分位数的值会截断 100% 的数据
使用 quantile() 函数获取四分位数。