Python 机器学习 - 正态数据分布

正态数据分布（Normal Data Distribution）

在上一章中，我们学习了如何创建给定大小且在两个给定值之间的完全随机数组。

在本章中，我们将学习如何创建一个将值集中在给定值周围的数组。

在概率论中，在数学家卡尔·弗里德里希·高斯（Carl Friedrich Gauss）提出了这种数据分布的公式之后，这种数据分布被称为正态数据分布或高斯数据分布。

典型的正态数据分布：

import sys
import matplotlib
matplotlib.use('Agg')
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
plt.savefig(sys.stdout.buffer)
sys.stdout.flush()

运行一下

结果：

注释：由于正态分布图具有钟形的特征形状，因此也称为钟形曲线。

直方图解释

我们使用 numpy.random.normal() 方法创建的数组（具有 100000 个值）绘制具有 100 栏的直方图。

我们指定平均值为 5.0，标准差为 1.0。

这意味着这些值应集中在 5.0 左右，并且很少与平均值偏离 1.0。

从直方图中可以看到，大多数值都在 4.0 到 6.0 之间，最高值大约是 5.0。

Python 机器学习 - 正态数据分布

正态数据分布（Normal Data Distribution）

结果：

直方图解释

分类导航