Pandas 绘图

绘图

Pandas 使用 plot() 方法来创建图表。

我们可以使用 Matplotlib 库的子模块 Pyplot 在屏幕上将图表可视化。

可以访问本站的 Matplotlib 教程 学习更多的 Matplotlib 知识。

实例

从 Matplotlib 中导入 pyplot 将我们的图表可视化:

  1. #只要三行代码就能使编译器绘制:
  2. import sys
  3. import matplotlib
  4. matplotlib.use('Agg')
  5. import pandas as pd
  6. import matplotlib.pyplot as plt
  7. df = pd.read_csv('data.csv')
  8. df.plot()
  9. plt.show()
  10. #只要两行代码就能让我们的编译器能够绘制:
  11. plt.savefig(sys.stdout.buffer)
  12. sys.stdout.flush()

下面的例子都使用的一个叫做 "data.csv" 的 CSV 文件。

下载 CSV 文件,或者在浏览器中查看 CSV 文件


散点图

指定要使用 kind 参数绘制散点图:

kind = 'scatter'

散点图需要 x 轴和 y 轴。

在下面的示例中,我们将 x 轴使用 'Duration',y 轴使用 'Calories'。

包括如下所示的 x 和 y 参数:

x='Duration',y='Calories'

实例
  1. import sys
  2. import matplotlib
  3. matplotlib.use('Agg')
  4. import pandas as pd
  5. import matplotlib.pyplot as plt
  6. df = pd.read_csv('data.csv')
  7. df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
  8. plt.show()
  9. plt.savefig(sys.stdout.buffer)
  10. sys.stdout.flush()
结果

记住:在上一个例子中,我们了解到 'Duration' 和 'Calories' 之间的相关性为 0.922721,并且我们排除了持续时间越长意味着燃烧的卡路里越多的事实。
实例

列之间没有关系的散点图:

  1. import sys
  2. import matplotlib
  3. matplotlib.use('Agg')
  4. import pandas as pd
  5. import matplotlib.pyplot as plt
  6. df = pd.read_csv('data.csv')
  7. df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
  8. plt.show()
  9. plt.savefig(sys.stdout.buffer)
  10. sys.stdout.flush()
结果


直方图

使用 kind 参数来指定你所需要的直方图:

kind = 'hist'

直方图只需要一列。

柱状图显示了每个间隔的频率,例如,在 50 到 60 分钟之间进行了多少次训练?

在下面的示例中,我们将使用 "Duration" 列创建直方图:

实例
  1. #只要三行代码就能使编译器绘制:
  2. import sys
  3. import matplotlib
  4. matplotlib.use('Agg')
  5. import pandas as pd
  6. import matplotlib.pyplot as plt
  7. df = pd.read_csv('data.csv')
  8. df["Duration"].plot(kind = 'hist')
  9. plt.show()
  10. #只要两行代码就能让我们的编译器能够绘制:
  11. plt.savefig(sys.stdout.buffer)
  12. sys.stdout.flush()
结果

注意:柱状图告诉我们,有 100 多个训练持续了 50 到 60 分钟。