Pandas 绘图

绘图
Pandas 使用 plot() 方法来创建图表。
我们可以使用 Matplotlib 库的子模块 Pyplot 在屏幕上将图表可视化。
可以访问本站的 Matplotlib 教程 学习更多的 Matplotlib 知识。
实例
从 Matplotlib 中导入 pyplot 将我们的图表可视化:
#只要三行代码就能使编译器绘制:import sysimport matplotlibmatplotlib.use('Agg')import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_csv('data.csv')df.plot()plt.show()#只要两行代码就能让我们的编译器能够绘制:plt.savefig(sys.stdout.buffer)sys.stdout.flush()
下面的例子都使用的一个叫做 "data.csv" 的 CSV 文件。
散点图
指定要使用 kind 参数绘制散点图:
kind = 'scatter'
散点图需要 x 轴和 y 轴。
在下面的示例中,我们将 x 轴使用 'Duration',y 轴使用 'Calories'。
包括如下所示的 x 和 y 参数:
x='Duration',y='Calories'
实例
import sysimport matplotlibmatplotlib.use('Agg')import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_csv('data.csv')df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')plt.show()plt.savefig(sys.stdout.buffer)sys.stdout.flush()
结果

记住:在上一个例子中,我们了解到 'Duration' 和 'Calories' 之间的相关性为
0.922721,并且我们排除了持续时间越长意味着燃烧的卡路里越多的事实。实例
列之间没有关系的散点图:
import sysimport matplotlibmatplotlib.use('Agg')import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_csv('data.csv')df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')plt.show()plt.savefig(sys.stdout.buffer)sys.stdout.flush()
结果

直方图
使用 kind 参数来指定你所需要的直方图:
kind = 'hist'
直方图只需要一列。
柱状图显示了每个间隔的频率,例如,在 50 到 60 分钟之间进行了多少次训练?
在下面的示例中,我们将使用 "Duration" 列创建直方图:
实例
#只要三行代码就能使编译器绘制:import sysimport matplotlibmatplotlib.use('Agg')import pandas as pdimport matplotlib.pyplot as pltdf = pd.read_csv('data.csv')df["Duration"].plot(kind = 'hist')plt.show()#只要两行代码就能让我们的编译器能够绘制:plt.savefig(sys.stdout.buffer)sys.stdout.flush()
结果

注意:柱状图告诉我们,有 100 多个训练持续了 50 到 60 分钟。