Pandas 绘图
绘图
Pandas 使用 plot()
方法来创建图表。
我们可以使用 Matplotlib
库的子模块 Pyplot
在屏幕上将图表可视化。
可以访问本站的 Matplotlib 教程 学习更多的 Matplotlib 知识。
实例
从 Matplotlib 中导入 pyplot 将我们的图表可视化:
#只要三行代码就能使编译器绘制:
import sys
import matplotlib
matplotlib.use('Agg')
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
#只要两行代码就能让我们的编译器能够绘制:
plt.savefig(sys.stdout.buffer)
sys.stdout.flush()
下面的例子都使用的一个叫做 "data.csv" 的 CSV 文件。
散点图
指定要使用 kind
参数绘制散点图:
kind = 'scatter'
散点图需要 x 轴和 y 轴。
在下面的示例中,我们将 x 轴使用 'Duration',y 轴使用 'Calories'。
包括如下所示的 x 和 y 参数:
x='Duration',y='Calories'
实例
import sys
import matplotlib
matplotlib.use('Agg')
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
plt.savefig(sys.stdout.buffer)
sys.stdout.flush()
结果
记住:在上一个例子中,我们了解到 'Duration' 和 'Calories' 之间的相关性为
0.922721
,并且我们排除了持续时间越长意味着燃烧的卡路里越多的事实。实例
列之间没有关系的散点图:
import sys
import matplotlib
matplotlib.use('Agg')
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
plt.savefig(sys.stdout.buffer)
sys.stdout.flush()
结果
直方图
使用 kind
参数来指定你所需要的直方图:
kind = 'hist'
直方图只需要一列。
柱状图显示了每个间隔的频率,例如,在 50 到 60 分钟之间进行了多少次训练?
在下面的示例中,我们将使用 "Duration" 列创建直方图:
实例
#只要三行代码就能使编译器绘制:
import sys
import matplotlib
matplotlib.use('Agg')
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df["Duration"].plot(kind = 'hist')
plt.show()
#只要两行代码就能让我们的编译器能够绘制:
plt.savefig(sys.stdout.buffer)
sys.stdout.flush()
结果
注意:柱状图告诉我们,有 100 多个训练持续了 50 到 60 分钟。