Pandas Series
什么是 Series?
Pandas Series 就像表格中的一列。
它是一个一维数组,包含任何类型的数据。
实例
从列表中创建一个简单的 Pandas Series:
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a)
print(myvar)
标签
如果未指定任何其他内容,则会用 索引 号标记这些值。第一个值具有索引 0,第二个值具有索引 1 等。
此标签可用于访问指定的值。
实例
返回 Series 的第一个值:
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a)
print(myvar[0])
创建标签
使用 index
参数, 您可以为标签命名。
实例
创建您自己的标签:
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar)
创建标签后,可以通过引用标签来访问项目。
实例
返回 "y" 的值:
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar["y"])
键/值 对象
我们也可以使用 键/值(key/value)对象,类似字典来创建 Series:
实例
从一个键值字典中创建 Pandas Series:
import pandas as pd
calories = {"day1": 420, "day2": 380, "day3": 390}
myvar = pd.Series(calories)
print(myvar)
字典的 key
变成了索引值。
如果我们只需要字典中的一部分数据,只需要使用 index
参数来指定需要数据的索引即可
实例
用 "day1" 和 "day2" 的数据来创建一个 Series:
import pandas as pd
calories = {"day1": 420, "day2": 380, "day3": 390}
myvar = pd.Series(calories, index = ["day1", "day2"])
print(myvar)
DataFrames
Pandas 中的数据集通常是多维表,称为 DataFrames(数据帧)。
Series 就像一列,DataFrames 就是整个表。
实例
从两个 Series 中创建一个 DataFrames:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
myvar = pd.DataFrame(data)
print(myvar)
您将在下一章节中学习到 DataFrames 的更多知识。