Pandas DataFrame 完整方法与属性
DataFrame 对象的所有属性和方法,以及解释和示例:
属性/方法 | 描述 |
---|---|
abs() | 返回带有每个值的绝对值的 DataFrame |
add() | 使用指定的值添加 DataFrame 的值 |
addprefix() | 为所有标签添加前缀 |
addsuffix() | 为所有标签添加后缀 |
agg() | 将函数或函数名应用于 DataFrame 的一个轴 |
aggregate() | 将函数或函数名应用于 DataFrame 的一个轴 |
align() | 用指定的连接方法将两个 DataFrame 对齐 |
all() | 如果 DataFrame 中的所有值均为 True,则返回 True,否则返回 False |
any() | 如果DataFrame中的任何值为 True,则返回 True,否则返回 False |
append() | 追加新列 |
applymap() | 为 DataFrame 中的每个元素执行一个函数 |
apply() | 将函数应用于 DataFrame 的一个轴 |
assign() | 指定新列 |
astype() | 将 DataFrame 转换为指定的数据类型 |
at | 获取或设置具有指定标签的项的值 |
axes | 返回 DataFrame 的行和列的标签 |
bfill() | 将空值替换为下一行的值 |
bool() | 返回 DataFrame 的布尔值 |
columns | 返回 DataFrame 的列标签 |
combine() | 比较两个 DataFrame 中的值,让函数决定保留哪些值 |
combine_first() | 比较两个 DataFrame,如果第一个 DataFrame 有一个空值,它将被第二个 DataFrame 的相应值填充 |
compare() | 比较两个 DataFrame 并返回差异 |
convert_dtypes() | 将 DataFrame 中的列转换为新的数据类型 |
corr() | 查找每列之间的相关性(关系) |
count() | 返回每列/每行的非空值数量 |
cov() | 查找列的协方差 |
copy() | 返回 DataFrame 的副本 |
cummax() | 计算 DataFram 的累积最大值 |
cummin() | 计算 DataFrame 的累积最小值 |
cumprod() | 计算 DataFrame 上的累积乘积 |
cumsum() | 计算 DataFrame 上的累积和 |
describe() | 返回 DataFrame 中每列的描述摘要 |
diff() | 计算值与上一行中相同列的值之间的差值 |
div() | 将 DataFrame 的值除以指定的值 |
dot() | 将 DataFrame 的值与另一个类似数组的对象的值相乘,然后添加结果 |
drop() | 从 DataFrame 中删除指定的行/列 |
drop_duplicates() | 从 DataFrame 中删除重复值 |
droplevel() | 删除指定的索引/列 |
dropna() | 删除包含空值的所有行 |
dtypes | 返回 DataFrame 列的数据类型 |
duplicated() | 对于重复的行返回 True,否则返回 False |
empty | 如果 DataFrame 为空,则返回 True,否则返回 False |
eq() | 对于等于指定值的值,返回True,否则返回False |
equals() | 如果两个 DataFrame 相等,则返回 True,否则返回 False |
eval() | 计算指定字符串的值 |
explode() | 将每个元素转换为一行 |
ffill() | 将空值替换为上一行中的值 |
fillna() | 用指定的值替换空值 |
filter() | 根据指定的筛选器筛选 DataFrame |
first() | 返回指定日期选择的第一行 |
floordiv() | 将 DataFrame 的值与指定的值相除,然后计算值 |
ge() | 对于大于或等于指定值的值,返回 True,否则返回 False |
get() | 返回指定键的项 |
groupby() | 将行/列分组到指定的组中 |
gt() | 对于大于指定值的值,返回 True,否则返回 False |
head() | 返回标题行和前 10 行,或指定的行数 |
iat | 在指定位置获取或设置项的值 |
idxmax() | 返回指定轴上最大值的标签 |
idxmin() | 返回指定轴上最小值的标签 |
iloc | 在指定位置获取或设置一组元素的值 |
index | 返回 DataFrame 的行标签 |
infer_objects() | 更改 DataFrame 中列的数据类型 |
info() | 打印有关 DataFrame 的信息 |
insert() | 在 DataFrame 中插入一列 |
interpolate() | 使用插值方法替换非数字值 |
isin() | 如果 DataFrame 中的每个元素都在指定值中,则返回 True |
isna() | 查找非数字值 |
isnull() | 查找空值 |
items() | |
iteritems() | 迭代 DataFrame 的列 |
iterrows() | 迭代 DataFrame 的行 |
itertuples() | 以命名元组的形式迭代行 |
join() | 连接另一个 DataFrame 的列 |
last() | 返回指定日期选择的最后一行 |
le() | 对于小于或等于指定值的值,返回 True,否则返回 False |
loc | 获取或设置使用标签指定的一组元素的值 |
lt() | 对于小于指定值的值,返回 True,否则返回 False |
keys() | 返回信息轴的键 |
kurtosis() | 返回指定轴中值的峰度 |
mask() | 替换指定条件为真的所有值 |
max() | 返回指定轴上的最大值 |
mean() | 返回指定轴上值的平均值 |
median() | 返回指定轴上值的中值 |
melt() | 将 DataFrame 从宽表重塑为长表格 |
memory_usage() | 返回每列的内存使用情况 |
merge() | 合并DataFrame对象 |
min() | 返回指定轴中值的最小值 |
mod() | 模块(查找剩余部分)DataFrame的值 |
mode() | 返回指定轴中值的模式 |
mul() | 将 DataFrame 的值与指定值相乘 |
ndim | 返回 DataFrame 的维度数 |
ne() | 对于不等于指定值的值,返回 True,否则返回 False |
nlargest() | 按指定的列、降序对DataFrame进行排序,并返回指定的行数 |
notna() | 查找非数字的值 |
notnull() | 查找不为 NULL 的值 |
nsmallest() | 按指定的列对 DataFrame 进行升序排序,并返回指定的行数 |
nunique() | 返回指定轴中唯一值的数目 |
pct_change() | 返回上一个值与当前值之间的百分比变化 |
pipe() | 将函数应用于 DataFrame |
pivot() | 重塑 DataFrame |
pivot_table() | 将电子表格数据创建为 |
isin() | 如果 DataFrame 中的每个元素都在指定值中,则返回True |
isna() | 查找非数字值 |
isnull() | 查找空值 |
items() | 迭代 DataFrame 的列 |
iteritems() | 迭代 DataFrame 的列 |
iterrows() | 迭代 DataFrame 的行 |
itertuples() | 以命名元组的形式迭代行 |
join() | 连接另一个 DataFrame 的列 |
last() | 返回指定日期选择的最后一行 |
le() | 对于小于或等于指定值的值,返回 True,否则返回 False |
loc | 获取或设置使用标签指定的一组元素的值 |
lt() | 对于小于指定值的值,返回True,否则返回 False |
keys() | 返回信息轴的键 |
kurtosis() | 返回指定轴中值的峰度 |
mask() | 替换指定条件为真的所有值 |
max() | 返回指定轴上的最大值 |
mean() | 返回指定轴上值的平均值 |
median() | 返回指定轴上值的中值 |
melt() | 将 DataFrame 从宽表重塑为长表格 |
memory_usage() | 返回每列的内存使用情况 |
merge() | 合并DataFrame对象 |
min() | 返回指定轴中值的最小值 |
mod() | 模块(查找剩余部分)DataFrame的值 |
mode() | 返回指定轴中值的模式 |
mul() | 将 DataFrame 的值与指定值相乘 |
ndim | 返回 DataFrame 的维度数 |
ne() | 对于不等于指定值的值,返回 True,否则返回 False |
nlargest() | 按指定的列、降序对DataFrame进行排序,并返回指定的行数 |
notna() | 查找非数字的值 |
notnull() | 查找不为 NULL 的值 |
nsmallest() | 按指定的列对 DataFrame 进行升序排序,并返回指定的行数 |
nunique() | 返回指定轴中唯一值的数目 |
pct_change() | 返回上一个值与当前值之间的百分比变化 |
pipe() | 将函数应用于 DataFrame |
pivot() | 重塑 DataFrame |
pivot_table() | 将电子表格数据创建为 DataFrame |
pop() | 从 DataFrame 中删除元素 |
pow() | 将一个 DataFrame 的值加上另一个 DataFrame 的值 |
prod() | 返回指定轴上所有值的乘积 |
product() | 返回指定轴上的值的乘积 |
quantile() | 返回指定轴的指定分位数处的值 |
query() | 查询 DataFrame |
radd() | 反向将一个 DataFrame 的值与另一个 DataFrame 的值相加 |
rdiv() | 反向将一个 DataFrame 的值与另一个 DataFrame 的值相除 |
reindex() | 更改 DataFrame 的标签 |
reindex_like() | ?? |
rename() | 更改轴的标签 |
rename_axis() | 更改轴的名称 |
reorder_levels() | 重新排列索引级别 |
replace() | 替换指定的值 |
reset_index() | Reset the index |
rfloordiv() | 反向将一个 DataFrame 的值与另一个 DataFrame 的值相除 |
rmod() | 反向模块将一个 DataFrame 的值转换为另一个 DataFrame 的值 |
rmul() | 反向将一个 DataFrame 的值与另一个 DataFrame 的值相乘 |
round() | 返回一个 DataFrame,其中所有值均舍入为指定格式 |
rpow() | 反向将一个 DataFrame 的值提升到另一个 DataFrame 的值 |
rsub() | 反向将一个 DataFrame 的值减去另一个 DataFrame 的值 |
rtruediv() | 反向将一个 DataFrame 的值与另一个 DataFrame 的值相除 |
sample() | 返回一个随机选择元素 |
sem() | 返回指定轴上平均值的标准误差 |
select_dtypes() | 返回包含选定数据类型列的 DataFrame |
shape | 返回 DataFrame 的行数和列数 |
set_axis() | 设置指定轴的索引 |
set_flags() | 返回具有指定标志的 DataFrame 帧 |
set_index() | 设置 DataFrame 的索引 |
size | 返回 DataFrame 中的元素数 |
skew() | 返回指定轴中值的倾斜 |
sort_index() | 根据标签对 DataFrame 进行排序 |
sort_values() | 根据值对 DataFrame 进行排序 |
squeeze() | 将单列 DataFrame 转换为 Series |
stack() | 将DataFrame从宽表重塑为长表格 |
std() | 返回指定轴中值的标准偏差 |
sum() | 返回指定轴上的值之和 |
sub() | 用指定值减去DataFrame的值 |
swaplevel() | 交换两个指定的级别 |
T | 将行转换为列,将列转换为行 |
tail() | 返回标题和最后的行 |
take() | 返回指定元素 |
to_xarray() | 返回一个 xarray 对象 |
transform() | 为 DataFrame 中的每个值执行一个函数 |
transpose() | 将行转换为列,将列转换为行 |
truediv() | 将 DataFrame 的值除以指定的值 |
truncate() | 删除指定值集之外的元素 |
update() | 使用另一个 DataFrame 中的值更新一个 DataFrame |
value_counts() | 返回唯一行数 |
values | 以 NumPy 数组的形式返回 DataFrame |
var() | 返回指定轴中值的方差 |
where() | 替换指定条件为 False 的所有值 |
xs() | 返回 DataFrame 的横截面 |
__iter() | 返回信息轴的迭代 |