第一次入手panda组合,不知道效果怎么样

总结一些panda组合s等常用库使用的技巧方便日后使用

当然如果需要系统地学习还是应该看官方文档入手。

以行为单位进行dataframe的遍历

 

一张图中绘制多张图(matplotlib)

 
 

调整heatmap中的颜色等参數

 

dataframe中更改某列的数据类型

 
 

返回一个布尔值可以利用该函数进行数据的筛选

# label非nan的为训练集, 为nan的划分为测试集
 

StratifiedKFold可以根据label的比例对数据进行劃分 在遇到分类问题时常用

argmax()函数主要找到numpy数组中最大值的索引值。具体可以见下面这个博客讲的非常详细。

keep:三个参数 first, last, False 分别代表保留第一次出现行,删除其余行;只保留最后一个重复项;删除所有重复项

inplace:如果为true则在原本数据上进行去重操作并返回None

注:执行去重操莋后,index不会变化所以有必要使用reset_index()重置index

# 使用groupby后可以结合agg对数据进行多个函数的计算
# 也可以对不同列进行不同的函数计算
 

为什么还有人推荐阿花花酱戾氣这么重的博主也是第一次见。微博上就是有人说一句衣服卖的贵就激动的不行果断取关了。

我要回帖

更多关于 panda组合 的文章

 

随机推荐