当然如果需要系统地学习还是应该看官方文档入手。
以行为单位进行dataframe的遍历
一张图中绘制多张图(matplotlib)
调整heatmap中的颜色等参數
dataframe中更改某列的数据类型
返回一个布尔值可以利用该函数进行数据的筛选
# label非nan的为训练集, 为nan的划分为测试集
StratifiedKFold可以根据label的比例对数据进行劃分 在遇到分类问题时常用
argmax()函数主要找到numpy数组中最大值的索引值。具体可以见下面这个博客讲的非常详细。
keep:三个参数 first, last, False 分别代表保留第一次出现行,删除其余行;只保留最后一个重复项;删除所有重复项
inplace:如果为true则在原本数据上进行去重操作并返回None
注:执行去重操莋后,index不会变化所以有必要使用reset_index()重置index
# 使用groupby后可以结合agg对数据进行多个函数的计算
# 也可以对不同列进行不同的函数计算
为什么还有人推荐阿花花酱戾氣这么重的博主也是第一次见。微博上就是有人说一句衣服卖的贵就激动的不行果断取关了。