Excel有数据透视,Pandas的数据透视功能是怎样的呢,之前已经写过一篇python对不规则表进行透视,下面借一个例子详细介绍使用Pandas进行数据透视。
如下图,每月对操作人的工艺类型进行计数,数据有10485条,如果是正常的数据用Excel数据透视即可:

但是每月存在有‘配件条码’和‘工艺类型’这两个条件重复的值:

直接数据透视可能会造成多统计的情况,需要先去重,可以使用Pandas的drop_duplicates函数,表达式为:drop_duplicates(subset=['月份','配件条码', '工艺类型'], keep='first'),即对'月份','配件条码', '工艺类型'这三个条件同时重复的数据去重,并保留第一个。
去重后直接对数据进行透视(行数据为‘月份’,‘操作人’,列数据为‘工艺类型’):pd.crosstab(index=[df_unique["月份"], df_unique["操作人"]],
columns=df_unique["工艺类型"],margins=True,margins_name="总计")
完整的代码如下:

