当前位置：首页>python>工程量对账对不上?不要着急,Python帮你0.5秒轻松搞定,告别熬夜加班扒表格

工程量对账对不上?不要着急,Python帮你0.5秒轻松搞定,告别熬夜加班扒表格

2026-07-02 00:37:44

月末核对工程量，面对着几十张分表和一张汇总表，看着密密麻麻的数字，翻来覆去鼓捣了半天，眼睛都看花了，算了一遍又一遍，可就是对不上，哪个单位、哪笔数据有错，问题到底出在哪，一点头绪也没有。

最近就收到了网友的一个问题：他在对账时，当月的工作量和各单位上报的分表数据工作量始终对不上。31个单位上报的分表金额合计为987425元，总表的总金额合计986325元，两者相差了1100元，手工核对了大半天也没有找出来，反复算了好几遍就是不知道问题出在了哪，问我有没有好的办法。

这种分表与总表对不上账的难题，我之前也遇到过好几次，每次都要翻来覆去折腾半天，或者一个小数点、一个加减号，或者某处多了或少了一个数字，真有点大海捞针、雾里看花的感觉。说白了，大致有几个老大难的问题：

首先是表格太多。Excel表格里除了汇总表，还有几十张各单位的分表，光打开切换就得费不少时间；

其次是数据格式乱七八糟：有的有单位（比如28台），有的没有单位（如28）。总表的日期列还是个合并单元格，无法直接求和；

最令人头疼还是无法快速直接定位问题。逐行比对计算易遗漏，出错后难以快速定位问题表格，越弄越乱，越乱越容易疲劳、出错。

靠人工硬扛死磕肯定不是办法，我曾经也想过，有没有自动化处理的方法，今天就依此为例，把Python自动化解决方案分享给大家，让你避开那些踩过的坑。

先上完整代码：

import pandas as pdimport reimport timedef extract_num(txt, is_TF=False):    txt=str(txt)    if is_TF:        pattern=r"-?\d+(\.\d+)?"    else:        pattern=r"-?\d+"    if match := re.search(pattern,txt):        if is_TF:            return float(match.group(0))        else:            return int(match.group(0))      return 0.0 if is_TF else 0def re_danwei(txt):    txt=str(txt)    t_list=[]    for t in txt.split("\n"):        if match:=re.search(r"在(.*(社区|村))|[\(（](.*(社区|村))", t):            if "在" in t:                word=match.group(1)            else:                word=match.group(3)            t_list.append(word)    return "\n".join(t_list)s_t=time.time()input_path=r'E:\机械汇总2025-10.09-2025-10.31.xlsx'output_path=r'E:\机械汇总_差异.xlsx'dfs=pd.read_excel(input_path, sheet_name=None, header=1)# 分表处理data=[]for name, df in dfs.items():    if name !="汇总":        df_fen= df.dropna(subset="机型类型/工人").copy()        df_fen["日期"]=df_fen["日期"].ffill()        df_fen["日期"]=pd.to_datetime(df_fen["日期"], errors='coerce').dt.date        df_fen["数量"]=df_fen["数量"].apply(extract_num)        df_fen["金额"]=df_fen["金额"].apply(extract_num, is_TF=True)        df_fen["工作表"]=name        data.append(df_fen)df_f= pd.concat(data, ignore_index=True)df_pivot=pd.pivot_table(df_f,                        index=["日期", "机型类型/工人"],                        values=["数量", "金额", "工作表"],                        aggfunc={"数量": "sum", "金额": "sum", "工作表": lambda x: "\n".join(x)},                        fill_value=0).reset_index()# 总表处理df_z=dfs["汇总"].dropna(subset="机型类型/工人").copy()df_z["日期"]=df_z["日期"].ffill()df_z["日期"]=pd.to_datetime(df_z["日期"], errors='coerce').dt.datedf_z["数量"]=df_z["数量"].apply(extract_num)df_z["金额"]=df_z["金额"].apply(extract_num, is_TF=True)df_z["备注"]=df_z["备注"].apply(re_danwei)# 合并找差df_mer =pd.merge(df_z,df_pivot,on=["日期", "机型类型/工人"],how="outer",suffixes=("_汇总", "_分表"))df_mer["金额差异"]= df_mer["金额_汇总"]-df_mer["金额_分表"]df_mer =df_merged[df_mer["金额差异"] != 0]df_mer.to_excel(output_path, index=False)print(f"共发现 {len(df_mer)} 行差异,用时{time.time()-s_t:.3f}秒")print(f"汇总表金额：{df_z["金额"].sum()}元")print(f"分表总金额：{df_pivot["金额"].sum()}元")print(f"两表差异额：{df_mer["金额差异"].sum()}元")print(f"差异数据已保存至：{output_path}")