当前位置：首页>python>Python与财务自动化(二):处理多张发票与凭证生成

Python与财务自动化(二):处理多张发票与凭证生成

2026-06-28 05:19:19

在上一篇文章里，咱们聊了怎么用Python处理单张发票。今天继续往下走，重点说说怎么批量处理一堆发票，然后自动生成财务凭证。这是财务自动化里最实用的一个场景。

一、批量发票处理，整体怎么搭

处理多张发票，可不是简单地把“单张处理”重复跑一遍，而是需要一套完整的管理流程。一个成熟的批量处理系统，一般会有这么几个模块：

首先是文件收集模块。企业日常会产生大量纸质和电子发票，系统需要能够从不同渠道自动归集这些文件。可以使用Python的watchdog库监控指定文件夹，也可以对接邮件、电子票据平台的接口来拿文件。。

其次是智能识别模块。发票拿到手，得把里面的关键信息提取出来。这就得靠OCR（光学字符识别）技术了。常用的有百度AI、腾讯云OCR，或者开源的Tesseract。识别出来的数据，还得再校验一遍，比如发票代码、金额、税额这些字段对不对。

第三是数据整合模块。就是把识别出来的发票信息和业务系统里的数据对上号。比如把采购发票和采购订单做匹配，把销售发票和销售合同关联起来。这一步会遇到数据对不齐、有异常等情况，需要处理好。

最后是凭证生成模块。前面的步骤都搞定了，就根据提前设定好的会计规则，自动生成记账凭证。具体怎么生成，得看发票类型，比如是采购、销售还是退货，然后再确定借方、贷方科目和金额。

二、核心代码实现思路

接下来咱们看一下批量处理的核心代码结构。先定义一个发票的数据模型：

from dataclasses import dataclassfrom typing import Listfrom datetime import datetime@dataclassclass Invoice:    invoice_code: str      # 发票代码    invoice_no: str        # 发票号码    date: datetime         # 开票日期    amount: float          # 发票金额    tax: float             # 税额    supplier: str          # 供应商名称    invoice_type: str      # 发票类型

批量处理的主函数，需要加上异常处理和事务回滚的逻辑：

def batch_process_invoices(invoices: List[Invoice], rules: dict) -> list:    results = []    for invoice in invoices:        try:            validate_invoice(invoice)                 # 校验发票            account_code = match_account(invoice, rules) # 匹配会计科目            entries = generate_voucher_entries(invoice, account_code) # 生成凭证分录            results.append({'status': 'success', 'invoice_no': invoice.invoice_no, 'entries': entries})        except Exception as e:            results.append({'status': 'failed', 'invoice_no': invoice.invoice_no, 'error': str(e)})    return results