当前位置：首页>python>医院信息科程序猿:我用 Python 写了个 DRG 导入工具,10 分钟跑完以前半天的活

医院信息科程序猿:我用 Python 写了个 DRG 导入工具,10 分钟跑完以前半天的活

2026-06-23 22:01:52

每个月 DRG 数据分析最头疼的地方，不是算不出来，而是数据散在不同系统里：医保导出的 Excel 一份，HIS 里一份，病案首页一份，费用明细一份，门急诊关联费用又是一份。

以前靠人工查、人工补、人工导，效率低不说，还容易出错。于是信息科程序猿只能自己动手，写了一个小工具：读取 Excel，校验表头，多线程查询 HIS，自动补全字段，保存新 Excel，再批量导入 DRG 分析表。

一、这个工具解决了什么问题？

一句话：把 DRG 分析导入过程中最繁琐、最容易出错的人工补数流程自动化。

✅ 自动读取医保 Excel

✅ 校验列名，防止模板错乱

✅ 根据病案号查询 HIS 住院信息

✅ 自动补全院区、科室、费用分类、医生护士等字段

✅ 多线程并发查询，提升跑数速度

✅ 生成补全后的 Excel

✅ 自动备份原表，再批量入库

✅ 执行后续关联更新 SQL

二、为什么不用纯 SQL 一把梭？

理论上可以，现实中不一定优雅。

因为原始数据来自 Excel，字段顺序固定，部分指标来自医保结算表，部分指标来自 HIS 住院主表，部分指标来自费用明细，还有部分字段来自病案首页和手术记录。直接写一个超级 SQL，不仅维护困难，出错后也不好定位。

所以我采用了一个更适合信息科日常维护的方案：

Excel 负责承载原始导入数据，Python 负责调度与清洗，Oracle 负责提供业务数据，最终统一落到 DRG 分析表。

三、核心流程设计

第 1 步：读取 Excel 并校验表头

先把 Excel 读入 DataFrame，再对列名做严格校验。如果模板被改过，直接停止，避免脏数据入库。

第 2 步：根据病案号查询 HIS

通过病案号关联住院主表、费用表、病案首页、手术记录等数据，补齐院区、出院科室、实际住院天数、费用分类、医生护士等字段。

第 3 步：多线程并发处理

使用 ThreadPoolExecutor 开启多线程，同时配合 Oracle SessionPool，避免每条数据重复创建连接。

第 4 步：保存补全后的 Excel

跑完之后先落一份本地 Excel，方便业务科室复核，也方便出问题时回溯。

第 5 步：备份原表并批量入库

入库前自动创建备份表，再 executemany 分批插入，最后执行后续关联更新。

完整代码

drg_insert.py

五、这个工具最重要的不是“能跑”，而是“可控”

医院里的数据工具，最怕三件事：跑错、跑慢、跑完不知道哪里错。

所以这个脚本里专门做了这些控制：

① 表头校验，防止 Excel 模板变化

② 结算日期校验，防止一张表里混多个日期

③ 查询异常单行记录日志，不影响整体跑数

④ 每 10% 输出一次进度

⑤ 入库前自动备份原表

⑥ 出错自动 rollback，避免半截数据污染

六、真实场景里的优化点

这个工具已经能解决大部分导入问题，但如果数据量继续变大，还可以继续优化。

优化方向一：SQL 参数化

当前根据病案号拼 SQL，生产环境建议改成绑定变量，减少 SQL 注入风险，也方便 Oracle 复用执行计划。

优化方向二：减少重复子查询

费用分类可以先按 inpatient_no 聚合，再 join 主表，避免每个字段都重复扫描费用明细。

优化方向三：失败记录单独落库

未查到 HIS 记录、SQL 异常、字段转换失败的数据，可以单独保存，方便补跑。

优化方向四：做成可视化小工具

后续可以封装成一个简单页面或桌面程序，让业务人员自己上传 Excel、查看进度、下载结果。

七、信息科程序猿的感受

很多时候，医院信息科写的并不是“高大上系统”，而是一个又一个解决实际问题的小工具。

它们可能没有漂亮的界面，也没有复杂的架构，但它们能让同事少加班，让数据少出错，让业务流程更顺一点。

这类工具的价值，不在于代码有多炫，而在于它真正跑在医院业务现场，解决了真实问题。

写在最后

DRG 数据分析不是简单导个表，背后牵涉 HIS、医保、病案、费用、科室、人员、手术、耗材等多个系统的数据质量。

对医院信息科来说，真正有用的工具，一定是稳定、可追踪、可回滚、可复核的。

🔥 往期热门文章

1、医院信息科程序猿：我是怎么把一条慢 SQL 查明白的

2、电子病历字段全是乱码？我一拆发现：竟然是 ODT 套娃！

3、门诊患者查询接口怎么写？我在开源 SpringBoot 框架里这样做

4、HIS上报系统总出Bug？信息科程序猿一段脚本把数据上报救回来了

👨‍💻 信息科程序猿日常

HIS开发 | 医保接口 | Oracle | 踩坑记录 | 效率工具

👉 关注我，持续分享医院信息科一线实战经验

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

医院信息科程序猿:我用 Python 写了个 DRG 导入工具,10 分钟跑完以前半天的活

最新文章

热门文章

随机文章

医院信息科程序猿:我用 Python 写了个 DRG 导入工具,10 分钟跑完以前半天的活

Python零基础入门(一):环境搭建、初体验与数据类型

Python 零基础100天—Day30 datetime 模块

最新文章

热门文章

随机文章