本文约3300字,这两天都在给内存砍掉一半的产品优化OTA升级流程,因为当内存很充足时,程序是怎么方便怎么来,现在内存极度紧张,必须要极致的去减少OTA升级中对内存的消耗才能保证升级过程无忧。本文结合项目中优化内存占用用到的方法和AI搜索查询到的一起整理出来,以供后续参考使用。
关注公众号, 即可获得与Linux相关的电子书籍以及常用开发工具,文末有文档清单。
适用场景:消费类IoT、摄像头、机顶盒、手环、智能面板等
内存容量:
RAM:128M以内
核心思路:流式处理 · 零拷贝 · 分块按需加载 · 内存复用 · 临时存储最小化 · 降级缓存
覆盖链路:升级包下载 → 校验 → 解压 → 写入 → 回滚
分块流式读取:不把整包加载进RAM。TCP/HTTP下载回调每次只收4KB/8KB小块缓冲区,仅用一块固定内存循环复用,绝不分配整块大Buffer存完整升级包。
头部就地解析,零拷贝剥离包头:升级包结构通常为校验头(签名/版本/长度) + 压缩固件镜像。下载前N字节包头时,直接在接收Buffer内原地解析版本、Hash、固件长度,不单独malloc内存复制包头;解析完成后Buffer游标偏移包头长度,后续收到的数据直接作为裸固件流,无需另存去头文件。
避免本地完整缓存:禁用"下载完再处理"模式,全程采用管道式:
网络流 → 校验流 → 解压流 → Flash写入流中间不落地完整升级包。
setsockopt设置SO_RCVBUF为4k/8k,关闭TCP大包预缓存CURLOPT_STREAM_WEIGHT流式回调,不启用curl内部文件缓存HTTPS TLS内存优化:mbedtls裁剪证书、关闭预分配大握手Buffer,采用分段TLS解密,不解密完整包再处理。
网络断连重试时,不缓存已下载的全部数据:
SHA256/MD5 不要一次性传入完整文件Buffer:
hash_update,实时迭代计算hash_final.rodata),不在堆上动态分配,节省堆内存解析包头用的接收Buffer,解析完直接复用给固件Hash计算,不释放再新建,实现内存原地覆盖。
消费级OTA常用gzip/zstd/lzma,解压是最容易爆内存的环节。
优先级:zstd流式单块 < gzip < lzma/xz
自定义解压内存分配器,固定分配两块固定大小静态Buffer(全局数组,放BSS段,不占堆),不允许解压库内部malloc大内存。
若固件极大,可采用双层压缩拆分:外层轻量gzip升级包 + 内部分区独立小镜像,逐个解压写入。
❌ 反面流程:网络 → 存/tmp/ota.bin → 读取解压 → 写入mtd
✅ 优化管道:网络流 → 校验 → 解压输出 → 直接mtd块写入
全程无中间临时大文件,省去Flash占用 + 文件读写双重内存开销。
Flash擦写按块(64k/128k)操作,只用一块等于Flash块大小的静态Buffer:
❌ 传统方案:升级前备份旧系统到备份分区,极度浪费空间
✅ 优化降级回滚方案(A/B双分区但不完整备份):
💡 极端无A/B情况下,可采用单分区增量差分升级。
完整整包OTA下载、解压、校验内存开销巨大,差分是小内存设备最优方案:生成bsdiff/zstd-delta差分补丁包,补丁体积远小于完整固件。
流式差分打补丁:
⚠️ 注意:bsdiff原版内存高,应改用mini-bsdiff、delta-stream等支持流式处理的工具,无整块内存分配。
把所有环节共用缓冲区定义为全局静态数组(.bss,进程启动一次性分配,不走堆):
// 一块8k内存复用:下载接收、包头解析、hash输入、解压输入、Flash写入staticuint8_t ota_buf[8192];所有流程串行使用同一块内存,用完覆盖,不重复申请释放大块堆内存,避免内存碎片。
禁止并行:下载 + 解压 + 校验同时跑
必须采用串行流水线:
下载一小块 → 校验一小块 → 解压一小块 → 写入Flash同一时刻仅一套处理内存活跃,峰值内存大幅下降。
stdio FILE缓存,改用open/read/write系统调用,禁用fopen大缓冲区挂载rootfs/临时分区时添加挂载参数:
# squashfs只读挂载,关闭缓存mount -t squashfs /dev/mtdblockx /tmp -o ro,nocache# UBI同步写入,最小缓存mount -o sync,min_cache_size=4096 /dev/ubiX_0 /systemsync:每次写入强制刷Flash,减少内核页缓存占用nocache:关闭文件预读缓存tmp临时目录用tmpfs极小尺寸:
mount -t tmpfs tmpfs /tmp -o size=8M限制临时文件最大占用内存。
降级功能裁剪:升级过程临时卸载后台服务、关闭摄像头/音频等占用大内存的进程,升级完成重启恢复,释放几MB空闲RAM
分阶段写入分区:系统拆成kernel、rootfs、app三个独立升级镜像,逐个下载、校验、刷写,处理完一个释放所有临时内存再处理下一个,峰值内存降低2/3
原地覆盖增量升级(无A/B分区):仅更新变更文件,流式覆盖原有分区,无需双分区存储,Flash和内存双重节省,适合Flash极小设备
| 优先级 | 优化策略 |
① | 全链路流式管道处理,不缓存完整升级包,就地剥离包头零拷贝
② | 流式Hash/签名校验,不分块预加载整包
③ | zstd低内存流式解压,固定单块静态Buffer复用
④ | 差分Delta升级,大幅减小包体积,降低所有环节内存峰值
⑤ | 串行执行下载-校验-解压-写入,同一时间只占用一套处理内存
⑥ | 直接写入Flash,不落地临时完整固件文件
⑦ | 静态全局缓冲区复用,减少堆分配与内存碎片
⑧ | 轻量化A/B分区,校验失败直接丢弃新分区,不备份旧镜像
⑨ | 挂载参数关闭文件系统内核缓存,限制tmpfs大小
⑩ | 升级时临时关停后台高内存业务进程
📝 本文档适用于RAM和Flash都比较小的嵌入式产品OTA升级场景,全套方案以"流式+零拷贝+复用"为核心思想,可显著降低升级过程中的内存与存储峰值占用。
往期文章(欢迎订阅技术分享栏目全部文章):

这里是女程序员的笔记本
15年+嵌入式软件工程师兼二胎宝妈
分享读书心得、工作经验,自我成长和生活方式。
希望我的文字能对你有所帮助