当前位置：首页>java>大师级C/C++代码赏析:ZLMediaKit多线程非阻塞网络模型的“静”与“动”

大师级C/C++代码赏析:ZLMediaKit多线程非阻塞网络模型的“静”与“动”

2026-02-05 00:53:10

AI时代，基础很重要。

只有基础扎实，才能驾驭AI这个强大的工具。

向大师学习，是夯实基础、精进技术的最好方式之一。

很多人第一次看 ZLMediaKit 的代码，会有一种“看不太懂，但很高级”的感觉。这种感觉并不是因为代码写得晦涩，而是用看似“多绕了一层”的设计实现了“在复杂中，保持秩序”。

前言

我第一次接触ZLMedia是在六、七年前参与开发一款人脸识别门禁产品，那时还没疫情，人脸识别门禁也不算火爆。当时加入这个开发团队我有很多不适应，因为那时我还是一个传统意义上的嵌入式linux应用开发：开发语言主要是C，少量C++;开发IDE是sourceinsight, 观察前端打印大多是通过串口。而这个人脸识别门禁的开发是基于ZLMedia框架，开发团队使用的语言是纯C++, 开发IDE是vs code, 观察日志打印也没有串口而是日志文件。尤其是这个ZLMedia框架代码，对于当时的我来说，确实很晦涩。为了补齐现代C++语言的短板，那一两年看了两部大部头书，一本是原版的《c++ primer》,一本是Marc Gregoire的《prefessional c++》，两本都是上千页，都看了两遍以上。

一边看书，一边看ZLMedia的源码，确实受益匪浅。如今我也被同化成了基本只写C++, 用vs code的AI应用开发。虽然那个项目之后没有再基于ZLM做开发，但平时写代码的很多小习惯都是当年向ZLMdedia学的，比如也喜欢用Ptr，函数入口处常用RAII小组件，函数内的逻辑代码块封装成lambda。很为大陆有这样的大佬存在而高兴。

一、ZLMediaKit的架构设计：从第一性原理出发的网络模型选择

1.1 传统的多线程阻塞模型的不足

传统的一个连接占用一个线程的模型（Thread-per-Connection）在应对高频并发连接时会面临诸多严峻挑战：

• 线程上下文切换开销呈指数增长
• 内存消耗巨大（每个线程栈通常需要1-2MB）
• 系统调用频繁，效率低下

传统的多线程阻塞模型不适用I/O密集型的流媒体服务，不能很好地应对流媒体服务的工程难题。

1.2 流媒体服务器的工程化难题

在一个流媒体服务器中，会同时存在：

• 大量长连接（RTSP / WebRTC / HTTP-FLV）
• 高频数据流（音视频帧）
• 复杂生命周期（鉴权、断线、重连、超时、关闭）

所以真正难的不是“如何监听 socket”，而是：

1. 线程之间如何协作
2. 对象什么时候创建、什么时候销毁
3. 谁拥有谁，谁依赖谁

如果这三点处理不好，epoll 写得再漂亮，也一定会恶化演变成：

• 难以定位的偶现崩溃
• 不可复现的死锁
• 无法扩展的新需求

所以ZLMediaKit 的多线程模型，本质上是一个复杂度隔离系统。

1.3 核心设计原则

原则1：让I/O线程专注于I/OI/O线程只做三件事：

• 接收数据就绪事件
• 执行非阻塞读写
• 将完整数据包传递给工作线程

原则2：计算与I/O分离

• 解码、转码、协议解析等CPU密集型任务
• 必须与网络I/O在逻辑和物理上分离

原则3：无锁或最小化锁的设计

• 线程间通信优先选择无锁队列
• 必须用锁时，确保锁粒度极小

二、架构全景：四层线程模型

2.1 线程层次划分的艺术

ZLMediaKit的多线程模型可以抽象为四个逻辑层次：

┌─────────────────────────────────────────┐│  事件分发层 (EventDispatcher)           │ ← 使用epoll/kqueue/select│  (单线程或少量线程)                     │├─────────────────────────────────────────┤│  I/O工作层 (IOWorker)                   │ ← 执行实际非阻塞I/O│  (线程数=CPU核心数)                     │├─────────────────────────────────────────┤│  业务处理层 (WorkThread)                │ ← 处理协议、音视频帧│  (线程池，可配置大小)                   │├─────────────────────────────────────────┤│  定时任务层 (TimerThread)               │ ← 处理超时、心跳│  (专用线程)                             │└─────────────────────────────────────────┘

2.2 核心代码剖析：EventPoller的线程模型实现

// src/Network/Socket.h 中的关键抽象class EventPoller : public std::enable_shared_from_this<EventPoller> {public:    // 单例模式管理所有EventPoller实例static EventPollerPool& Instance();    // 每个EventPoller绑定一个系统线程void runLoop(bool blocked = true);private:    // 关键数据结构：事件循环    std::unique_ptr<EventLoop> _loop;    // 定时器管理    TimerManager _timer_manager;    // 异步任务队列（线程安全）    TaskExecutor _async_task_queue;    // 核心事件处理循环void handleEvents(int timeout_ms);};

每一个 EventPoller 对应一个系统线程，其内部运行着一个 epoll 或 select 循环。

// 伪代码展示其核心循环void EventPoller::runLoop(){    while (!_exited) {        int ret = epoll_wait(_epoll_fd, events, max_events, timeout);        for (int i = 0; i < ret; ++i) {            auto fd = events[i].data.fd;            // 触发 fd 绑定的回调函数            handleEvent(fd, events[i].events);        }        // 处理跨线程投递的任务        executePendedTasks();    }}

EventPoller同时承担了三个角色：

1. IO 事件循环（epoll）
2. 异步任务队列（runInLoop / async）
3. 对象生命周期的“安全区”

EventPoller的设计亮点：

1. 资源绑定：每个EventPoller实例固定绑定一个OS线程，避免线程切换开销
2. 职责单一：每个EventPoller只处理自己关心的事件集
3. 负载均衡：当一个新的 TcpServer 接收到连接请求时，它会调用 EventPollerPool::getPoller()通过哈希算法等策略分配到不同的EventPoller

2.3 一个重要但容易忽略的设计决策

在 ZLMediaKit 中，你会发现大量代码都遵循一个隐含规则：

对象只在所属 EventPoll 线程中被真正操作

这不是靠 mutex 实现的，而是靠：

• 把“可执行逻辑”投递给 EventPoll
• 用任务队列而不是直接跨线程调用

这背后是一个非常成熟的工程判断：

锁不是免费的，而“线程归属”是一种更高维度的同步方式。

三、模式应用

3.1 经典Reactor模式的变体实现

ZLMediaKit没有简单照搬Reactor模式，而是根据流媒体特性进行了深度优化：

// 简化的主Reactor实现逻辑class MainReactor {public:void start(){        // 1. 创建监听socket        _acceptor = createAcceptor(port);        // 2. 注册到EventPoller        _poller->addEvent(_acceptor.fd(),                          Event_Read,                          [this](int event) {            this->onAccept();        });        // 3. 启动I/O工作线程池        _io_workers.start();    }private:void onAccept(){        // 非阻塞accept        while (auto conn = _acceptor.accept()) {            // 关键决策点：选择哪个I/O Worker？            auto worker = selectIOWorkerByHash(conn.fd());            // 将连接迁移到选中的I/O Worker线程            worker->addConnection(std::move(conn));        }    }};

3.2 多Reactor协作模式

ZLMediaKit采用了多Reactor多线程变体：

• MainReactor：单线程，只处理新连接建立
• SubReactor：多个，每个对应一个IOWorker线程
• WorkThread池：处理业务逻辑，与I/O完全解耦

这种设计的优势在于：

1. 连接建立不会阻塞已有连接处理
2. I/O操作均匀分布到多个CPU核心
3. 业务处理能力可线性扩展

3.3 共享从属模式：智能指针与弱引用（Shared_from_this）

在异步网络中，最怕的是“回调对象已销毁”。ZLM 大量使用了 std::enable_shared_from_this。

每当一个异步操作（如异步写入）被触发时，Lambda 闭包会捕获一个 weak_ptr 或 shared_ptr。这保证了在事件触发时，对象依然有效；或者在对象销毁后，回调能自动跳过逻辑，优雅地解决了多线程下的生命周期管理难题。

3.4 抽象与多态：Session 对象的生命周期

ZLM 将具体的协议处理抽象为 Session。

• TcpServer 负责监听和产生 Socket 对象。
• Socket 对象被分配到某个 EventPoller。
• EventPoller 触发事件后，通过 Socket 调用绑定的 Session 的 onRecv。

这种层层递进的抽象，使得 ZLM 能够同时支持 RTSP、RTMP、HTTP、WebSocket 而不显得臃肿。

四、无锁编程：线程间通信

4.1 ZLMediaKit 的线程角色划分

典型配置中，ZLMediaKit 会存在：

• IO EventPoll 线程池
• 工作线程池
• 定时器线程

但它们的职责边界非常清楚：

线程类型	只做什么	坚决不做什么
IO线程	网络事件、调度	重计算、阻塞操作
工作线程	业务处理	操作 socket
定时线程	时间驱动	业务逻辑

4.2 生产者-消费者模式的现代化实现

// 线程间任务传递的无锁队列实现（简化版）template<typename T>class LockFreeTaskQueue {public:    // 多生产者单消费者场景优化bool push(T&& task, bool front = false){        // 使用内存序relaxed减少同步开销        auto tail = _tail.load(std::memory_order_relaxed);        // 无锁CAS操作        while (!_tail.compare_exchange_weak(            tail,             tail + 1,            std::memory_order_acq_rel,            std::memory_order_relaxed)) {            // 忙等但无系统调用开销        }        // 写入任务数据        _buffer[tail % CAPACITY] = std::move(task);        return true;    }private:    // 环形缓冲区    std::array<T, CAPACITY> _buffer;    // 原子计数器    std::atomic<uint64_t> _head{0};    std::atomic<uint64_t> _tail{0};};

4.3 数据所有权的高效转移

在ZLMediaKit中，数据包在线程间的传递采用了移动语义+智能指针的组合：

// 数据包在线程间传递的典型模式class Packet {public:    using Ptr = std::shared_ptr<Packet>;    // 关键：确保数据只在一个线程中被处理void processOn(ThreadPool& pool){        auto self = shared_from_this();        // 将任务提交到指定线程池        pool.async([self]() {            // 此时数据包的所有权已经转移            self->doProcess();        });        // 当前线程不再访问self    }};

五、性能优化：从毫秒到微秒的极致追求

5.1 内存池的定制化实现

流媒体服务器频繁分配/释放内存，ZLMediaKit实现了专用的内存池：

class MediaBufferPool {public:    // 针对不同大小的音视频帧优化static char* obtain(size_t size){        if (size <= SMALL_BLOCK) {            return SmallBlockPool::instance().alloc();        } else if (size <= MEDIUM_BLOCK) {            return MediumBlockPool::instance().alloc();        } else {            // 大块内存直接使用系统分配            return new char[size];        }    }    // 内存对齐优化（CPU缓存友好）static constexpr size_t align_size(size_t size){        const size_t alignment = 64; // 缓存行大小        return (size + alignment - 1) & ~(alignment - 1);    }};

5.2 零拷贝优化技术

在关键路径上，ZLMediaKit大量使用零拷贝技术：

1. 写时复制(CoW)：协议解析时避免内存复制
2. 内存映射：文件发送时使用sendfile系统调用
3. 缓冲区共享：多个会话间共享解码后的视频帧

六、可复用模式提炼：从ZLMediaKit学到的工程实践

6.1 模式一：分层线程模型

// 可复用的分层线程架构模板template<typename IOHandler, typename Worker>class LayeredThreadModel {public:void setup(size_t io_threads = std::thread::hardware_concurrency(),               size_t worker_threads = 4){        // 1. 创建I/O层        for (size_t i = 0; i < io_threads; ++i) {            _io_pool.emplace_back([this] {                EventLoop loop;                IOHandler handler;                loop.run(&handler);            });        }        // 2. 创建工作层        _worker_pool.resize(worker_threads);    }    // 连接分发策略void dispatchConnection(Connection conn){        // 一致性哈希确保同一连接的I/O在同一线程        size_t idx = hash(conn.id()) % _io_pool.size();        _io_pool[idx].post([conn]() mutable {            conn.handleIO();        });    }};

6.2 模式二：基于事件的任务调度

// 通用的事件驱动任务调度器class EventDrivenScheduler {public:template<typename F>    void scheduleOnEvent(int fd, EventType type, F&& func){        // 注册事件回调        _poller->addEvent(fd, type, [func = std::forward<F>(func)]() {            // 事件触发时在I/O线程执行            func();            // 如果需要CPU计算，转移到工作线程            if (needsComputation()) {                WorkerPool::instance().submit(std::move(func));            }        });    }};

七、工程决策：为什么这样设计？

7.1 权衡的艺术

1. 线程数选择：为什么I/O线程数等于CPU核心数？

• 超过核心数会增加上下文切换开销
• 现代网卡支持多队列，可与CPU核心绑定

2. 缓冲区大小：为什么是64KB而不是更大？

• 考虑CPU缓存命中率（L2 Cache通常256KB-1MB）
• 平衡延迟与吞吐量

3. 超时设置：为什么心跳间隔是10秒？

• 兼顾连接保活与服务器压力
• 符合大多数NAT会话超时时间

7.2 适应性的设计

ZLMediaKit的架构体现了优秀的适应性：

• 可插拔的事件循环：支持epoll、kqueue、select
• 可扩展的协议支持：RTSP、RTMP、HLS、WebRTC统一处理
• 可配置的线程模型：根据部署环境调整

结语

通过剖析ZLMediaKit的多线程非阻塞网络模型，我们看到的不仅是一套高效的代码实现，更是一种严谨的工程思维：

1. 从问题本质出发：理解流媒体服务的核心是I/O密集而非计算密集
2. 平衡的艺术：在简单与复杂、性能与可维护性之间找到最佳平衡点
3. 模式但不模式化：灵活运用设计模式而不被其束缚
4. 数据驱动优化：每个性能决策都有profiling数据支持

ZLMediaKit的代码也告诉我们：大师级的代码不在于用了多么玄学的语法，而在于对“资源控制”和“逻辑解耦”的深刻理解。它通过 EventPoller 锁定了运行环境，通过 Socket 抽象了通信底座，通过 Session 隔离了业务协议。这种结构让复杂的流媒体转发变得像流水线一样清晰。

扩展阅读

• 可视化FFmpeg工具经常曾被FFmpeg的命令行参数弄得晕头转向？推荐使用可视化工具FFmpeg Explorer，详见文章《FFmpeg可视化学习验证神器FFmpeg Explorer》。
• 性能优化如果开发嵌入式AI应用程序需要性能分析和优化，推荐google利器perfetto，详见文章《用google神器“可视化”嵌入式AI复杂多线程应用的性能分析》。
• 日志打印如果需要好用的日志系统，推荐spdlog、log4cplus、glog。或最易集成的单文件库easylogging++，详见文章《好玩实用通过web实时查看嵌入式设备日志并动态调整日志级别》。
• 崩溃分析如果程序异常崩溃，摸不着头脑（没头发就只能摸头皮吧），就必须求助于gdb了，详见文章《干中学，实操踩坑玩下瑞芯微rv1126嵌入式AI应用程序怎样gdb调试》。
• 远程调试需要反向代理远程调试处于局域网环境的嵌入式设备，推荐使用frp，详见文章《那个大佬用了啥黑科技？竟然在办公室ssh远程登录进了通过4g联网的车载设备》。
• ssh终端打开视窗在嵌入式ssh命令行终端界面直接查看图片或播放视频，详见《差点放弃之交叉编译X11 - 只为在嵌入式ssh命令行终端界面实现直接播放视频》。

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

大师级C/C++代码赏析:ZLMediaKit多线程非阻塞网络模型的“静”与“动”

前言

一、ZLMediaKit的架构设计：从第一性原理出发的网络模型选择

1.1 传统的多线程阻塞模型的不足

1.2 流媒体服务器的工程化难题

1.3 核心设计原则

二、架构全景：四层线程模型

2.1 线程层次划分的艺术

2.2 核心代码剖析：EventPoller的线程模型实现

2.3 一个重要但容易忽略的设计决策

三、模式应用

3.1 经典Reactor模式的变体实现

3.2 多Reactor协作模式

3.3 共享从属模式：智能指针与弱引用（Shared_from_this）

3.4 抽象与多态：Session 对象的生命周期

四、无锁编程：线程间通信

4.1 ZLMediaKit 的线程角色划分

4.2 生产者-消费者模式的现代化实现

4.3 数据所有权的高效转移

五、性能优化：从毫秒到微秒的极致追求

5.1 内存池的定制化实现

5.2 零拷贝优化技术

六、可复用模式提炼：从ZLMediaKit学到的工程实践

6.1 模式一：分层线程模型

6.2 模式二：基于事件的任务调度

七、工程决策：为什么这样设计？

7.1 权衡的艺术

7.2 适应性的设计

结语

扩展阅读

最新文章

热门文章

随机文章

大师级C/C++代码赏析:ZLMediaKit多线程非阻塞网络模型的“静”与“动”

前言

一、ZLMediaKit的架构设计：从第一性原理出发的网络模型选择

1.1 传统的多线程阻塞模型的不足

1.2 流媒体服务器的工程化难题

1.3 核心设计原则

二、架构全景：四层线程模型

2.1 线程层次划分的艺术

2.2 核心代码剖析：EventPoller的线程模型实现

2.3 一个重要但容易忽略的设计决策

三、模式应用

3.1 经典Reactor模式的变体实现

3.2 多Reactor协作模式

3.3 共享从属模式：智能指针与弱引用（Shared_from_this）

3.4 抽象与多态：Session 对象的生命周期

四、无锁编程：线程间通信

4.1 ZLMediaKit 的线程角色划分

4.2 生产者-消费者模式的现代化实现

4.3 数据所有权的高效转移

五、性能优化：从毫秒到微秒的极致追求

5.1 内存池的定制化实现

5.2 零拷贝优化技术

六、可复用模式提炼：从ZLMediaKit学到的工程实践

6.1 模式一：分层线程模型

6.2 模式二：基于事件的任务调度

七、工程决策：为什么这样设计？

7.1 权衡的艺术

7.2 适应性的设计

结语

扩展阅读

编程货币:新一代信用创造基础设施

Python爬虫新利器!Playwright助你一键获取豆瓣Top250完整数据

最新文章

热门文章

随机文章