基于开源项目 c-periphery 的源码解析,深挖 C 语言面向对象的工程实践。
有一个流传已久的段子:
面试官:你了解面向对象编程吗?候选人:了解,封装、继承、多态。面试官:用 C 能实现吗?候选人:……能,但没必要。面试官:Linux 内核就是这么干的。候选人:沉默。
Linux 内核、SQLite、libuv,这些 C 项目里,面向对象的思想无处不在。不是靠语言特性,而是靠设计模式 + 函数指针 + 结构体,硬生生把 OOP 的精髓给实现了。
今天我们就用一个真实的开源嵌入式库 c-periphery 来扒一扒,C 语言是怎么玩出面向对象的。
一句话版本:一个让你在 Linux 用户空间优雅访问 GPIO、I2C、SPI、UART、PWM 等外设的 C 库。
Star 数 1k+,MIT 协议,代码量不大但设计极其精炼,是分析 C 面向对象的绝佳标本。
项目地址:https://github.com/vsergeev/c-periphery
面向对象的第一要义是封装:把数据和操作它的方法绑在一起,同时把实现细节藏起来,只暴露接口。
在 C++ 里,你用 class 的 private 字段实现这一点。
在 C 里怎么办?用不透明指针(Opaque Pointer)。
来看 c-periphery 的 gpio.h 里这一行:
// gpio.h(公开头文件)typedefstructgpio_handlegpio_t;就这一行。struct gpio_handle 在公开头文件里只声明,不定义。你作为调用方只拿到一个 gpio_t * 指针,完全不知道里面长什么样。
真正的结构体定义藏在内部头文件 gpio_internal.h 里,外部代码根本看不见,更别提直接访问字段了。
这就是 C 版的 private——编译器强制执行,你想偷看都偷不了。
假设不用不透明指针,让调用方直接操作结构体:
// 危险!裸奔的结构体structgpio {int fd;int line;char path[64];// ... 其他内部状态};structgpiomy_gpio;my_gpio.fd = 3; // 调用方可以随意乱改my_gpio.line = -999; // 改了个非法值,程序崩溃,凌晨两点排查一旦结构体字段暴露出去,就意味着:
真实案例:某智能家居控制盒项目早期裸用 struct 传递设备状态,后来硬件换代,GPIO 接口从 sysfs 迁移到 cdev,直接动 fd 字段的代码散落在十几个文件里,改了三天,测试又发现五个地方漏改了。后来统一换成不透明指针,内部随便改,调用方代码一行都不动。
观察 c-periphery 的 API 风格:
gpio_t *gpio_new(void); // 构造:分配并初始化对象voidgpio_free(gpio_t *gpio); // 析构:释放对象每个外设类型都有一对对应的函数:
gpio_new() | gpio_free() |
i2c_new() | i2c_free() |
spi_new() | spi_free() |
serial_new() | serial_free() |
来看 gpio_new 的源码(gpio.c):
gpio_t *gpio_new(void) {gpio_t *gpio = calloc(1, sizeof(gpio_t));if (gpio == NULL)returnNULL;#if PERIPHERY_GPIO_CDEV_SUPPORT gpio->ops = &gpio_cdev_ops; // 关键:注入虚函数表(下文详解) gpio->u.cdev.line_fd = -1; gpio->u.cdev.chip_fd = -1;#else gpio->ops = &gpio_sysfs_ops; // 编译时选择另一套实现 gpio->u.sysfs.line_fd = -1;#endifreturn gpio;}这跟 C++ 的构造函数干的事情完全一样:
calloc 还顺带清零,防止野值)line_fd = -1 表示"还没打开")gpio_free 则对应析构,就是个 free(gpio),简单但必要。
注意这里的设计决策:为什么要分 new 和 open 两步?
gpio_t *gpio = gpio_new(); // 第一步:构造对象gpio_open(gpio, "/dev/gpiochip0", 10, GPIO_DIR_IN); // 第二步:打开资源因为构造和初始化是不同的事情。对象可以存在,但暂时还没有绑定到具体资源。这在需要提前分配对象数组、后续再批量打开的场景下非常有用。
这是整个 c-periphery 设计中最精彩的部分,值得细细品味。
Linux 的 GPIO 有两套接口:
/sys/class/gpio/,已被标记为 deprecated)/dev/gpiochip0,Linux 4.8+ 引入)两套接口操作方式完全不同,但上层调用代码应该是统一的——你不希望调用方去判断"我该走哪条路",这是库应该帮你解决的事。
这就是多态要解决的问题。
先看内部结构(gpio_internal.h,外部不可见):
// 这就是 C 版的"虚函数表"(vtable)structgpio_ops {int (*read)(gpio_t *gpio, bool *value);int (*write)(gpio_t *gpio, bool value);int (*poll)(gpio_t *gpio, int timeout_ms);int (*close)(gpio_t *gpio);int (*read_event)(gpio_t *gpio, gpio_edge_t *edge, uint64_t *timestamp);int (*get_direction)(gpio_t *gpio, gpio_direction_t *direction);int (*set_direction)(gpio_t *gpio, gpio_direction_t direction);int (*get_edge)(gpio_t *gpio, gpio_edge_t *edge);int (*set_edge)(gpio_t *gpio, gpio_edge_t edge);// ... 其他方法};// "基类"——gpio_handle 内部持有一个 ops 指针structgpio_handle {conststructgpio_ops *ops;// 指向当前实现的虚函数表union {struct {// cdev 实现的私有数据int line_fd;int chip_fd;// ... } cdev;struct {// sysfs 实现的私有数据int line_fd; } sysfs; } u;struct {// 统一的错误状态int c_errno;char errmsg[96]; } error;};然后,cdev 实现和 sysfs 实现各自填充自己的 ops 表:
// gpio_cdev_v2.c(cdev 实现)conststructgpio_opsgpio_cdev_ops = { .read = _gpio_cdev_read, .write = _gpio_cdev_write, .poll = _gpio_cdev_poll, .close = _gpio_cdev_close, .get_direction = _gpio_cdev_get_direction, .set_direction = _gpio_cdev_set_direction,// ...};// gpio_sysfs.c(sysfs 实现)conststructgpio_opsgpio_sysfs_ops = { .read = _gpio_sysfs_read, .write = _gpio_sysfs_write, .poll = _gpio_sysfs_poll, .close = _gpio_sysfs_close,// ...};最后,gpio_read 这类公开函数长这样(gpio.c):
intgpio_read(gpio_t *gpio, bool *value) {return gpio->ops->read(gpio, value); // 通过函数指针调用,自动多态}intgpio_write(gpio_t *gpio, bool value) {return gpio->ops->write(gpio, value);}这就是多态!
调用方写:
gpio_read(my_gpio, &value);底层可能走 cdev 实现,也可能走 sysfs 实现,取决于 gpio_new() 时注入了哪套 ops——调用方完全不感知。
struct gpio_ops | ||
__vptr | gpio->ops | |
obj->method() | gpio->ops->read(gpio, ...) | |
gpio_new() | ||
override | gpio_ops 结构体 |
两者机制几乎完全等价,C++ 只是让编译器替你做了那些繁琐的手工活。
有人可能会想:直接在 gpio_read 里加个 if (use_cdev) ... else ... 不行吗?
能跑,但有几个问题:
if/else if/else 会变成屎山函数指针虚表的好处:加新实现不改老代码,只需实现一套新的 ops 并在合适的时候注入。
C 没有异常,但 c-periphery 把错误状态做成了"对象的成员变量":
structgpio_handle {// ...struct {int c_errno; // 底层 errnochar errmsg[96]; // 人类可读的错误描述 } error;};每个失败的操作都会调用内部的 _gpio_error() 函数更新这两个字段:
// 内部实现(简化)staticint _gpio_error(gpio_t *gpio, int code, int c_errno, constchar *fmt, ...) { gpio->error.c_errno = c_errno; va_list ap; va_start(ap, fmt); vsnprintf(gpio->error.errmsg, sizeof(gpio->error.errmsg), fmt, ap); va_end(ap);return code;}调用方通过两个方法取错误信息:
gpio_errno(gpio); // 返回 int,底层 errnogpio_errmsg(gpio); // 返回 const char *,人类可读描述这个设计让错误信息和对象绑定——你知道是哪个对象出了什么问题,而不是一个全局的 errno 让你猜。
真实案例:某工控设备同时管理 8 路 GPIO 输出。原来用全局 errno,一出错完全不知道是哪路 GPIO 的问题,要加大量日志才能定位。换成 c-periphery 风格后,每个 gpio_t 各自保存错误状态,出问题直接 gpio_errmsg(gpios[i]) 拿到精准描述,调试时间从半小时缩短到五分钟。
c-periphery 对外不暴露任何结构体字段,全部通过函数访问:
// 属性读取(Getter)intgpio_get_direction(gpio_t *gpio, gpio_direction_t *direction);intgpio_get_edge(gpio_t *gpio, gpio_edge_t *edge);intgpio_get_bias(gpio_t *gpio, gpio_bias_t *bias);intgpio_get_drive(gpio_t *gpio, gpio_drive_t *drive);intgpio_get_inverted(gpio_t *gpio, bool *inverted);// 属性设置(Setter)intgpio_set_direction(gpio_t *gpio, gpio_direction_t direction);intgpio_set_edge(gpio_t *gpio, gpio_edge_t edge);intgpio_set_bias(gpio_t *gpio, gpio_bias_t bias);intgpio_set_drive(gpio_t *gpio, gpio_drive_t drive);intgpio_set_inverted(gpio_t *gpio, bool inverted);为什么不直接 gpio->direction = GPIO_DIR_OUT?
因为 setter 可以做参数校验、触发副作用:
intgpio_set_direction(gpio_t *gpio, gpio_direction_t direction) {return gpio->ops->set_direction(gpio, direction);// 底层实现会验证 direction 是否合法// 还会真正调用 ioctl 更新硬件状态// 如果你直接改字段,硬件根本不知道}如果允许直接改字段,gpio->direction = 999 这种代码会让硬件状态和软件状态不一致,然后在某个你完全意想不到的时机,程序行为变得玄学。
理解了 c-periphery 的设计之后,你可以把这套模式应用到自己的项目里。比如设计一个"通用传感器"抽象:
// sensor.h(公开接口)typedefstructsensor_handlesensor_t;// 构造/析构sensor_t *sensor_new(void);voidsensor_free(sensor_t *sensor);// 操作intsensor_open(sensor_t *s, constchar *device);intsensor_read_temperature(sensor_t *s, float *temp);intsensor_read_humidity(sensor_t *s, float *humidity);intsensor_close(sensor_t *s);// 错误处理intsensor_errno(sensor_t *s);constchar *sensor_errmsg(sensor_t *s);// sensor_internal.h(内部,不对外)structsensor_ops {int (*read_temperature)(sensor_t *s, float *temp);int (*read_humidity)(sensor_t *s, float *humidity);int (*close)(sensor_t *s);};structsensor_handle {conststructsensor_ops *ops;union {struct {int i2c_fd; uint8_t addr; } sht31; // SHT31 实现struct {int spi_fd; } bme280; // BME280 实现 } u;struct {int c_errno; char errmsg[96]; } error;};// sensor.c(调度层,极其薄)intsensor_read_temperature(sensor_t *s, float *temp) {return s->ops->read_temperature(s, temp);}上层业务代码写:
sensor_t *s = sensor_new_sht31("/dev/i2c-0", 0x44); // 工厂函数float temp;sensor_read_temperature(s, &temp);// 换成 BME280 只改这一行,业务代码完全不动真实案例:某气象监测站同时支持三种温湿度传感器(SHT31、DHT22、BME280),不同地区的设备用不同型号。用这套模式后,传感器驱动层各自实现 ops,业务层代码没有一个 if (sensor_type == ...) 的分支。工厂函数根据配置文件决定 new 哪种传感器,业务层完全解耦。后来加第四种传感器,业务层代码改动量:零行。
typedef struct gpio_handle gpio_t | ||
xxx_new()xxx_free() | gpio_new()gpio_free() | |
struct ops) | gpio->ops->read(gpio, value) | |
gpio_get_direction()gpio_set_edge() |
这四件套组合起来,能让 C 代码达到相当高的结构清晰度和可维护性。Linux 内核里的 VFS(虚拟文件系统)用的是同一套思路——struct file_operations 就是一张巨大的虚函数表,每种文件系统(ext4、btrfs、tmpfs)各自填充自己的实现。
C 没有 OOP 的语法糖,但语法糖只是工具,设计思想是独立于语言的。
下次有人跟你说"C 不能面向对象",你可以告诉他:Linux 内核不同意。
源码参考:https://github.com/vsergeev/c-peripheryLicense: MIT | 适用平台: 任何嵌入式 Linux