你接手了一个老项目。Service 层二十几个方法,每个方法开头都是这样的:
python1def register_device(self, serial_no, model):2 logger.info("register_device called, serial_no=%s", serial_no)3 start = time.time()4try:5# ... 真正的业务逻辑,就三行6except Exception as e:7 logger.error("register_device failed: %s", e)8raise9finally:10 logger.info("register_device done, cost %.2fms", (time.time()-start)*1000)三行业务,十行日志。改一个方法名,得同步改四处日志字符串。漏改了,线上排查的时候日志对不上,抓瞎。
这不是个例。我在好几个生产项目里都见过这种"意大利面条式"的日志散落。本质问题是:日志这种横切关注点,被硬编码进了每一个业务方法里。
有没有办法让日志自动长进去,业务代码完全不感知?有。元类。
Python 里,类也是对象。既然是对象,就有人负责创建它。元类就是「创建类的类」。
普通对象由类创建,类由元类创建。默认情况下所有类的元类都是 type。你继承 type、重写 __new__,就能在类被定义的瞬间拦截它——拿到它所有的方法,想改什么改什么,然后再把改造后的类交出去。
业务代码全程不知道发生了什么。这就是「零侵入」的来源。
先看切面本体,逻辑其实很直白:
python1def _make_logged_method(func: Callable, class_name: str) -> Callable:2"""把一个普通方法包一层日志壳子"""3@functools.wraps(func) # 保留原函数的签名和文档4def wrapper(*args, **kwargs):5 logger = logging.getLogger("MetaAOP")6 method_name = f"{class_name}.{func.__name__}"7 start = time.perf_counter()8 logger.debug("┌─ 调用: %s", method_name)9try:10 result = func(*args, **kwargs)11 logger.info("│ 返回: %s → %s", method_name, result)12return result13except Exception as exc:14# 异常被感知、被记录,但不被吞掉15 logger.error("│ 异常: %s | %s: %s",16 method_name, type(exc).__name__, exc)17raise18finally:19 elapsed = (time.perf_counter() - start) * 100020 logger.debug("└─ 完成: %s | %.3f ms", method_name, elapsed)21return wrapper这个函数做了三件事:记录调用入口、捕获异常(记录后重新抛出,不影响调用方)、在 finally 里统计耗时。finally 这个位置很关键——不管正常返回还是异常退出,耗时日志都会打出来。
然后是元类本身:
python1class ServiceMeta(type):2EXCLUDED: Set[str] = {"__init__", "__repr__", "__str__"}34def __new__(mcs, name, bases, namespace):5 cls = super().__new__(mcs, name, bases, namespace)6 logger = logging.getLogger("MetaAOP")78for attr_name, attr_value in namespace.items():9if (10callable(attr_value)11and not attr_name.startswith("_") # 排除私有方法12and attr_name not in mcs.EXCLUDED # 排除白名单13and inspect.isfunction(attr_value) # 只处理函数,不碰属性14 ):15setattr(cls, attr_name, _make_logged_method(attr_value, name))16 logger.debug("[织入] %s.%s ← 日志切面已挂载", name, attr_name)1718return cls__new__ 在类对象被创建时触发。此时 namespace 就是类体里定义的所有东西的字典,遍历它、过滤出公共方法、逐一替换成包了日志壳的版本,完事。整个过程发生在类定义阶段,不是运行时,开销几乎为零。
python1class DeviceService(metaclass=ServiceMeta):2"""3 注意:这里没有任何装饰器,没有任何日志代码4 切面完全由元类在类定义时自动织入5 """6def __init__(self, repo):7 self.repo = repo89def register_device(self, serial_no: str, model: str) -> Device:10if self.repo.count(serial_no=serial_no) > 0:11raise ValueError(f"设备序列号 {serial_no} 已存在")12 device = Device(serial_no=serial_no, model=model, status="offline")13return self.repo.add(device)1415def set_online(self, device_id: int) -> Device:16 device = self.repo.get_by_id(device_id)17if not device:18raise ValueError(f"设备 ID={device_id} 不存在")19 device.status = "online"20return self.repo.update(device)2122# ... 其他方法,同样干净就一行 metaclass=ServiceMeta。后面不管加多少个方法,日志切面自动跟上,一行都不用多写。
光看代码还不够直观。我用 Tkinter 做了一个可视化测试台,把整个切面的运作过程实时呈现出来。
测试台的核心是一个自定义的 GUILogHandler,它继承自 logging.Handler,把日志实时推送到界面上的文本框,并按日志级别染色:
python1class GUILogHandler(logging.Handler):2LEVEL_TAGS = {3 logging.DEBUG: "debug", # 天蓝 #7EC8E34 logging.INFO: "info", # 薄荷绿 #B5EAD75 logging.ERROR: "error", # 红 #FF6B6B6 }78def emit(self, record: logging.LogRecord):9 tag = self.LEVEL_TAGS.get(record.levelno, "info")10 ts = datetime.fromtimestamp(record.created).strftime("%H:%M:%S.%f")[:-3]11 msg = self.format(record)1213 self.widget.configure(state="normal")14 self.widget.insert(tk.END, f"[{ts}] ", "time")15 self.widget.insert(tk.END, msg + "\n", tag)16 self.widget.see(tk.END) # 自动滚到底部17 self.widget.configure(state="disabled")这个 Handler 被注册到根 Logger 上,所有经过 logging 模块的日志都会流进来,包括元类切面里打的那些。
整体是左右分栏结构。左侧是操作面板(注册设备、上下线、删除)加实时设备列表;右侧是日志输出区和元类织入信息面板。

设备列表支持双击行自动填入 ID,省去手动复制的麻烦。在线设备显示绿色,离线显示灰色,一眼就能分辨状态。
场景一:连续注册。序列号会自动递增(SN-1001 → SN-1002),快速注册五六台设备,看右侧日志里每一次 register_device 调用都有完整的调用/返回/耗时三段记录,而业务方法里一行日志代码都没有。
场景二:触发异常。点"⚡ 触发异常演示",会用一个不存在的 ID(99999)调用 set_online。切面的 except 分支会用红色打出异常类型和消息,finally 仍然输出耗时——异常路径的可观测性和正常路径一样完整。这是手动写日志很容易漏掉的地方。
场景三:切换日志级别。右上角的单选按钮控制 Handler 的最低级别。切到 INFO,┌─ 调用 和 └─ 完成 的 DEBUG 行消失,只剩返回值摘要,日志量减半,适合生产环境观察。切回 DEBUG,全部恢复。
如果你的 Service 父类本身也有元类(FastAPI 的某些基类就有),直接用 metaclass=ServiceMeta 会炸:
1TypeError: metaclass conflict: the metaclass of a derived class2must be a (non-strict) subclass of the metaclasses of all its bases解决方法是让 ServiceMeta 继承自目标基类的元类,而不是直接继承 type:
python1from some_framework import FrameworkMeta23class ServiceMeta(FrameworkMeta): # 继承框架的元类,而非 type4 ...如果框架的元类你拿不到或者不确定,改用类装饰器是更安全的替代方案——效果一样,没有继承链冲突的风险。
inspect.isfunction 的边界元类里用 inspect.isfunction 过滤,是为了排掉 classmethod、staticmethod、property 这些描述符——它们在 namespace 里不是普通函数对象,直接包装会出问题。如果你的 Service 里有 @classmethod 方法需要切面,得单独处理:
python1# 检测 classmethod 的方式2if isinstance(attr_value, classmethod):3 inner = attr_value.__func__4 wrapped = _make_logged_method(inner, name)5setattr(cls, attr_name, classmethod(wrapped))日志只是最基础的切面。同样的机制,换一个 _make_xxx_method,可以织入:
多个切面可以叠加,只需要在 ServiceMeta.__new__ 里按顺序应用多个包装函数。切面之间相互独立,业务代码始终是那几行干净的逻辑。
元类切面的本质是:在类定义阶段完成方法替换,把横切关注点从业务代码里彻底剥离出去。日志、监控、鉴权——这些东西不属于业务,就不应该出现在业务代码里。元类让这件事在 Python 里有了一个优雅的实现路径。
完整代码单文件可直接运行,Python 3.10+ 标准库即可,无需额外安装任何依赖。