本文将从Linux分层架构、内核五大核心子系统、设备树(Device Tree)以及U-Boot引导加载程序四个维度,全面解析嵌入式Linux系统的组成与工作原理,内容基于Arm Limited 的嵌入式Linux技术讲义整理,适用于嵌入式开发工程师、Linux内核学习者参考。

应用程序(Application):实现嵌入式系统的业务功能,是面向终端用户的核心软件;
系统程序(System Programs):为用户提供访问操作系统服务的友好工具,是操作内核的基础载体;
GNU C库(glibc):作为用户空间与内核空间的中间接口,封装了系统调用,为上层应用提供标准的C语言API,避免应用直接操作内核,降低开发复杂度。
内核:硬件无关的操作系统代码,实现进程调度、内存管理等通用服务,所有硬件平台的通用逻辑均在此实现;
板级支持包(BSP):硬件相关的操作系统代码,针对具体的硬件平台(如特定的Arm开发板)实现上下文切换、硬件驱动等专属功能,是内核适配不同硬件的关键。

支持进程创建自身副本,实现进程的衍生;
实现CPU调度策略(如分时调度、实时调度)和上下文切换,保证多进程有序执行;
接收、中断并将信号路由至对应内核子系统,向用户进程发送信号;
管理硬件定时器,进程结束时清理其占用的系统资源;
支持可加载内核模块,实现内核功能的动态扩展。

核心职责:支持大地址空间(用户进程可引用超出物理内存的虚拟地址)、进程内存隔离保护、内存映射(将文件映射至虚拟内存)、物理内存公平分配、进程间共享内存;
硬件依赖:基于内存管理单元(MMU) 实现虚拟地址到物理地址的映射,这是Linux系统的常规硬件要求,MMU可让进程在物理内存中移动时保持虚拟地址不变,也支持多进程共享物理内存;
对外接口:面向用户空间提供malloc()/free()、mmap()等系统调用,面向内核空间提供kmalloc()/kfree()、get_free_page()等内部接口,分别满足用户进程和内核的内存操作需求。

核心职责:支持多硬件设备、多逻辑文件系统(如ext2、FAT、NFS)、多可执行文件格式(如ELF、a.out);保证文件访问的高性能、数据安全性和访问权限控制(如用户配额、权限校验);
核心数据结构:i-node(索引节点),存储文件除名称和数据外的所有信息(如大小、权限、时间戳、物理存储位置),每个文件对应唯一的i-node编号,Linux通过i-node编号访问文件,隐藏了不同逻辑文件系统的实现细节;
核心接口:分为i-node接口(如create()、lookup()、mkdir(),处理文件系统级操作)和文件接口(如open()、read()、write(),处理文件的读写操作),均遵循POSIX标准;
架构组成:包含系统调用接口、逻辑文件系统、缓冲区缓存、二进制可执行文件解析模块、设备驱动,其中缓冲区缓存(Buffer cache) 通过数据缓存提升存储介质的访问性能,kflushd守护进程负责缓存与物理设备的同步;
设备抽象:将硬件设备分为字符设备(如串口,顺序访问)和块设备(如硬盘,随机块访问),每个设备对应一个设备文件,用户通过操作设备文件实现对硬件的控制,设备驱动则是文件接口的硬件特定实现。

文件IPC:管道(Pipes),适用于父子进程间的单向数据传输;
System V IPC:消息队列、共享内存、信号量,适用于同一主机内的进程通信,其中共享内存是效率最高的IPC方式;
内核IPC:等待队列、信号(Signal),主要用于进程间的同步和事件通知;
网络IPC:域套接字(Domain Socket),适用于同一主机内不同进程的全双工通信,接口与网络套接字一致。
硬件无关代码:实现各类网络协议(如TCP/IP、UDP),是所有网络硬件的通用协议逻辑;
硬件相关代码:实现具体网络网卡的驱动程序,适配不同的网络硬件。

.dts文件:板级硬件定义文件,针对具体的开发板编写,描述该板的硬件资源;
.dtsi文件:通用硬件头文件,可被多个.dts文件包含,描述SoC或通用硬件模块的信息,实现代码复用。
节点定义:节点格式为node@地址,可添加标签(如node0: node@0),方便其他节点引用;
属性定义:每个节点包含若干属性,格式为属性名 = 属性值,属性值支持字符串、字节序列、32位整数序列,也可包含空属性;
节点引用:通过&节点标签引用其他节点,实现节点间的关联;
核心顶层节点:根节点下包含cpus(描述CPU信息)、memory(定义RAM的位置和大小)、chosen(向内核传递启动参数,如内核命令行)、aliases(定义节点快捷方式),以及总线、板载设备等节点。


reg = <地址1 长度1 地址2 长度2 ...>:列出节点的地址集,每个地址集由起始地址和长度组成;
#address-cells =:指定节点子节点的地址字段占用的32位整数个数;
#size-cells =:指定节点子节点的长度字段占用的32位整数个数。
第一阶段(汇编代码):运行于CPU片上内存(如片上静态RAM),核心功能是初始化CPU的内存控制器,将U-Boot自身重定位到片外RAM中,为第二阶段的执行准备硬件环境;
第二阶段(C语言代码):运行于片外RAM,核心功能包括实现带脚本能力的命令行人机交互接口、初始化最小化外设、加载DTB、Linux内核和初始RAM磁盘到内存,最终启动Linux内核。
处理器相关文件:针对具体的CPU架构(如Arm Cortex-A9、x86)编写,存放于对应CPU的目录下;
板级相关文件:针对具体的开发板编写,即使是同一CPU,不同开发板的I/O设备、硬件布局不同,也需单独的板级文件;
通用文件:适用于所有CPU和开发板,实现U-Boot的命令行交互、脚本、文件加载等通用功能,是U-Boot的核心逻辑。
分层架构通过用户空间与内核空间的隔离,实现了应用与硬件的解耦,系统调用成为跨层级通信的唯一桥梁;
内核五大子系统各司其职,又协同工作,通过硬件无关与硬件相关代码的分离,让内核能适配不同的硬件平台;
设备树替代了硬编码的硬件描述方式,实现了硬件信息与内核的分离,大幅提升了内核的移植效率;
U-Boot作为嵌入式Linux的启动入口,通过两阶段执行完成硬件初始化和内核加载,是连接硬件与Linux内核的关键纽带。