Linux 驱动课程火热更新中:
放大招!瑞芯微底层驱动课程~|
什么是DMA?DMA英文全称为Direct memory access,直译过来就是直接内存访问,大概就是就是不用通过CPU就能将数据从一个地址空间复制到另一个地址空间,提供在外设和存储器之间或者存储器和存储器之间的高速数据传输。它的作用就是解决大量数据传输过度消耗CPU资源的问题。DMA节省了大量的CPU资源,使CPU专注于更加实用的操作。
一、原理介绍
DMA的本质就是实现数据的直接传输,即将内存某块内存地址的数据传输到另一块地址空间,既然是数据传输,想必就涉及到源地址、目标地址、以及传输数据的长度。
想象一下,计算机系统就像一个国家的交通系统:
CPU:国王/总统。拥有国家的最高权力,所有重要决策都由他做出。
总线:连接国家核心区域的唯一一条超级高速公路。这条路的通行权至高无上。
内存:中央国库。存储着国家所有的核心物资和数据。
外设(硬盘、网卡、声卡等):分布在各地的专用仓库或工厂(硬盘是粮仓,网卡是邮局,声卡是剧院)。
DMA控制器:国王麾下的特遣车队总指挥及其精英车队。
我们这样描述这四种任务:
外设 -> 内存(粮仓 -> 国库)
场景:从“硬盘粮仓”运入大批粮食到“中央国库”。总指挥(DMA)负责将粮食快速、成批地运入国库,无需国王(CPU)亲自去押运每一辆车。
内存 -> 外设(国库 -> 剧院)
场景:为一场盛大演出,从“国库”调拨一批精美的布景和乐器到“歌剧院”。总指挥确保物资准确、及时送达,不让国王为琐事分心。
内存 -> 内存(国库A区 -> 国库B区)
场景:国库内部进行大规模的数据整理,将A区的宝藏搬迁到新扩建的B区。这是纯粹的内部物流,由总指挥全权负责,效率极高,是国王的“御用搬运工”。
外设 -> 外设(工厂A -> 工厂B)
场景:将一个工厂的半成品直接运送到另一个工厂进行加工。这种场景较少,但总指挥也能处理,避免了物资先运回国库再发出的迂回路线。
二、传输过程
这才是整个DMA过程最精彩的部分,一场井然有序的权力交接:
第一幕:请命(DMA请求)
国王(CPU) 正在高速公路上亲自驾驶着他的“指令跑车”飞奔(执行当前总线周期)。
这时,特遣车队指挥(DMA控制器) 发来无线电请求:“陛下,有万吨粮食急需从粮仓运入国库,请求授予高速公路的临时独占权!”
国王说:“准奏!但我得先完成手上这个急弯(当前总线周期结束)。你做好准备。”
第二幕:交权(DMA响应)
第三幕:雷霆行动(DMA传输)
整个国家最壮观的景象出现了:高速公路被特遣车队完全独占!
一辆接一辆的重型卡车(Burst Transfer),以最大的载重量(Transfer Width),组成连绵不绝的车队(Burst Size),风驰电掣地在路上行驶。国库和粮仓之间的大门全开,数据被高速搬运。
而此刻,国王(CPU)在做什么? 他并没有闲着!他可以在不受交通干扰的“休息区”(CPU核心内部,缓存足够的情况下)继续处理国家大事(执行不访问总线的指令和运算)。这就是DMA提升系统性能的关键——并行工作。
第四幕:归政与汇报(DMA结束)
当最后一辆卡车驶离高速,所有物资搬运完毕,车队指挥(DMA控制器)立刻通过无线电宣告:“任务完成!请求交还控制权!” 同时,他向国王发出一个“任务完成”的信号弹(中断请求)。
国王收到信号,立刻从休息区驶回主路,重新握紧方向盘(收回总线控制权)。
随后,国王会召见车队指挥,听取一份简短的任务汇报(执行中断服务程序,检查DMA传输是否正确),然后一切恢复正常统治。
DMA的本质,是一场精心策划的 “权力真空期”。
CPU(国王) 是系统的永恒统治者,但他明智地意识到,对于大规模的、重复性的“体力劳动”(数据搬运),交给专业的代理人(DMA)会更高效。
因此,他愿意短暂地让渡出最核心的权力(总线控制权),换取整个王国(计算机系统)更高的运行效率。
整个过程权责清晰、有始有终:从请命、交权、执行到归政汇报,形成了一个完美的闭环。正是这种机制,才使得现代计算机能够“一心多用”,实现惊人的数据处理能力。
三、传输宽度&传输数量
为了更好地理解,我们可以把DMA传输过程比作一个快递车队从A仓库(源地址)运送货物到B仓库(目标地址)。
CPU:公司的调度总监(负责初始派单和最终验收,但运送过程不插手)。
DMA控制器:快递车队的队长及其车队(负责具体的货物搬运)。
总线:城市道路(一次只能由一个车队独占行驶)。
I/O 接口:A仓库的装卸主管(负责把货物搬上车,并呼叫车队)。
3.1、Transfer Width(传输宽度)
形象描述:
Transfer Width 指的是每辆快递车一次能装载的货物箱尺寸。
8-bit:就像使用摩托车送货,一次只能运一个小件(1个字节)。灵活,但运送大宗货物效率低。
16-bit:就像使用小面包车送货,一次能运两个小件,或者一个中等件(2个字节)。适合像音频数据这种“标准件”。
32-bit:就像使用标准厢式货车送货,一次能运4个小件(4个字节)。这是很多系统总线的标准“车道宽度”,效率很高。
64-bit:就像使用重型卡车送货,一次能运8个小件(8个字节)。用于需要极高吞吐量的场景。
为什么需要它?
为了匹配设备和总线的“装卸能力”,并提升效率。
设备匹配:一个音频设备(如扬声器)的“货舱门”可能只设计成16位宽。如果你用32位的“卡车”强行给它塞数据,它会“不知所措”。必须用16位的“面包车”来匹配。
效率最大化:在内存之间搬运数据时,没有设备限制,我们当然希望用尽可能宽的“卡车”(如64位)来跑,这样跑一趟运的货多,总趟数就少,效率自然高。
在 struct dma_device 中:驱动会检查DMA控制器支持哪些传输宽度(8/16/32/64位),然后根据源设备和目标设备的特性,选择一个最合适的“车辆型号”。
3.2、Burst Size(突发传输大小)
形象描述:
Burst Size 指的是快递车队在获得一次道路使用权(总线控制权)后,连续行驶的车辆数。
DMA控制器的内部有一个小缓存(Buffer),就像车队在路边的一个临时中转站。
场景一:内存是源(读操作)
过程:车队队长(DMA控制器)获得道路权后,不是派一辆车去A仓库取一件货就回来,而是派一个车队(Burst)连续不断地进入A仓库。比如,一次派出4辆卡车(Burst Size=4),每辆车都装满,然后全部开到临时中转站卸货。
之后:队长把道路权交还给CPU总监。在接下来的时间里,队长再安排小车,从容不迫地把中转站里的货物,按节奏(每个时钟节拍)一件件送到目标设备,而不需要再次申请占用主路。
形象图:[内存] --(Burst 4x32-bit)--> [DMA中转站] --(逐个32-bit)--> [外设]
场景二:内存是目标(写操作)
为什么需要它?
为了减少“申请道路权”的次数,从而降低总线访问的开销和延迟。
在 struct dma_device 中 min_burst / max_burst 的含义:
max_burst:这个DMA控制器支持的最大车队规模。比如 max_burst = 16,意味着它一次最多能连续传输16个数据单元(这个单元的大小由 transfer width 决定)。它反映了DMA控制器内部中转站(Buffer)的最大容量。
min_burst:这个DMA控制器要求最低的车队规模。有些DMA控制器设计上要求每次传输必须至少达到某个最小突发量,否则无法正常工作。通常这个值可能是1。
四、DMA导致的问题
把整个系统比作一个现代化的办公室:
4.1、缓存一致性问题
场景1:经理先更新,DMA后读取(脏数据问题)
场景2:DMA先更新,经理后读取(陈旧数据问题)
4.2、解决方案
表格 还在加载中,请等待加载完成后再尝试复制
4.2.1、一致性DMA映射(Coherent DMA Mapping)
比喻:设立一个“公告板”区域
适用场景:用于长期存在、被CPU和DMA频繁交替访问的缓冲区,比如设备控制块、状态描述符环等。
4.2.2、流式DMA映射(Streaming DMA Mapping)
比喻:严格的“文件交接流程”
适用场景:用于一次性的、大数据块的传输,比如网络数据包、磁盘读写缓冲区。