这本书最大的特点,就是不依赖高级框架,从零手写神经网络,把原理讲得通透又温柔,非常适合打基础、补底层逻辑。
一、全书核心思想
1.不用 PyTorch / TensorFlow,只用 Python + NumPy
2.从最简单的感知机开始,一步步搭出神经网络
3.理论和代码一一对应,看懂就能写,写完就能跑
4.目标不是“会用工具”,而是真正理解深度学习在做什么
二、基础铺垫:Python & NumPy
这本书对新手非常友好,先把最关键的工具讲清楚:
数组、矩阵运算
广播机制
维度、形状、索引
这些是后面所有神经网络代码的基础。
三、感知机:神经网络的起点
感知机是最简单的模型,可以理解成多个输入、一个输出的线性分类器。
接收输入信号
乘以权重
加上偏置
超过阈值就输出1,否则0
它的局限:只能解决线性可分问题,
但它是理解所有神经网络的第一步。
四、神经网络:从线性到非线性
神经网络之所以强大,关键在于激活函数。
书中重点讲了:
sigmoid
ReLU
阶跃函数
核心作用:
引入非线性,让网络可以拟合复杂的现实规律。
神经网络的基本流程:
1. 输入层接收数据
2. 隐藏层加权+激活
3. 输出层给出结果
这一过程叫前向传播。
五、神经网络如何学习:核心三要素
1. 损失函数
衡量“预测值和真实值差多远”,常用:
均方误差(回归)
交叉熵误差(分类)
2. 梯度下降
沿着误差减小的方向,更新权重和偏置。
3. 反向传播
这是全书最关键的知识点:
用计算图,把误差从后往前传,快速算出梯度。
理解了它,才算真正懂神经网络学习。
六、训练神经网络的完整流程
1. 从数据中随机取一批(mini-batch)
2. 计算梯度(方向)
3. 更新权重
4. 重复迭代,直到损失足够小
书中用 MNIST 手写数字识别,带你完整跑一遍。
七、CNN 卷积神经网络
CNN 专门用于图像,核心层:
卷积层:提取特征(边缘、纹理、形状)
池化层:缩小尺寸,保留关键信息
全连接层:最终分类
读完你会明白:
为什么 CNN 在图像领域这么强。
八、重要技巧:让模型更稳、更准
权重初始化
Batch Normalization
Dropout(防止过拟合)
优化器:SGD、Adam 等
这些都是实战必用的知识点。
九、读完这本书能达到什么水平?
能手写一个简单神经网络
能讲清前向传播、反向传播
看得懂常见网络结构
能独立跑通图像分类小项目
再学 PyTorch、TensorFlow 会非常轻松