神经网络基础
本章将会全面的、系统的介绍神经网络的基础知识。
- 第 1 节会介绍神经网络背后的数学原理,在介绍的同时会辅以 from scratch 的代码实现,用来加深理解。
- 第 2 节会介绍最最最基本的 nn, 比如 Linear Layer, Activation Function, BatchNorm 等等。同时,会介绍一个简单的神经网络训练模型的所有组成部分。在这里会使用 Pytorch 来实现,希望能够实现一个速查。
- 第 3 节和第 4 节会介绍神经网络的两大经典结构,卷积神经网络和循环神经网络。
- 第 5 节往后介绍更多的神经网络结构和技术,比如 GNN, GAN, DDPM 等等。
从本章后半开始,重点不再只是“网络长什么样”,而是这些结构对应了怎样的数据类型与训练范式:RNN 对应序列因子分解,GNN 对应离散关系结构上的 message passing,GAN 对应 adversarial learning,Diffusion 对应 denoising/score matching,而离散 token 建模则把 cross entropy、mask prediction、preference learning 和 post-training 串到了一起。