神经网络基础


本章将会全面的、系统的介绍神经网络的基础知识。

从本章后半开始,重点不再只是“网络长什么样”,而是这些结构对应了怎样的数据类型与训练范式:RNN 对应序列因子分解,GNN 对应离散关系结构上的 message passing,GAN 对应 adversarial learning,Diffusion 对应 denoising/score matching,而离散 token 建模则把 cross entropy、mask prediction、preference learning 和 post-training 串到了一起。