项目 07:Mini-former 训练实战:从随机扰动到文本预测

训练的本质:通过数亿次的微调,在参数的高维荒野中寻找最优解

项目 08:训练目标对比:Causal、Masked 与 Prefix LM

决定模型性格的基因:你如何定义损失,就如何定义模型