home
blog
AI
archives
tags
about
RSS
Blog
个人的一个技术博客站点
列表
画廊
项目 22:自我进化的循环:合成数据(Synthetic Data)的生成、过滤与证明
打破数据枯竭:让模型在镜像世界中学习
项目 23:预测未来的算力账本:缩放法则(Scaling Laws)与曲线拟合
上帝不掷骰子,但偏爱幂律:在大模型竞赛中建立确定性
项目 24:灵魂的对齐:SFT、指令微调与偏好优化(DPO)
赋予模型性格:从统计概率到人类偏好的跨越
项目 25:理性的驯化:从 RLHF、PPO 到 GRPO 的进化史
让模型学会思考:强化学习在决策与对齐中的终极博弈
项目 26:数字的炼金术:模型量化(Quantization)深度解密
精度与空间的博弈:如何无损地压缩智能
«
»
为了提升本站的使用体验和必要功能的正常使用,本站会使用本地 Cookie。详细请查看«
本站使用条款
»了解更多。
同意