-
2026-05-27 项目 28:拒绝虚假繁荣:构建严谨的模型评测(Evaluation Harness)
-
2026-05-25 项目 17-33:MoE、数据、后训练、评测、RAG、Agent 与安全
-
2026-05-25 项目 34:十二周执行计划与 Capstone
-
2026-05-13 01. 评判一个 Agent,你到底在评判什么
-
2026-04-30 进阶方向:评测、监控、成本与微调
2026-05-27 项目 28:拒绝虚假繁荣:构建严谨的模型评测(Evaluation Harness)
2026-05-25 项目 17-33:MoE、数据、后训练、评测、RAG、Agent 与安全
2026-05-25 项目 34:十二周执行计划与 Capstone
2026-05-13 01. 评判一个 Agent,你到底在评判什么
2026-04-30 进阶方向:评测、监控、成本与微调