sshipanoo

05. CodeAct：把代码执行变成通用 Agent 的动作空间

代码执行作为动作空间，比结构化 JSON 调用更灵活，也更容易自我修正

04. Voyager：用代码探索开放世界的终身学习 Agent

代码作为技能的载体，技能库作为跨任务记忆——Voyager 在游戏里验证了这套思路

03. 从执行反馈中学习：CodeRL 与迭代自修正

单元测试通过——这四个字，是代码 Agent 最好的奖励信号

02. 代码还是文字？CodeSteer 与推理模式的动态选择

代码不是万能答案——选错了，连准确率都会下降

01. 代码是推理的外包地：Program of Thoughts 与 Chain of Code

语言模型不擅长算术，但它擅长写会算术的程序