home
blog
AI
archives
tags
about
RSS
Blog
个人的一个技术博客站点
列表
画廊
05. CodeAct:把代码执行变成通用 Agent 的动作空间
代码执行作为动作空间,比结构化 JSON 调用更灵活,也更容易自我修正
04. Voyager:用代码探索开放世界的终身学习 Agent
代码作为技能的载体,技能库作为跨任务记忆——Voyager 在游戏里验证了这套思路
03. 从执行反馈中学习:CodeRL 与迭代自修正
单元测试通过——这四个字,是代码 Agent 最好的奖励信号
02. 代码还是文字?CodeSteer 与推理模式的动态选择
代码不是万能答案——选错了,连准确率都会下降
01. 代码是推理的外包地:Program of Thoughts 与 Chain of Code
语言模型不擅长算术,但它擅长写会算术的程序
«
»
为了提升本站的使用体验和必要功能的正常使用,本站会使用本地 Cookie。详细请查看«
本站使用条款
»了解更多。
同意