• home
  • blog
  • AI
  • archives
  • tags
  • about
    • RSS

Blog

个人的一个技术博客站点

05. CodeAct:把代码执行变成通用 Agent 的动作空间

代码执行作为动作空间,比结构化 JSON 调用更灵活,也更容易自我修正

Agent CodeAct Code Execution Action Space Tool Use Python
2026-07-05

04. Voyager:用代码探索开放世界的终身学习 Agent

代码作为技能的载体,技能库作为跨任务记忆——Voyager 在游戏里验证了这套思路

Agent Voyager Lifelong Learning Code Action Minecraft Skill Library
2026-07-04

03. 从执行反馈中学习:CodeRL 与迭代自修正

单元测试通过——这四个字,是代码 Agent 最好的奖励信号

Agent CodeRL Reinforcement Learning Code Generation Iterative Debugging RLTF
2026-07-03

02. 代码还是文字?CodeSteer 与推理模式的动态选择

代码不是万能答案——选错了,连准确率都会下降

Agent Code Reasoning CodeSteer Text Reasoning Hybrid ICLR
2026-07-02

01. 代码是推理的外包地:Program of Thoughts 与 Chain of Code

语言模型不擅长算术,但它擅长写会算术的程序

Agent Code Reasoning PoT Chain of Code Program of Thoughts LLM
2026-07-01
«
»
sshipanoo

你愿意为你喜欢的事情付出多少!

文章

340

类别

6

标签

531

日历
少
多
热门标签
ACI1 AI3 AI Agent1 AI SDK1 AI Safety1 AI 协作1 AI入门22 AI写作1 AI搜索1 AI编程1 ALiBi2 ANN2
最近更新
  • 20. 模型自身能力对 Agent 表现的影响

    2026-07-20
  • 19. Agent 框架横向对比:LangGraph、AutoGen、CrewAI、OpenHands

    2026-07-19
  • 18. 多模态代码 Agent:视觉输入加入代码生成的工作流

    2026-07-18
前人栽树,后人乘凉 | 感谢 H2O-ac 强力驱动 (v2.0.0)
sshipanoo © 2026 RSS 使用条款
总浏览量 · 总访问量
本站已运行 天 小时 分 秒
为了提升本站的使用体验和必要功能的正常使用,本站会使用本地 Cookie。详细请查看« 本站使用条款 »了解更多。