把 AI Agent 放进 CI:你需要的不是提示词,是 Guardrails
当 Agent 进入 CI/CD,风险不再是『回答不准』,而是『权限、网络、依赖与产物』。这篇给一套可落地的最小 Guardrails 清单。

博客
记录技术、产品与思考的内容专区。
持续输出开发实践与思考笔记。
当前筛选: ai
当 Agent 进入 CI/CD,风险不再是『回答不准』,而是『权限、网络、依赖与产物』。这篇给一套可落地的最小 Guardrails 清单。

真正能长期提升模型效果的不是榜单名次,而是可复现、可回归的评测体系。本文给一套最小 Eval Harness:数据、任务、指标、回归门禁与版本化。
