开发者工作室

博客

博客

记录技术、产品与思考的内容专区。

最新文章

持续输出开发实践与思考笔记。

把 AI Agent 放进 CI：你需要的不是提示词，是 Guardrails

当 Agent 进入 CI/CD，风险不再是『回答不准』，而是『权限、网络、依赖与产物』。这篇给一套可落地的最小 Guardrails 清单。

发布于 · 2026年2月11日阅读时长 · 4 分钟

标签:aiagentscicdsecurityguardrails

阅读全文 →

CI Agent Guardrails 最小清单

别只看排行榜：把评测做成工程资产（最小 Eval Harness）

真正能长期提升模型效果的不是榜单名次，而是可复现、可回归的评测体系。本文给一套最小 Eval Harness：数据、任务、指标、回归门禁与版本化。

发布于 · 2026年2月11日阅读时长 · 6 分钟

标签:aievalllmengineeringquality

阅读全文 →

最小 Eval Harness：数据、任务、指标、回归

← 返回入口返回首页