2026-02-11
把 AI Agent 放进 CI:你需要的不是提示词,是 Guardrails
当 Agent 进入 CI/CD,风险不再是『回答不准』,而是『权限、网络、依赖与产物』。这篇给一套可落地的最小 Guardrails 清单。
阅读技术与思考
探索实验与原型
习惯与进度管理
2026-02-11
当 Agent 进入 CI/CD,风险不再是『回答不准』,而是『权限、网络、依赖与产物』。这篇给一套可落地的最小 Guardrails 清单。
2026-02-11
LLM App 合集能带来灵感,但真正有价值的是把它们归纳成可复用的模式。本文提炼 3 个最常见、最能落地的模式,并列出工程与商业化的关键坑。
2026-02-11
真正能长期提升模型效果的不是榜单名次,而是可复现、可回归的评测体系。本文给一套最小 Eval Harness:数据、任务、指标、回归门禁与版本化。
探索数据与交互的关系
浏览器里的三维体验
动效驱动的交互研究
专注全栈开发与产品体验,喜欢把想法快速落地为可用的产品原型。