把 AI Agent 放进 CI:你需要的不是提示词,是 Guardrails
当 Agent 进入 CI/CD,风险不再是『回答不准』,而是『权限、网络、依赖与产物』。这篇给一套可落地的最小 Guardrails 清单。

博客
记录技术、产品与思考的内容专区。
持续输出开发实践与思考笔记。
当 Agent 进入 CI/CD,风险不再是『回答不准』,而是『权限、网络、依赖与产物』。这篇给一套可落地的最小 Guardrails 清单。

LLM App 合集能带来灵感,但真正有价值的是把它们归纳成可复用的模式。本文提炼 3 个最常见、最能落地的模式,并列出工程与商业化的关键坑。

真正能长期提升模型效果的不是榜单名次,而是可复现、可回归的评测体系。本文给一套最小 Eval Harness:数据、任务、指标、回归门禁与版本化。

从列表页与详情页出发,梳理博客 SEO 的最小闭环:元信息、索引策略、发布前检查与可持续执行。

拆解连续打卡激励机制的设计方法,平衡短期反馈、长期成长与反作弊公平性。

结合当前站点实现,沉淀一套可长期维护的 MDX 组件写作规范,降低返工并提升阅读一致性。

当 Telnet 流量出现阶跃式下滑,这更像一次『互联网管道层』的风险再定价。本文给一份可执行的资产治理与边界收敛清单。

Transformers.js v4(预览)把 WebGPU 推理的『可用性』往前推了一大步。本文从产品化角度讲清:能做什么、边界在哪、怎么落地与避坑。

以修行隐喻设计签到体系,强调连续性与长期激励。

记录个人网站的技术选型与搭建流程,从规划到上线的关键节点。
