金鱼在桌前焦虑地翻书,纸团满地——大模型认知过载的隐喻

一文读懂 Harness Engineering:从 14 篇工程文章中,寻找那个让 AI 不再离经叛道的壳

作者:Yousa 博阳 | 编辑:徐青阳 | 游戏学习笔记 | 2026 年 4 月 5 日 2026 年第一季度,大模型应用层最具统治力的热词,绝对是「Harness」。 今年三月,LangChain 发布了一篇题为《The Anatomy of an Agent Harness》的实证文章,彻底点燃了所有人的焦虑与狂热。他们在这份报告里引用了一个实验数据对比。仅仅是给同一个大语言模型换上一套更精巧的 Harness 架构,它在 Terminal Bench 2.0(一个专门衡量 AI 编程能力的权威榜单)上的通过率,直接从 52.8% 拉升到了 66.5%。 ...

四月 5, 2026 · 33 分钟 · 22040 字 · Miss-you

用 300 行 Swift 让 iPhone 变成 Kimi CLI 控制台

用 300 行 Swift 让 iPhone 变成 Kimi CLI 控制台 你在咖啡馆喝完拿铁,突然想起 Mac 上挂着的 Kimi CLI 正在跑一个代码分析任务。你掏出手机,打开一个原生 App,看到 Agent 的输出正在实时滚动,已经跑完三分之二。你追加一条新指令,然后继续刷朋友圈。 ...

二月 16, 2026 · 15 分钟 · 12781 字 · Miss-you