Agent-first Engineering OS

Yousa Driven Development (YDD)

面向 AI 协作编程的实践手记

把自己在腾讯的一线工程经验 + AI 协作实验都放进一册「YDD」。不卖课,只是把真实的工程笔记、踩坑、工具链迭代写清楚。

  • Infra Notes

    Golang、K8S、OpenResty、APISIX、Istio、Envoy 的落地记录

  • AI Pairing

    让模型当队友的 Prompt/Agent/工具链实验手记

  • Personal Stack

    写作、知识管理、Dev Workflow 的自定义脚本与仪式感

YDD Sprint

最近在写些什么

聚焦「AI 协作编程」&「云原生基础设施」的真实进展。

  • APISIX / Envoy 的插件实践 & 边车策略
  • 把 LLM 接入工作流:Prompt 合同、工具协议、回放机制
  • 如何把写作、产品、工程节奏融合成一个长期栈

用 300 行 Swift 让 iPhone 变成 Kimi CLI 控制台

用 300 行 Swift 让 iPhone 变成 Kimi CLI 控制台 你在咖啡馆喝完拿铁,突然想起 Mac 上挂着的 Kimi CLI 正在跑一个代码分析任务。你掏出手机,打开一个原生 App,看到 Agent 的输出正在实时滚动,已经跑完三分之二。你追加一条新指令,然后继续刷朋友圈。 这不是科幻场景。只需要约 300 行 Swift 代码,零第三方依赖,就能把 iPhone 变成功能完备的 Kimi CLI 控制台。这个项目的特点是代码量少,更多时间花在理解架构和拆解任务上。 1. 背景与需求 1.1 为什么需要手机操控 CLI CLI 工具的生产力很高,但它们被锁在终端里。坐在地铁上想看看刚才让 Kimi 分析的日志有没有跑完,通常只能掏出笔记本。 更麻烦的是,很多 CLI Agent 任务是长时运行的,代码审查、日志分析、测试报告生成动辄几分钟,随时查看进度、调整策略就变得很有价值。 这个需求一直存在,但合适的方案不多。Remote Desktop 太重,SSH + tmux 太原始,第三方面板又引入信任和部署成本。理想方案:原生、轻量、无侵入,让手机成为 CLI 的第二块屏幕。 1.2 Kimi Web UI 是什么 Kimi CLI 在 v1.4(2026-01-30)引入了 kimi web 命令。执行后,本地 Web 服务在 127.0.0.1:5494 启动,浏览器打开即可看到控制台界面,支持实时对话、文件上传、会话管理、流式响应,体验接近终端版。 Kimi CLI 采用「内核 + 多前端」架构:终端 Shell、Web UI、IDE 侧边栏都是前端壳,背后是同一个 Agent 内核,通过统一的 Wire 协议通信。 ...

二月 16, 2026 · 6 分钟 · 8942 字 · Miss-you

选工作,你在看朋友圈还是体检报告?

「选工作最重要的是跟对人。」 这句话你一定听过。不止听过,大概率还深信不疑。因为有切身体会。 你有没有经历过这样的时刻:换了一个领导之后,同样的工作突然变了味道。之前觉得干什么都拧巴,每天上班像在水里走路。换了一个人带你之后,信息开始透明,你知道自己在干什么、为什么干、干好了会怎样。你甚至觉得自己变聪明了,但其实不是你变了,是你上面那个人变了。 好领导的作用不止「让你舒服」。一个好的领导会改变你的判断力本身。他让你看到更大的系统,而不只是手头的任务。他做决策的时候,你在旁边看着,学到的不是他做了什么决定,而是他怎么想问题。这种东西,换一个人带你,接触不到。 在中国职场,「跟对人」更不是一句鸡汤。人治成分依然很重的环境里,好的领导能帮你绕过制度性的障碍,能把资源往你手里倾斜,能在关键时刻替你挡压力。这是中国组织生态里一个冷冰冰的现实。所以你告诉我「选工作最重要的是跟对人」,我不会反驳。我甚至觉得你可能还低估了这件事。 在大组织里,你的直属上级就是你的「微型生态系统」。他决定了你能看到什么信息,接触什么项目,得到什么反馈。你以为你在一家大公司工作,其实你在你领导构建的那个小世界里工作。创业场景里这一点放大到极致。五六个人的团队,创始人就是一切。「跟对人」几乎等于「选对一切」。 但也正因为「人」在这个等式里权重这么大,你对「人」的判断质量就变得生死攸关。 这就是为什么,当你遇到一个「看起来对的人」时,你会那么兴奋。 你遇到了一个人。简历亮眼,聊起来逻辑清晰、视野开阔,对行业的理解让你觉得「他确实想清楚了」。你们聊了一个多小时,他谈起自己想做的事情的时候眼睛里有光,不是浮夸的激动,而是经过思考的笃定。散场的时候直觉告诉你:就是他了。 你甚至觉得自己做了充分的判断。回去问了两三个朋友,评价都不错。看了融资新闻,投资方的名字你认识。又深聊了一次,信心又涨了一层。心里已经开始规划入职之后要做的第一件事了。 你签了 offer。你觉得这一次,终于跟对了人。 三种判断方式,三个结构性盲区 但这里有一个问题。一个你可能没注意到,但会决定这个选择最终走向的问题。 你判断「这个人对不对」,用的是什么方法? 仔细想想,大多数人判断一个人靠不靠谱其实只有三招。第一招是直觉:「我跟他聊下来感觉很靠谱。」第二招是光环:「他的履历很强,背后的投资人也很好。」第三招是口碑:「我认识的几个人都说他不错。」 这三招在日常场景里好使。但恰恰在「选团队」这个场景里最容易失灵。因为这三招识别的都是信号,而信号和系统之间的距离,比你以为的大得多。 我不是说你错了。这套方法在别的场景下有效,但在这个场景下有结构性的盲区。一个个来看。 先说直觉。你觉得「跟他聊完感觉很靠谱」,这个判断是怎么形成的? 心理学家 Chase 和 Simon 在 1973 年做过一个经典实验。他们让国际象棋大师看一眼真实的棋盘,凭记忆复原棋子位置。大师几乎能完美复原,远超新手。但接下来研究者把棋子随机摆放,不符合任何真实棋局的规律。这一次,大师的记忆力突然跌到和新手一样。 为什么?因为大师的「超能力」不是记忆力,而是模式识别。他记住的不是一个一个棋子,而是棋局的「叙事结构」。棋盘符合已知模式时,大脑自动补全。模式被打乱,能力就失效了。 这跟你选团队有什么关系?关系太大了。 「大厂高P出来创业,拿了一线基金,做的是热门赛道。」这些信号组成了一个你熟悉的「成功模式」。你的大脑自动启动补全机制:现金流?「一线基金投了,没问题。」决策质量?「大厂管过几百人的团队。」你以为自己在判断,其实在做模式匹配,把缺失的信息用「合理推断」填上了。 但创业不是随机摆的棋子,它有它的规律。问题在于,这个规律的变量比棋盘多太多了,结果的分布更极端,反馈周期也长得多。你从一个人的履历、融资这些有限信号里推断「这个团队能运转」,误差会被放大到你想象不到的程度。你的模式识别能力,在这里不是帮你判断,而是帮你跳过判断。 更麻烦的是,一旦大脑倾向于一个选择,认知能力不会帮你找反对理由,它会帮你找支持理由。你越聪明,找到的理由越像样。公司突然裁掉一个干得不错的人,没给任何说法。你心里不舒服,但转念一想:「他管过那么大的团队,判断维度肯定比我多。」你用自己的聪明帮他合理化了一个本该让你警觉的信号。能力没有成为纠错器,反而成了偏见的放大器。 聪明人踩的坑有一个特殊性:每一个错误决策都穿着「逻辑自洽」的外衣。不是盲目相信,是「理性地」说服了自己。这种错误特别难修正,你很难从一个自认为「理性」的错误中学到教训。 再看光环。 光环的问题不在于「没有信息量」,而在于它提供的信息量和它在你脑中占据的权重不成比例。 一个很多人没想过的问题:大厂教会一个人的能力,和创业需要的能力,是同一种东西吗? 在大组织里,成功的底层逻辑是「优化已知」。方向是上面定的,用户基数是平台给的,增长预算是公司批的。你的厉害之处在于把转化率从3%做到5%,把日活从一千万拉到五千万。但这有一个隐含前提:有人已经替你验证了方向是对的。 创业需要的是「验证未知」。方向本身不确定,没有用户基数,没有现成资源。你要做的不是把对的事做得更好,而是在一堆错的事里找到那件对的。这不是难度不同,是物种不同。 有一种创业团队特别常见:创始人从大厂出来,核心班底全是老同事,融资 PPT 第一页就是一排大厂 logo。但他们的默契建立在大厂的资源、流程和安全网上。离开那个系统,面对的不再是从80分到90分的优化题,而是从0到1的生存题。过去的默契不但帮不上忙,甚至变成路径依赖。他们会本能地用大厂的方法论去解一个根本不是大厂的问题。 打个比方,光环可能把创业成功率从3%提高到了5%。这不是精确统计,只是为了说明一个感知上的落差:光环带来的实际优势远没有你以为的那么大。但人们心里感知到的提升是从30%到70%。这个感知差距,就是聪明人反复踩坑的心理基础。 我不是说光环毫无价值。这些信息不是零。但看到光环之后不要停在那里,继续追问背后的东西。只看光环就做决定,那做的不是判断,是自动补全。 最后一招:口碑。 你入职前找了三个人打听。三个人一致说「老板人很好,很有格局」。你放心了。后来才知道,这三个人都是创始人从老东家带过来的嫡系。那些待了半年就走的人,你一个也没问到。你的「尽调」样本,被幸存者偏差扭曲了。 口碑的问题还不止于此。哪怕你问到的人是客观的,「他人很好」本身信息量也有限。因为信号的伪造成本和验证成本不对称。「我们的文化是扁平、透明、尊重人」,说出来十秒钟,验证它需要你在里面工作六个月。 这里要说一件事。这篇文章不是在说创始人是骗子。大多数创始人是真诚的。但真诚不等于正确,善意不等于能力。一个「真诚地相信明年能融到钱所以今年先不发年终奖」的创始人,和一个刻意画饼的创始人,对你的实际影响没有区别。你的年终奖都没了。所以你要判断的不是「他是不是好人」,而是「这个组织的系统能不能运转」。好人在烂系统里,也会做出让你付出代价的决策。不是因为他变坏了,是因为结构在奖励那种行为。 没人想戳破的信号泡沫 但为什么偏偏是这三招成了你最依赖的判断方式? 答案让人不太舒服:因为双方都从中获益。不是一方在骗,另一方在被骗。是双方都有动力让这个游戏继续。 创始人一方,包装光鲜信号收益大、成本低、风险小。讲一个好故事不花钱,大多数候选人在入职前根本不会追问到系统层面。 你这一方,也有动力去相信。相信意味着可以跳过繁琐的尽调,意味着做了一个「聪明」的选择,意味着即将加入一个有前途的团队。而质疑呢?质疑意味着要面对焦虑,要放弃让你激动的机会,要承认自己的判断可能有问题。当你已经在心理上倾向于接受一个 offer 的时候,大脑的首要任务不是「找出问题」,而是「确认它是对的」。 卖方有动力包装,买方有动力相信。一个稳定的「信号泡沫」就这么形成了。你的加入还会强化泡沫。「连他都去了,说明真的不错。」更多人被吸引进来,泡沫越滚越大,直到有一天现实击穿叙事。 朋友圈还是体检报告 那到底该看什么? 用一个类比来说。判断一个人的健康状况,你看他的朋友圈还是体检报告?朋友圈是「展示出来的健康」:跑步打卡、晒健康餐、精神饱满。体检报告是「运行中的健康」:血压、血糖、肝功能。朋友圈可以完美无缺,体检报告一塌糊涂。 判断团队也一样。创始人的演讲风格、融资新闻、办公室氛围,这些是朋友圈。工资是否按时发、加班制度有没有白纸黑字、「融资不顺怎么办」能不能用数字回答,这些才是体检报告。大多数人选团队的方式,就像看着一个人的朋友圈判断他还能活多久。我知道这个类比听起来刺耳,但信息不对称的本质就是这样。 选团队说白了是在「信息极度不对称下做高风险投资决策」。你投入的不是钱,而是比钱更不可逆的东西:一到三年的时间、职业声誉、身心健康。投资人可以做组合,投一百个项目有一个成了就够回本。你不能做组合,两到三年只能 all in 一个团队。从风险管理的角度说,你应该比投资人更审慎。但现实反过来:投资人有尽调流程,你靠感觉。 这就引出了一个根本性的区分。信号,是别人想让你看到的东西。系统,是你需要自己去验证的东西。你不可能通过堆积更多信号来替代对系统的验证。信号不是垃圾,它是你的起点。但起点不等于终点。你需要用系统层面的验证去更新你最初的判断,而不是停在起点上不动。 三个系统:信用、决策、经济 那「系统」具体是什么?拆成三个部分。 先说一句:这套框架不是放之四海皆准的。它对「组织越小、信息越不对称、创始人权力越集中」的场景越关键。在成熟的大组织里,很多系统级的保障已经内置了,HR、合规、流程都在替你做一部分把关。但哪怕在大公司,「直属上级就是你的微型生态」这个逻辑仍然成立。你的上级怎么用权力,这套框架一样适用。 第一个,信用系统。核心问题:这个组织是用契约在运转,还是用话术在运转? 举一个你可能经历过的场景。谈 offer 的时候你问年终奖怎么算,HR 说「看公司情况,一般两到四个月」。你追问能不能写进 offer,HR 笑着说「这个真写不了,但我们从来没少发过」。你签了。年底,拿到了零。找 HR 理论,对方翻出 offer 说「上面确实没写」。 ...

二月 14, 2026 · 1 分钟 · 7187 字 · Miss-you

为什么有些人越忙越穷,有些人越闲越富

为什么有些人越忙越穷,有些人越闲越富? 四个故事 下面这些故事,是我从身边和网上常见的模式里拼出来的,细节做了简化。 小雨每天学到凌晨一点。笔记记了十二本,错题本工工整整抄了三遍。她妈妈心疼,但也骄傲,至少孩子在努力。她的同桌小凡每天十一点就睡了,但小凡做了一件不同的事。把每次模考的错题按知识漏洞分类,每一类只做三道典型题,然后讲给同桌听。期末考试,小凡比小雨高了40分。 这个例子不涉及钱。但它说的那件事,出了学校同样成立。 张琳是一家中型公司的市场总监。周五晚上十一点,她还在改第二天要给老板汇报的PPT,措辞改了五遍,每个像素都调到完美。第二天老板花三分钟翻完,说了句「方向可以,推进吧」,然后去打高尔夫了。她改到凌晨,他三分钟定方向。到底谁的时间更值钱? 不只是打工人。自己单干也一样。 设计师小陈在闲鱼接logo设计,一单500块,改三次,前后花两天。一个月满打满算15单,7500块。春节想多挣点,把自己逼到每天只睡五小时,差点进医院。他的一个朋友做了一套Figma设计模板放在Gumroad上,定价99美元,每月被动收入两三千美元。那朋友现在每天下午三点去咖啡馆坐着。一个在用命换钱,一个睡着都在赚。 再看一个你每天路过的场景。 你家小区门口有个煎饼摊。大叔凌晨四点半出摊,站到上午十一点,一天卖150个煎饼,一个赚两块,日入300。他干了八年,每天都是这个数字,因为他的产能上限就是一双手、一口锅、七个小时。抖音上有个人拍了一条「教你在家摊煎饼」的视频,三分钟,播放量两百万。他靠这个号接了一个厨具品牌的年度代言,五十万。 同样的知识。一个被一双手和一口锅锁死,一个被算法放大了几百万倍。 你有没有注意到一件反常的事?在这四个故事里,最忙的那个人,收入最低。看起来最闲的那个人,收入最高。 这不是巧合。努力和产出之间,从来不是一比一的关系。 两种努力 要理解为什么忙碌不等于高产出,得先分清两种根本不同的努力。 第一种叫线性努力。你投入多少时间,产出多少成果,一比一绑定。多干一小时,多赚一小时的钱。第二种叫杠杆化努力。你做一次,被放大一万次。投入和产出脱钩了,不在同一个维度上。一个人每天工作十六小时,没有杠杆,上限就是十六小时的劳动成果。另一个人每天工作四小时,但他写的代码在替一百万人解决问题。 厨师一天最多炒三百盘菜。无论他多勤奋,上限就卡在那里。但如果他把最拿手的菜谱写成标准化流程、教会五十个学徒,这个系统每天能产出一万五千盘。手艺没变,变的是放大倍数。 麦当劳的创始人雷·克罗克不会做汉堡。但他设计了一个让任何人都能做出标准汉堡的系统,每天替他服务近7000万人。麦当劳不是餐饮公司,是系统复制公司。克罗克本人很闲,但他比任何一个忙碌的厨师都富。 其实杠杆不是一个开关,不是「有」和「没有」两种状态。它更像一道阶梯。 最底下一级是纯执行。一双手,一口锅,干一小时算一小时,杠杆倍数是零。往上走一级,你把干活的经验记下来了,变成笔记、变成模板。下次再干同样的事,快了一倍,这就有了一点点杠杆。再往上,模板变成流程,流程交给别人跑,你用人力把自己复制了出去。再往上,流程写成代码,或者做成产品,它不需要任何人盯着就能跑,一天跑二十四小时也不累。最顶上那一级是资本和媒体,钱在替你做决策,内容在替你触达陌生人,你睡着的时候它们还在干活。 代码、媒体、流程、人力、资本,这五种东西本质上都是杠杆,只是放大倍数不同。设计师从接单到做模板,就是从纯执行跳到了产品那一级。煎饼大叔如果把手艺写成流程、教会十个人,就是从零杠杆跳到了人力那一级。每往上走一级,你的时间和产出就脱钩一点。不用一步到顶。先把今天干的事记下来,就已经在爬了。 一个残酷的测试 有一个残酷的测试可以判断你在哪条轨道上。如果你明天倒下了,收入会不会也跟着倒下? 如果会,不管你名片上印的是「自由职业者」还是「CEO」,你卖的都是时间。很多人以为自己跳出了卖时间的陷阱,其实只是换了一个更贵的时薪在卖。从按月卖变成按小时卖,从卖给一个老板变成卖给十个客户。模式没变。 真正从「卖时间」跳到「卖系统」的人,做了一件不同的事。把自己解决问题的方式变成了一个产品。一段代码、一套流程、一个品牌。产品的特征是你造了一次,它可以卖一万次,不需要你在场。Eric Barone一个人、一台电脑、四年半,做出了全球销量超4000万份的星露谷物语。代码在替他7×24小时卖货。同样是忙四年,有人忙出了一份工资,有人忙出了一台永不停歇的印钞机。区别就在这里。你忙的那件事,做完之后还在不在替你工作? 你可能在想,星露谷物语、麦当劳,这不都是幸存者偏差吗?没错,这些是极端值。用了杠杆不保证你成功。但我想说的不是「用杠杆就能暴富」,而是「不用杠杆就一定有天花板」。这是两个完全不同的命题。前者是彩票逻辑,后者是物理约束。一天只有24小时,你的产出上限就卡在那里。杠杆不保证你赢,但没有杠杆,保证你赢不大。 不过事情没那么干净。杠杆放大的是能力,如果能力本身还没长出来,放大一万倍也是零。在练基本功的阶段,老老实实把手艺磨扎实,就是对的策略。杠杆不能替你跳过那一步。 另外,不是所有行业的杠杆都长得像代码和短视频。一个外科医生的杠杆可能是流程和团队,一个手工匠人的杠杆可能是品牌和学徒体系。形态不同,但逻辑一样,都是把个人能力从一双手里解放出去。 还有一件容易忽略的事。杠杆在放大收益的同时,也放大了波动。写代码做产品可能花半年一分钱没赚到,发内容可能两百条都没人看。不是每个人当前的处境都适合承受这种不确定性。承认这一点,不丢人。 这里有个问题。权力、人力、资本这些杠杆都需要许可。你得先当上领导、先有钱、先有信用,才能动用。 但代码、AI和社交媒体不需要。你今晚就可以开始写一个小程序、发一条内容、用AI搭一个自动化工作流。没有人需要给你一把钥匙,钥匙已经放在桌上了。这是人类历史上第一次,几种强大的杠杆工具,门槛低到接近免费。考公上岸的同学需要层层审批才能做一个决定。做短视频的同学一个人、一台手机,前一年半零收入,被父母天天骂不务正业,最近半年突然爆了,一条广告报价五万。他用的就是不需要任何人许可的媒体杠杆。 我猜你现在想说。道理我都懂,但我连睡觉的时间都不够,哪有空建系统? 这个反驳是对的。不是所有人都有「停下来」的条件。有些人的忙碌不是选择,是没有选择。但没有人要求你明天辞职去创业。杠杆可以从极小的地方开始。你每天重复做的那件事,能不能写成一个模板?你踩过的坑,能不能记下来变成别人也能用的经验?从「完成任务」到「积累资产」,有时只差一个意识的转变。 如果你还是觉得太抽象,试试这样。学生党,把这学期反复出错的那类题整理成一页速查表,发到班群里。你自己搞懂了,同学也省了翻课本的时间,这张表就是你的第一个杠杆。上班的,想想每周重复做的那份报告,能不能花一个下午写成自动化模板?搭一次,以后每周省两小时,一年省掉一百小时。自由职业的,你一定有一个问题被客户反复问。把回答写成一篇FAQ文档,下次直接甩链接,省下来的时间去接下一单。 方法很简单。每周列一下自己重复在做的事,挑最烦的那件,写成模板或文档,下周看看是不是真的省了力气。如果省了,恭喜,你有了一个可复用的资产。如果没省,换一件再试。一周一个小实验,成本几乎为零。 判断标准也很简单。杠杆不是做更大的事,而是让同一件事下次更省力,能被更多人复用。 但这还不是全部。如果杠杆的逻辑这么清楚,线性努力有天花板,杠杆化努力的天花板高得多,为什么大多数人还是困在第一种模式里? 三把锁 不是因为笨,也不是因为不想改变。真正卡住人的,是比「知不知道杠杆」更深一层的东西。 第一把锁,大脑。 人的大脑偏爱确定性和即时反馈。线性努力恰好满足这两点。你多干一小时,多赚一小时的钱,大脑的奖赏回路持续激活。而杠杆化努力的早期是反馈黑洞。你花六个月写一个产品,可能一分钱没赚到。你发了两百条内容,播放量还是个位数。大脑讨厌这种延迟回报。这不是意志力问题,是进化留下的神经机制。狩猎采集时代,「这棵树上有果子」比「半年后那块地会长出庄稼」重要一万倍。我们的大脑还在用旧世界的评分系统给新世界的选项打分。 所以线性增长让人上瘾。每年涨薪10%,每月多接几个客户,你觉得生活在变好。但如果你画出那条曲线,它是一条直线。直线的特征是有尽头。你一天能工作的时间是有限的,那就是你的产出天花板。无论你多勤奋,你都不可能把一天活成四十八小时。 线性增长不是增长,是一种伪装得很好的天花板。但因为它有即时反馈,人们宁愿在天花板下安心地忙碌,也不愿走进那条看不见终点的隧道。 第二把锁,文化。 「勤劳致富」是工业时代的逻辑。工厂需要工人按时到岗、按件计酬,所以「投入时间=创造价值」在那个时代是成立的。整个社会的道德体系、教育体系、评价体系都围绕这个等式搭起来。学校按出勤打分,公司按工时考核,社会按「看起来忙不忙」评价一个人。「我很忙」成了一种社交货币,暗示你被需要、有价值。知识经济早就改变了游戏规则,但我们的道德直觉没有跟上。 我们把忙碌当成勤奋的勋章。但仔细看,它更像一份诊断报告。一个人必须事事亲力亲为,不是因为他不可替代,而是因为他还没有建起任何一个替他工作的系统。CEO可以去度假三周,公司照常运转。不是因为他懒,是因为他花了多年搭了一个不依赖他在场的组织。 忙碌不是价值的信号。它是系统还没建好的信号。 第三把锁,参考系。 煎饼大叔每天出现在你面前,你看到他的辛苦。但那个拍煎饼视频赚五十万的博主,你看不到他前一年半零收入、被父母骂不务正业的阶段。杠杆的建造过程是不可见的,只有结果是可见的。所以大多数人的参考系里,根本没有「杠杆化努力」这个选项。你不知道它存在,不去寻找相关信息,社交圈也都是卖时间的人,就更加确信努力是唯一的路。这是一个自我加强的闭环。 三把锁同时锁住。大脑、文化、参考系,都在把你推向同一条路。更忙、更累、更多时间换更多产出。 怎么打开 要打开这些锁,第一步不是找工具,不是学技术,而是接受一个听起来很荒谬的说法。 真正的勤奋,不是永远在忙,而是让自己闲下来。 这里说的「闲」,不是什么都不做。而是把忙的内容从「执行」迁移到「建系统」,让系统替你执行。 有一种勤奋是每天忙到深夜,日程排得密不透风,倒头就睡,第二天再来一遍。还有一种勤奋是花大量时间思考一个问题。我怎么才能不再需要做这件事?前者的结局是越来越忙。后者的结局是越来越闲。但那个闲不是偷来的,是建出来的。 我知道你在想什么。这不是给懒惰找借口吗? 这个担心合理。但懒惰是逃避投入。我说的「闲」不一样。你先拼命建了一个系统,然后系统替你忙。一个是起点的闲,一个是终点的闲。区分方法很简单。懒的人闲完之后什么都没留下,建系统的人闲完之后多了一个替他工作的东西。 还记得那个改PPT到凌晨的张琳吗? 她的问题不是不够努力。她可能是整个公司最努力的人。但她所有的努力,都花在杠杆的长臂末端,做的是最容易被替代的执行工作。也许有一天,她不是在改PPT,而是在设计一个让团队自己就能做出好PPT的流程。那时候她也许会更闲。但那个闲,不是因为她放弃了,而是因为她终于建好了一个不需要她在场的系统。 我不确定每个人都能找到自己的杠杆。但我确定的是,如果你从来没想过这个维度,你连找的机会都没有。也许真正难的不是找到杠杆,而是放下「忙碌=有价值」这个让你安心了二十年的等式。

二月 14, 2026 · 1 分钟 · 4629 字 · Miss-you

当浏览器自动化遇上平台风控:一次小红书发布工具的反检测实战

当浏览器自动化遇上平台风控:一次小红书发布工具的反检测实战 事情的起因很简单。我需要一个工具,自动把内容发布到小红书。 打开创作者中心,上传几张图,填标题,写正文,加话题标签,点发布。一篇两篇没问题,但每天要发几十篇的话,纯体力劳动。 自然想到浏览器自动化。写个脚本,模拟人在浏览器里的操作。 但我低估了难度。Playwright 的 API 很好用,模拟点击、填写、上传都有现成的方法,编码不难。难的是小红书的风控系统会识别出你在用自动化工具,然后封你。 下面是从被风控到稳定运行的调试记录,踩了 7 个坑。 为什么得用浏览器自动化 国内的内容平台,小红书、抖音、公众号,都不提供公开的发布 API。 海外不一样。Twitter、YouTube、Medium 都有 API,HTTP 请求直接发内容。国内平台对内容管控更严格,API 只给少数合作伙伴,普通开发者拿不到。 所以你想自动化发内容,只剩一条路。用代码打开浏览器,模拟人的操作。 主流工具有 Selenium、Playwright、Puppeteer,干的事情一样。启动一个浏览器实例,通过协议控制它。 但平台也不傻。 传统方案怎么被检测的 用 Playwright 的 launch() 启动浏览器,这个浏览器从出生那一刻就带着「自动化」的印记。风控脚本查几个点就够了。 最直接的是 navigator.webdriver。正常浏览器里这个值是 undefined,但 Selenium 和 Playwright 启动的浏览器是 true。一行 JS 就能判断。 1 2 3 if (navigator.webdriver) { // 自动化工具,触发风控 } 然后是浏览器指纹。UA 字符串可能带 HeadlessChrome,WebGL 渲染结果不同,Canvas 指纹不同,屏幕分辨率是固定的默认值。单个差异不起眼,组合起来就是明确的信号。 还有操作节奏。机器操作太整齐了,每次点击间隔恰好 500ms,输入速度完全一致。真人会犹豫,会停顿,快慢不一。 最后是「生活痕迹」。自动化启动的浏览器是全新实例。没有浏览历史,没有书签,没有扩展,没有其他网站的 cookies。像一个刚出厂的手机。 风控不需要多精密。它只问一个问题:这个浏览器环境真实吗? 不真实就触发验证码、限制发布、标记异常。 小红书自动发笔记 先说我要做的事。 写一个 Python 脚本。打开小红书创作者中心,登录,上传图片,填标题正文,加话题标签,点发布。 用 Playwright 写这个流程不难。page.click()、page.fill()、page.set_input_files() 都能直接用。 第一次跑,成功了。 第二次,还是成功。 第三次,弹了个滑块验证码。手动过了,继续。 ...

二月 13, 2026 · 7 分钟 · 12828 字 · Miss-you

追赶者困境

谈到 LLM 产业,很多人会说「追赶者优势」。后发者少踩坑,跟进成本更低。真格基金合伙人戴雨森在张小珺的年终对话里讲得直接:美国头部实验室的高投入,「无法阻止中国模型低成本跟进」。 这种信心不是凭空来的。中国互联网最成功的公司之一,就是靠后来居上起家的。 QQ 不是第一个即时通讯工具,ICQ 才是。微信支付起步比支付宝晚了十年。《王者荣耀》也不是第一款 MOBA 手游。但腾讯每次都追上来了,而且经常超过去。 这些案例太深入人心了。以至于「追赶者优势」在中国互联网圈几乎成了默认叙事——别人趟过的坑我跳过去,别人教育过的市场我直接收割。 但追赶不是万能的。有一个领域,腾讯追了十年,追得很辛苦。这个后面再说。 2025 年国产模型在 coding 维度的跃迁很明显。智谱的 GLM-4.5 技术报告里,直接用 Claude Code 做智能体编程评测,把工程任务当作主战场。能力追上来了,速度比很多人想的快。 能力追上来了。但追上来之后呢? 2024 年 5 月那波大模型 API 降价把这事讲得直白。省下来的不是利润,是下一轮报价单里的让利空间。 5 月 21 日阿里云降价 97%。几小时后百度免费。第二天腾讯云免费。火山引擎更狠,0.0008 元/千 Token,比市面便宜 150 倍。 价格表里的零越来越多。所谓「追赶者优势」在商业上经常是句反话。后发者确实少踩坑,但省下来的钱,最后往往被迫用来把行业价格打穿。 投资人也信这套。不止一位投资人反馈,路演时听到「成本只有 OpenAI 的十分之一」,觉得是好消息。直到他们发现,每个来路演的团队都在讲同一个故事。当每个人都在讲同样的差异化故事,差异化就不存在了。 这个叙事太顺滑了。后发者省钱、少踩坑、站在巨人肩膀上。但有件事很少有人问:能力差距缩小了,利润差距缩小了吗? 能力追赶可以测量。benchmark 上的数字不会骗人。但价值捕获是另一回事。它藏在用户习惯里、藏在生态锁定里、藏在「虽然你也行,但我懒得换」的惯性里。追平功能只是入场券,利润池可能根本不在功能这个维度上。 追赶者优势的叙事默认一件事。你追的是一个「东西」。一个模型,一个产品,一个技术指标。追上了就算赢。 但 LLM 产业的领先者卖的不是模型。OpenAI 卖的是用户习惯,是 API 生态,是「出了问题有人兜底」的信任。你蒸馏出一个差不多强的模型,能蒸馏出这些吗? 这件事在云计算里发生过一遍。你以为追的是某个产品能力,实际上追的是一套会自我强化的商业系统。腾讯云追阿里云,就是一个把「追赶者困境」讲穿的案例。 腾讯云有人复盘过。2016 年觉得追阿里云只是时间问题,有钱有人。后来才明白,追的不是产品,是一个会自己滚雪球的系统。 2014-2016:红利期 2014 年手游市场爆发。腾讯是游戏霸主,自家游戏和被投公司自然都跑在腾讯云上,后来的《王者荣耀》把这个优势推到极致。2015 年直播行业爆发,斗鱼、虎牙等直播平台与腾讯云有公开合作案例,直播平台对 CDN 和音视频基础设施的需求,构成腾讯云早期增长的重要来源。追赶者优势的甜头,腾讯云吃到了。 2016-2018:困难显化 但 2016 年,阿里云在见市长。 2016 年云栖大会,王坚博士发布「城市大脑」,不跟政府官员讲 KV 存储、负载均衡,讲「用数据治理拥堵」「让城市会思考」。这把云计算销售层级直接拉到一把手工程。阿里云销售铁军拿着这个概念,全国各地见市长、见局长,疯狂跑马圈地。马云同年提出「五新」战略,全集团 All-in 数据化。客户的感觉是。买了阿里云,我就拥有了阿里巴巴的数字化能力。 「城市大脑」能把销售层级拉到「一把手工程」,不是概念喊得响,是从一开始就选了市长最在意、最容易量化的切口。治堵。 ...

一月 13, 2026 · 2 分钟 · 7812 字 · Miss-you
设计游戏的人,才不会被游戏玩

像玩游戏那样玩 AI

像玩游戏那样玩 AI 1/4 一个反直觉的问题 凌晨两点十七分,你对自己说「这是最后一条」。两点四十三分,你又说了一遍。 第二天早上,你下载了一个 AI 工具。用了五分钟,关掉了。图标沉到第三屏,再也没打开。 你对抖音没有学习意愿,但能刷三小时。你对 AI 充满学习意愿,但用不了十分钟。 我们通常会把它归结为:没时间、不够感兴趣、工具不顺手。 这些当然都可能成立。 但我后来发现,更常见的卡点是:短视频把「下一步」替你安排好了,而 AI 没有。你得自己把它放进流程里。 2/4 上瘾不是问题,问题是对什么上瘾 我们习惯把「上瘾」当贬义词。但仔细想想,上瘾的本质是什么? 做了一件事,得到奖励,想再做一次。 这套东西本身没好坏。它可以让你停不下来地刷视频,也可以让你停不下来地写代码、练琴、健身。 问题不在于你上瘾了,而在于谁在设计这个循环。 抖音的产品经理设计了一个算法,它比你更了解你。你以为在选择看什么,其实在被推着走。滑一下,奖励来了。再滑一下,又来了。继续不费力,停下才费力。 这就是被动上瘾。别人设计机制,你被卷入。 主动上瘾正好反过来。你自己设计机制,你选择卷入。 这里说的「上瘾」不是让你沉迷时间。而是让你不用靠意志力也能开始,但产出要能落到一个真实任务上。如果只是刷起来没有产出,那跟刷视频没区别。 你不是没有自制力。你只是一直在别人的游戏里玩。 2.5/4 一个容易混淆的地方 这里有个常见的误解:很多人觉得自己「用不起来 AI」是因为不够喜欢它。 但你对抖音也谈不上喜欢。你只是打开了手机,它就播了。 「喜欢」和「顺手」是两回事。 喜欢是情绪,会波动。今天喜欢,明天可能就腻了。 顺手是结构。它不依赖你当时的状态,只依赖「开始的摩擦有多低」和「反馈来得有多快」。 短视频强在这里:每一次滑动都是一个「可关闭的最小单元」。做完就结束,没有压力,随时可以再来一次。 而「学 AI」听起来像一个无限任务,给人压力。但「用 AI 改一句话」是一个可关闭的任务,做完就结束。 AI 用不起来,很多时候不是「不有趣」,而是「开始太像一件需要决心的事」。 3/4 两条规则,不是十条清单 有个叫福格的行为学家说过:行为 = 动机 + 能力 + 提示。 动机会波动,能力也确实会成为门槛,尤其是不知道怎么问、怎么用结果的时候。 但最容易被忽视、也最容易立刻改的,往往是「提示」:你有没有给 AI 安排一个默认出场的时刻。 没有这个时刻,AI 就永远停留在「我应该用」的层面。 所以我试下来,真正有用的就两条规则: 规则 1:默认出场时刻 找一个你每天都会做的事,把 AI 绑上去。 比如:打开文档 → 先让 AI 改第一段。不是因为你需要 AI 改,而是让「打开文档」自动触发「用 AI」。 ...

十二月 29, 2025 · 1 分钟 · 2135 字 · Miss-you

我,一个重度极客用户,为什么觉得这代 AI 眼镜不适合我

我,一个重度极客用户,为什么觉得这代 AI 眼镜不适合我 ——以夸克 AI 眼镜为例 过去一年,我陆续体验了几款 AI 眼镜:包括带显示的那种(比如 Rokid 这一类),也包括不带显示、偏音频和拍摄的形态。与此同时,我一直在关注阿里系的夸克 AI 眼镜,从技术规格、评测视频到功能介绍看得比较细,即便体验过朋友的夸克 AI 眼镜后,也没有真正下单。原因很简单: 对我这种重度极客用户来说,这一代 AI 眼镜——以夸克 AI 眼镜为代表——还没有真正跨过《跨越鸿沟》里那条“鸿沟”。 下面我会用 Geoffrey Moore《跨越鸿沟》的框架,系统性拆解一下:为什么我不认为夸克 AI 眼镜是「我需要的东西」。(Wikipedia) 一、先说框架:《跨越鸿沟》给我的几个关键问题 《跨越鸿沟》讨论的是:高科技产品如何从早期发烧友,跨越到主流用户。书里提出了一个技术采用生命周期:创新者、早期采用者、早期大众、晚期大众和落后者,并强调早期采用者和早期大众之间存在一条“鸿沟”。(Wikipedia) 对我来说,最实用的几点工具是: 目标细分市场 不要一上来就说「面向所有人」,而要选一个足够具体的小人群,作为“登陆海滩”。 非买不可的理由(Compelling Reason to Buy) 对那一小撮人来说,这个产品必须解决一个「不用会很痛、用了会明显轻松」的问题。 完整产品(Whole Product) 不只是硬件和几个功能,而是包括:配套软件、服务、生态集成、品牌和渠道在内的完整解决方案。 心智定位(Positioning) 在用户脑子里,它到底被当成什么品类?耳机?相机?翻译机?还是「下一代终端」? 价格 & 使用频率 价格要和「我一年真实会用它多少次」匹配,否则就会被归类为“昂贵玩具”。 带着这套问题,我再看夸克 AI 眼镜,就会发现:它离「跨过鸿沟」——至少对我这种人——还有一段距离。 二、我是谁:一个站在“鸿沟边缘”的重度极客 先讲清楚我的位置。 我是典型的数字重度用户:手机、电脑、iPad 多设备切换,对各种 AI 工具、语音输入、会议转写软件都很熟。 我乐意为新玩具买单,但前提是: 要么解决了我实实在在的痛点; 要么让我「爽到爆」,情绪价值很高。 我的日常工作以知识劳动为主,会大量阅读论文、写东西、开线上会议。 用《跨越鸿沟》的话说,我更像是早期大众的前沿,而不是纯粹的“极客玩具收藏家”:我有技术好奇心,但不会为「只有炫技没有刚需」的硬件掏 4000 块。 所以,如果这代 AI 眼镜连我都打不动,那它要跨越到真正的主流用户,其实还挺难。 三、夸克 AI 眼镜到底在卖什么故事? 先基于公开信息快速勾一下夸克 AI 眼镜 S1 的轮廓: ...

十二月 11, 2025 · 3 分钟 · 7287 字 · Miss-you

从「写代码」到「验代码」:AI 搭档写走 3 年,我踩出来的协作路线图

当 30% 代码都由 AI 写出来,我们该把时间花在哪? 从「写代码」到「验代码」的三年实战笔记 2022 年,我第一次在生产项目里用上 VS Code 的 Copilot,用它来写一个再普通不过的后端接口:登录、校验、打点日志。 我刚给函数写好名字、入参和返回值,函数体还一行没写,编辑器底部就灰出来一整段代码:参数校验、错误码、日志风格,甚至连变量命名都和我平时写得差不多。 那一刻我心里只有一个念头:「AI Coding 好牛!」 两小时后,测试环境里一个边界场景直接 panic,把服务干崩,罪魁祸首正是这段看起来「标准又优雅」的自动生成代码。那晚我第一次很具体地意识到:AI 写代码最危险的地方,不是它写不出来,而是它写得「看起来对,其实不对」。 三年过去,到 2025 年,各大厂公开的数据和访谈里不断提到类似的数字:工程师新写的代码里,大约 20%–30% 已经是 AI 生成的,一些激进团队甚至做到 50%。 但很多已经上手 AI Coding 的工程师,包括当时的我自己,却有很相似的感受:写的代码变多了,背的责任更重了,人反而更累。 我叫厉辉,网名 yousa。在大厂写了很多年后端,也在开源社区混过几轮(当过 Apache 项目贡献者和 CNCF Ambassador)。从 2022 年开始,我几乎每天都在和各种 AI Coding 工具打交道:从 VS Code 里的 Copilot,到 Cursor、Windsurf,再到 Codex、Trae SOLO 这一类更「重」的 Agent。 这篇文章写给已经在或准备在真实生产项目里用 AI Coding 的后端 / 全栈工程师和技术管理者。 它不会教你「按钮在哪里」「哪个 prompt 最神」,而是想在大约 15 分钟里,帮你搞清楚三件事: 哪些任务交给 AI 最「划算」 怎么让项目本身变得更「AI 友好」,提高一次命中率 当生成不再是瓶颈时,工程师应该如何设计验证流程,把时间花在真正值钱的地方。 文中的例子主要来自互联网业务后端,但你可以类比到自己的技术栈。 ...

十一月 24, 2025 · 4 分钟 · 12954 字 · Miss-you

Claude Code 还是 Codex?贵但强 vs 便宜但稳

纠结 Claude Code 还是 Codex?一个贵 4 倍但 SWE-bench 高 3%,一个便宜但社区说"更稳定"。这里有最短路径:同一仓库、同一任务的端到端实测——从 UI 克隆到推荐管线,看清每一分钱花在哪。 摘要 同样预算写更多代码 → Codex 更完整不敷衍 → Codex,更倾向完成整个 PR 并补测试 数据分析与快速原型 → Codex,更便宜,开发循环更稳定 代码质量 → Codex,代码质量和规范性更好 前端 UI 还原度 → Claude Code,UI 保真度更高 大规模重构 → Claude Code,更擅长大规模架构调整 复杂任务与系统操作 → Claude Code,SWE-bench 77.2,OSWorld 61.4 首字响应速度 → Claude Code,Vertex TTFT ≈1.67s 超长上下文支持 → Claude Code,多云部署可达 1M 上下文 成本控制与调优 → Codex,可调推理深度,灵活控制速度和费用 端到端项目成本 → Codex,约 $2.50 vs Claude 约 $10.26 表现稳定性 → Codex,运行稳定,调试循环更可靠 文档写作 → Claude Code,文档生成质量更高 图表生成(XML/PlantUML) → Claude Code,结构化图表生成更擅长 端到端开发成本对比 Composio 在同一仓库、同一 MCP 环境下做了实测对比,汇总了不同场景的 Token 与成本差异: ...

十月 16, 2025 · 4 分钟 · 6080 字 · Miss-you

为什么所有产品最后都要长出社交?

为什么想聊这个 最近在听极客公园关于 Sora/Cameo 的对谈,听到 Lovart 创始人陈冕说的这句话「最大的 ToC 应用就是社交」。 这让我想起来,过去阿里一直想做社交——不论是支付宝、淘宝、闲鱼,都曾经尝试过很多次社交功能。 但现在,我不想讨论这句话对不对,只是想搞清楚:陈冕为什么这么想? 我最开始的疑问是:这句话是不是过时了?毕竟 2025 年大家的时间都在短视频、游戏、长视频,谁还在"社交"? 但查了一圈历史,我发现这个观点从 2013 年就开始有人说,而且说的人越来越多。 我查到的历史 Kik 创始人 Ted Livingston 在 Fast Company 采访中直白地说:“I think everyone is realizing that messaging is the killer app in mobile."(我觉得大家都在意识到,移动端的杀手级应用是消息)。后来很多文章都引用成"移动端最大/最强的 C 端应用就是消息/社交”。 当然 201x 世代,最绕不过的自然是微信。我印象里,说起张小龙做产品,大家都会说:“移动互联网的本质是社交”。 这在产品圈就是说:“做 C 端要么做社交本身,要么让产品自带社交分发”"‘社交 + X’比’X + 社交’更容易起量"——这让我想起来王者荣耀、和平精英,都在做营地。 现在回过头来看,这个说法在 2013–2016 年是对的;但到 2025 年,情况有点变了——社交还在,但已经不是唯一抢夺你我时间的东西了。 现在我会这么说:消息/社交是互联网时代的水和电,短视频/游戏/长视频/图文/短剧/小说是让你留下来的,电商和广告就是为了赚钱的。 这个解释完整吗?我刚才分的三层,说的是现在,但没解释"为什么"——为什么所有产品最后都要长出社交? 我换了个角度想: 换个角度 我想了想自己最常用的那几个 App——Instagram、TikTok、小红书——它们的共同点:都靠关注、点赞、评论、转发这些人和人的交流来运转。我猜这不是巧合。无论是工具、游戏还是内容平台,做到后面好像都要加社交功能。可能比起新功能或新算法,我们更在意"有人在"? 比如王者荣耀、火影忍者手游,游戏 AI 的衡量指标不是有多强,而是对局留存、有多像人。 我觉得「陈冕」说"最大的 To C 应用是社交",是因为他看懂了用户为什么要用产品。用户需求像个金字塔:最下面的工具是帮你提高效率,中间的内容是让你爽,而最上面的社交,是让你觉得自己重要,被看见。 【待补充】这里还缺一块:网络效应(你朋友都在用你就不想走)、转移成本(换个 App 你的好友、聊天记录、关注、粉丝都没了)、数据护城河。.. 我还没想清楚它们和"让你觉得自己重要"之间到底是什么关系。 ...

十月 10, 2025 · 1 分钟 · 1217 字 · Miss-you