AI Coding 一年实战:从效率幻觉到能力进化

AI Coding 一年实战:从效率幻觉到能力进化 一、你以为快了 20%,实验说你慢了 19% 16 个资深开源开发者,预注册随机对照实验,使用 AI 辅助编码后客观测量完成时间慢了 19%。但这些开发者自己觉得快了 20%。主客观偏差达 39 个百分点。 这不是某个科技博主的体感分享,而是 METR(一家专注于 AI 模型能力评估的研究机构)做的目前唯一一项预注册 RCT(随机对照实验)。预注册意味着实验设计提前锁定、不能事后改假设。随机对照意味着有控制组和实验组、不是自选分组。 16 个人确实不多。但这些都是在自己长期维护的开源项目上工作的资深开发者,不是实习生在做玩具项目。一个人在自己最熟悉的代码库上,用 AI 写代码,客观上变慢了,主观上还觉得快了。这个认知偏差比「慢了 19%」本身更值得警惕。 如果只有 METR 一份数据,完全可以归为噪声。但 Faros AI 用 10,000 多名开发者的遥测数据讲了同一个故事。 Faros 按 AI 采纳程度分组,高采纳团队的个体指标全面飘红:任务完成数 +21%,PR 合并数 +98%。但组织级的 DORA(Google Cloud 旗下的 DevOps 效能研究团队)四大交付指标(部署频率、前置时间、MTTR(平均恢复时间)、变更失败率)无一改善。 个体全面提升,组织纹丝不动。这个悖论怎么解释? 答案藏在另外两个数字里:PR 体积 +154%,评审时间 +91%。 AI 帮你写了两倍的代码,打包成两倍大的 PR,然后扔给了同一个 reviewer。reviewer 的带宽没有翻倍,评审时间自然翻倍。上游加速产生的所有增量,被下游瓶颈原封不动地吃掉了。 再看信任层。三份大规模调查(DORA、Stack Overflow、JetBrains)交叉验证:90% 的开发者在用 AI,但只有 7% 总是使用,只有 3.1% 高度信任。不信任率 46%,首次超过了信任率 33%。 90% 都在用,3.1% 真信。这个漏斗的衰减速度比任何销售转化率都吓人。 1984 年,以色列物理学家 Eliyahu Goldratt 出版了商业小说《目标》。书中有个经典案例:一家工厂花重金引进了 NCX-10 数控机器人,该工位效率提升 36%,但整个工厂的交付周期和利润反而恶化了。原因很简单:NCX-10 不是瓶颈。瓶颈在热处理炉。让一个非瓶颈工位加速运转,唯一的效果是它前面堆积更多在制品,而瓶颈工位依然以同样的速度消化。系统的产出由瓶颈决定,不由最快的环节决定。 ...

三月 3, 2026 · 5 分钟 · 14167 字 · Miss-you

为什么有些人越忙越穷,有些人越闲越富

为什么有些人越忙越穷,有些人越闲越富? 四个故事 下面这些故事,是我从身边和网上常见的模式里拼出来的,细节做了简化。 小雨每天学到凌晨一点。笔记记了十二本,错题本工工整整抄了三遍。她妈妈心疼,但也骄傲,至少孩子在努力。她的同桌小凡每天十一点就睡了,但小凡做了一件不同的事。把每次模考的错题按知识漏洞分类,每一类只做三道典型题,然后讲给同桌听。期末考试,小凡比小雨高了40分。 这个例子不涉及钱。但它说的那件事,出了学校同样成立。 张琳是一家中型公司的市场总监。周五晚上十一点,她还在改第二天要给老板汇报的PPT,措辞改了五遍,每个像素都调到完美。第二天老板花三分钟翻完,说了句「方向可以,推进吧」,然后去打高尔夫了。她改到凌晨,他三分钟定方向。到底谁的时间更值钱? 不只是打工人。自己单干也一样。 设计师小陈在闲鱼接logo设计,一单500块,改三次,前后花两天。一个月满打满算15单,7500块。春节想多挣点,把自己逼到每天只睡五小时,差点进医院。他的一个朋友做了一套Figma设计模板放在Gumroad上,定价99美元,每月被动收入两三千美元。那朋友现在每天下午三点去咖啡馆坐着。一个在用命换钱,一个睡着都在赚。 再看一个你每天路过的场景。 你家小区门口有个煎饼摊。大叔凌晨四点半出摊,站到上午十一点,一天卖150个煎饼,一个赚两块,日入300。他干了八年,每天都是这个数字,因为他的产能上限就是一双手、一口锅、七个小时。抖音上有个人拍了一条「教你在家摊煎饼」的视频,三分钟,播放量两百万。他靠这个号接了一个厨具品牌的年度代言,五十万。 同样的知识。一个被一双手和一口锅锁死,一个被算法放大了几百万倍。 你有没有注意到一件反常的事?在这四个故事里,最忙的那个人,收入最低。看起来最闲的那个人,收入最高。 这不是巧合。努力和产出之间,从来不是一比一的关系。 两种努力 要理解为什么忙碌不等于高产出,得先分清两种根本不同的努力。 第一种叫线性努力。你投入多少时间,产出多少成果,一比一绑定。多干一小时,多赚一小时的钱。第二种叫杠杆化努力。你做一次,被放大一万次。投入和产出脱钩了,不在同一个维度上。一个人每天工作十六小时,没有杠杆,上限就是十六小时的劳动成果。另一个人每天工作四小时,但他写的代码在替一百万人解决问题。 厨师一天最多炒三百盘菜。无论他多勤奋,上限就卡在那里。但如果他把最拿手的菜谱写成标准化流程、教会五十个学徒,这个系统每天能产出一万五千盘。手艺没变,变的是放大倍数。 麦当劳的创始人雷·克罗克不会做汉堡。但他设计了一个让任何人都能做出标准汉堡的系统,每天替他服务近7000万人。麦当劳不是餐饮公司,是系统复制公司。克罗克本人很闲,但他比任何一个忙碌的厨师都富。 其实杠杆不是一个开关,不是「有」和「没有」两种状态。它更像一道阶梯。 最底下一级是纯执行。一双手,一口锅,干一小时算一小时,杠杆倍数是零。往上走一级,你把干活的经验记下来了,变成笔记、变成模板。下次再干同样的事,快了一倍,这就有了一点点杠杆。再往上,模板变成流程,流程交给别人跑,你用人力把自己复制了出去。再往上,流程写成代码,或者做成产品,它不需要任何人盯着就能跑,一天跑二十四小时也不累。最顶上那一级是资本和媒体,钱在替你做决策,内容在替你触达陌生人,你睡着的时候它们还在干活。 代码、媒体、流程、人力、资本,这五种东西本质上都是杠杆,只是放大倍数不同。设计师从接单到做模板,就是从纯执行跳到了产品那一级。煎饼大叔如果把手艺写成流程、教会十个人,就是从零杠杆跳到了人力那一级。每往上走一级,你的时间和产出就脱钩一点。不用一步到顶。先把今天干的事记下来,就已经在爬了。 一个残酷的测试 有一个残酷的测试可以判断你在哪条轨道上。如果你明天倒下了,收入会不会也跟着倒下? 如果会,不管你名片上印的是「自由职业者」还是「CEO」,你卖的都是时间。很多人以为自己跳出了卖时间的陷阱,其实只是换了一个更贵的时薪在卖。从按月卖变成按小时卖,从卖给一个老板变成卖给十个客户。模式没变。 真正从「卖时间」跳到「卖系统」的人,做了一件不同的事。把自己解决问题的方式变成了一个产品。一段代码、一套流程、一个品牌。产品的特征是你造了一次,它可以卖一万次,不需要你在场。Eric Barone一个人、一台电脑、四年半,做出了全球销量超4000万份的星露谷物语。代码在替他7×24小时卖货。同样是忙四年,有人忙出了一份工资,有人忙出了一台永不停歇的印钞机。区别就在这里。你忙的那件事,做完之后还在不在替你工作? 你可能在想,星露谷物语、麦当劳,这不都是幸存者偏差吗?没错,这些是极端值。用了杠杆不保证你成功。但我想说的不是「用杠杆就能暴富」,而是「不用杠杆就一定有天花板」。这是两个完全不同的命题。前者是彩票逻辑,后者是物理约束。一天只有24小时,你的产出上限就卡在那里。杠杆不保证你赢,但没有杠杆,保证你赢不大。 不过事情没那么干净。杠杆放大的是能力,如果能力本身还没长出来,放大一万倍也是零。在练基本功的阶段,老老实实把手艺磨扎实,就是对的策略。杠杆不能替你跳过那一步。 另外,不是所有行业的杠杆都长得像代码和短视频。一个外科医生的杠杆可能是流程和团队,一个手工匠人的杠杆可能是品牌和学徒体系。形态不同,但逻辑一样,都是把个人能力从一双手里解放出去。 还有一件容易忽略的事。杠杆在放大收益的同时,也放大了波动。写代码做产品可能花半年一分钱没赚到,发内容可能两百条都没人看。不是每个人当前的处境都适合承受这种不确定性。承认这一点,不丢人。 这里有个问题。权力、人力、资本这些杠杆都需要许可。你得先当上领导、先有钱、先有信用,才能动用。 但代码、AI和社交媒体不需要。你今晚就可以开始写一个小程序、发一条内容、用AI搭一个自动化工作流。没有人需要给你一把钥匙,钥匙已经放在桌上了。这是人类历史上第一次,几种强大的杠杆工具,门槛低到接近免费。考公上岸的同学需要层层审批才能做一个决定。做短视频的同学一个人、一台手机,前一年半零收入,被父母天天骂不务正业,最近半年突然爆了,一条广告报价五万。他用的就是不需要任何人许可的媒体杠杆。 我猜你现在想说。道理我都懂,但我连睡觉的时间都不够,哪有空建系统? 这个反驳是对的。不是所有人都有「停下来」的条件。有些人的忙碌不是选择,是没有选择。但没有人要求你明天辞职去创业。杠杆可以从极小的地方开始。你每天重复做的那件事,能不能写成一个模板?你踩过的坑,能不能记下来变成别人也能用的经验?从「完成任务」到「积累资产」,有时只差一个意识的转变。 如果你还是觉得太抽象,试试这样。学生党,把这学期反复出错的那类题整理成一页速查表,发到班群里。你自己搞懂了,同学也省了翻课本的时间,这张表就是你的第一个杠杆。上班的,想想每周重复做的那份报告,能不能花一个下午写成自动化模板?搭一次,以后每周省两小时,一年省掉一百小时。自由职业的,你一定有一个问题被客户反复问。把回答写成一篇FAQ文档,下次直接甩链接,省下来的时间去接下一单。 方法很简单。每周列一下自己重复在做的事,挑最烦的那件,写成模板或文档,下周看看是不是真的省了力气。如果省了,恭喜,你有了一个可复用的资产。如果没省,换一件再试。一周一个小实验,成本几乎为零。 判断标准也很简单。杠杆不是做更大的事,而是让同一件事下次更省力,能被更多人复用。 但这还不是全部。如果杠杆的逻辑这么清楚,线性努力有天花板,杠杆化努力的天花板高得多,为什么大多数人还是困在第一种模式里? 三把锁 不是因为笨,也不是因为不想改变。真正卡住人的,是比「知不知道杠杆」更深一层的东西。 第一把锁,大脑。 人的大脑偏爱确定性和即时反馈。线性努力恰好满足这两点。你多干一小时,多赚一小时的钱,大脑的奖赏回路持续激活。而杠杆化努力的早期是反馈黑洞。你花六个月写一个产品,可能一分钱没赚到。你发了两百条内容,播放量还是个位数。大脑讨厌这种延迟回报。这不是意志力问题,是进化留下的神经机制。狩猎采集时代,「这棵树上有果子」比「半年后那块地会长出庄稼」重要一万倍。我们的大脑还在用旧世界的评分系统给新世界的选项打分。 所以线性增长让人上瘾。每年涨薪10%,每月多接几个客户,你觉得生活在变好。但如果你画出那条曲线,它是一条直线。直线的特征是有尽头。你一天能工作的时间是有限的,那就是你的产出天花板。无论你多勤奋,你都不可能把一天活成四十八小时。 线性增长不是增长,是一种伪装得很好的天花板。但因为它有即时反馈,人们宁愿在天花板下安心地忙碌,也不愿走进那条看不见终点的隧道。 第二把锁,文化。 「勤劳致富」是工业时代的逻辑。工厂需要工人按时到岗、按件计酬,所以「投入时间=创造价值」在那个时代是成立的。整个社会的道德体系、教育体系、评价体系都围绕这个等式搭起来。学校按出勤打分,公司按工时考核,社会按「看起来忙不忙」评价一个人。「我很忙」成了一种社交货币,暗示你被需要、有价值。知识经济早就改变了游戏规则,但我们的道德直觉没有跟上。 我们把忙碌当成勤奋的勋章。但仔细看,它更像一份诊断报告。一个人必须事事亲力亲为,不是因为他不可替代,而是因为他还没有建起任何一个替他工作的系统。CEO可以去度假三周,公司照常运转。不是因为他懒,是因为他花了多年搭了一个不依赖他在场的组织。 忙碌不是价值的信号。它是系统还没建好的信号。 第三把锁,参考系。 煎饼大叔每天出现在你面前,你看到他的辛苦。但那个拍煎饼视频赚五十万的博主,你看不到他前一年半零收入、被父母骂不务正业的阶段。杠杆的建造过程是不可见的,只有结果是可见的。所以大多数人的参考系里,根本没有「杠杆化努力」这个选项。你不知道它存在,不去寻找相关信息,社交圈也都是卖时间的人,就更加确信努力是唯一的路。这是一个自我加强的闭环。 三把锁同时锁住。大脑、文化、参考系,都在把你推向同一条路。更忙、更累、更多时间换更多产出。 怎么打开 要打开这些锁,第一步不是找工具,不是学技术,而是接受一个听起来很荒谬的说法。 真正的勤奋,不是永远在忙,而是让自己闲下来。 这里说的「闲」,不是什么都不做。而是把忙的内容从「执行」迁移到「建系统」,让系统替你执行。 有一种勤奋是每天忙到深夜,日程排得密不透风,倒头就睡,第二天再来一遍。还有一种勤奋是花大量时间思考一个问题。我怎么才能不再需要做这件事?前者的结局是越来越忙。后者的结局是越来越闲。但那个闲不是偷来的,是建出来的。 我知道你在想什么。这不是给懒惰找借口吗? 这个担心合理。但懒惰是逃避投入。我说的「闲」不一样。你先拼命建了一个系统,然后系统替你忙。一个是起点的闲,一个是终点的闲。区分方法很简单。懒的人闲完之后什么都没留下,建系统的人闲完之后多了一个替他工作的东西。 还记得那个改PPT到凌晨的张琳吗? 她的问题不是不够努力。她可能是整个公司最努力的人。但她所有的努力,都花在杠杆的长臂末端,做的是最容易被替代的执行工作。也许有一天,她不是在改PPT,而是在设计一个让团队自己就能做出好PPT的流程。那时候她也许会更闲。但那个闲,不是因为她放弃了,而是因为她终于建好了一个不需要她在场的系统。 我不确定每个人都能找到自己的杠杆。但我确定的是,如果你从来没想过这个维度,你连找的机会都没有。也许真正难的不是找到杠杆,而是放下「忙碌=有价值」这个让你安心了二十年的等式。

二月 14, 2026 · 1 分钟 · 4629 字 · Miss-you
设计游戏的人,才不会被游戏玩

像玩游戏那样玩 AI

像玩游戏那样玩 AI 1/4 一个反直觉的问题 凌晨两点十七分,你对自己说「这是最后一条」。两点四十三分,你又说了一遍。 第二天早上,你下载了一个 AI 工具。用了五分钟,关掉了。图标沉到第三屏,再也没打开。 你对抖音没有学习意愿,但能刷三小时。你对 AI 充满学习意愿,但用不了十分钟。 我们通常会把它归结为:没时间、不够感兴趣、工具不顺手。 这些当然都可能成立。 但我后来发现,更常见的卡点是:短视频把「下一步」替你安排好了,而 AI 没有。你得自己把它放进流程里。 2/4 上瘾不是问题,问题是对什么上瘾 我们习惯把「上瘾」当贬义词。但仔细想想,上瘾的本质是什么? 做了一件事,得到奖励,想再做一次。 这套东西本身没好坏。它可以让你停不下来地刷视频,也可以让你停不下来地写代码、练琴、健身。 问题不在于你上瘾了,而在于谁在设计这个循环。 抖音的产品经理设计了一个算法,它比你更了解你。你以为在选择看什么,其实在被推着走。滑一下,奖励来了。再滑一下,又来了。继续不费力,停下才费力。 这就是被动上瘾。别人设计机制,你被卷入。 主动上瘾正好反过来。你自己设计机制,你选择卷入。 这里说的「上瘾」不是让你沉迷时间。而是让你不用靠意志力也能开始,但产出要能落到一个真实任务上。如果只是刷起来没有产出,那跟刷视频没区别。 你不是没有自制力。你只是一直在别人的游戏里玩。 2.5/4 一个容易混淆的地方 这里有个常见的误解:很多人觉得自己「用不起来 AI」是因为不够喜欢它。 但你对抖音也谈不上喜欢。你只是打开了手机,它就播了。 「喜欢」和「顺手」是两回事。 喜欢是情绪,会波动。今天喜欢,明天可能就腻了。 顺手是结构。它不依赖你当时的状态,只依赖「开始的摩擦有多低」和「反馈来得有多快」。 短视频强在这里:每一次滑动都是一个「可关闭的最小单元」。做完就结束,没有压力,随时可以再来一次。 而「学 AI」听起来像一个无限任务,给人压力。但「用 AI 改一句话」是一个可关闭的任务,做完就结束。 AI 用不起来,很多时候不是「不有趣」,而是「开始太像一件需要决心的事」。 3/4 两条规则,不是十条清单 有个叫福格的行为学家说过:行为 = 动机 + 能力 + 提示。 动机会波动,能力也确实会成为门槛,尤其是不知道怎么问、怎么用结果的时候。 但最容易被忽视、也最容易立刻改的,往往是「提示」:你有没有给 AI 安排一个默认出场的时刻。 没有这个时刻,AI 就永远停留在「我应该用」的层面。 所以我试下来,真正有用的就两条规则: 规则 1:默认出场时刻 找一个你每天都会做的事,把 AI 绑上去。 比如:打开文档 → 先让 AI 改第一段。不是因为你需要 AI 改,而是让「打开文档」自动触发「用 AI」。 ...

十二月 29, 2025 · 1 分钟 · 2135 字 · Miss-you