摇摇这周从办公室接进会议时已经很疲惫,分享的最后他抛出了一句最近一直在脑子里回响的话:
「看五年,想三年,做好一年。 — 看五年我觉得不是一件难事,但你怎么想三年,然后做好一年,这件事是很难的。」
他说有一个职业叫未来学家。他们说的很多事情,按照人类科技的发展大概率会实现 — 但"看到了"和"做出来"之间,差的就是中间那段三年的想法。
本期就是这句话的一次实证 — 三个人各自被"中间那一段"卡着:摇摇被多 agent 架构卡着、白豆被老板的预期卡着、李墨玩反而在把"卡"自己变成"自然而然的结果"的路上。
摇摇这周在面试 — 部门要做一个完整的多 agent 系统,把能交给 AI 做的事情交出去。他自己很坦诚地说,"超出我的能力边界了",所以负责出面,每天晚上面三个。
「人家别人都有一个疑惑 — 所有人都觉得这个任务是非常好的、有挑战性、也很新。别的公司一般就是单 agent 加一个知识库,做一些问答,或者一些单一任务。多 agent 的系统也是现在业界的一个新尝试。但是他们担心 — 我们是硬件部门,他来了之后把系统搭起来了,那他在这干嘛?还能学到什么?」
他把听起来"非常顺"的那套思路展开 — 把人类组织搬过来:
不负责具体任务实施,只负责规则判断和任务发配。
承接任务、做意图识别和拆分。
真正干活的工具层。挂载在二级 agent 下面。
摇摇说,这套思路在白板上画起来是顺的,做起来全是问题:
除此之外,前级的知识库 agent(RAG)也有一堆现实问题 — 摇摇举了个例子:
「比如有个型号是 c8065、有个型号是 c8064 — 它们在向量空间上离得特别近,但语义上完全是两个东西。检索之后的排序就会出现很大的幻觉干扰。」
他说招了一周,目前看到的做 agent 最长的人也就两年,做的都是单一任务的智能客服 — 真正多 agent 架构的人还没遇到。摇摇决定:把这件事的复杂度推给老板,自己承认能力边界,先把人招进来。
这是摇摇这周最具体的痛点 — 被很少人讲过的一个反直觉发现:
「要推数字化,所以所有人都在用 AI 写。我审核的精力变得非常消耗 — 原先大家各自写,里头的观点是非常明晰的;现在都拿 AI 写,我作为收作业的人,检查作业的成本会大幅度提升,因为里头有很多我不知所谓的上下文和我不懂的知识点。我已经看不懂了。」
这件事戳到了一个常被忽略的点 — AI 提升了"生产侧"的效率,但"消费侧"的成本也悄悄抬高了。当所有人都在用 AI 喷出大段大段的内容,那个最后要"判它对不对"的人,反而被淹没在自己看不懂的上下文里。
摇摇这两周在探索一个解药 — 他从一篇技术文章里学到了 Karpathy 的"大圆模型 wiki"思路,简单说就是:
不要把所有东西都塞回上下文,压缩处理后写到硬盘。
不只是结论,连思考的中间状态都完整保留。
下一个 agent 不需要传递完整信息,只要传"文件位置和名字",自己用 grep 去查。
这个时候,李墨玩接了一句很抠字眼的话:
李墨玩补了一句方向:
「你可以结合 grep — 像 Claude Code,它用的就是 grep。底层思路是:你既然相信 AI 是足够聪明的,那 AI 理论上知道它想检索什么样的信息。所以让它自己去翻硬盘。」
摇摇说他现阶段无法去做完善和补充 — "你能意识到自己的不足,知道自己该补齐哪块,去寻求帮助。可能把一些该知道的坑知道在哪里,回头检查的时候不要出错就好了。"
白豆这周的疲惫不在工作量,在于工作量背后那种被低估的感觉。他举了一个最具体的例子:
公司在做文创周边 — 春夏秋冬四个主题的桌书签。设计师用 Adobe Illustrator + AI 生图组合,工序繁琐:先用 AI 生图,再精细化处理。设计师陪白豆加班到八九点,把成稿发给领导。
「领导五分钟就回复了:『我用美图秀秀做了几版,你参考一下。』我听着就心累 — 还好我没有继续再做设计了。」
李墨玩把问题抽象出来:怎么让老板感知到你的工作的价值? 摇摇也补了一句更狠的:
「这些老板不知道能力边界 — 不知道 AI 的边界。」
白豆把这件事拆成了三个层次:
「我没有过硬的理工或者工程体系背景,老板就会觉得这事特别简单 — 随便一个人都可以试问个豆包就能得到答案。」
「作为付钱的人,他就觉得『按我的想法来其实可以实现的,我都付了这么多钱给你们了,多的也就是执行』。」
「这周第二次活动让我去写新闻稿,我拒绝了。— 摇摇:原来老板的需求也是可以拒绝的吗?」
这是本期最荒诞、也最值得记住的一段 — 李墨玩问完工资的事,话题转到了老板对未来的预期:
白豆停顿了一下,给了一段比较冷静的总结 — 这周疲惫的根本原因:
「我为了凸显自己的主体性,根本原因还是在自己没有留出来一定的冗余。」
「领导各种特别临时的东西让人很头大。」
「为了放松一下,看《人民的名义》追剧,让作息受到了影响。」
「人总是还要放松的 — 哪里能全天做正事。」
这是白豆这周做得最有成就感、也最具示范性的一件小事 — 给一位准备出新版书的学姐做配套插画。25 个词、每个词配一幅画。原本对方至少得做几周,他从接到求助到完整交付,只用了不到三天。
整条链路是这样的:
朋友给了 PDF + WPS 转的 Word,零零散散有很多图片。先让 Claude 按"每张结构基本一致"做样例化清洗。
第一遍想偷懒:让 AI 自己切割附件里的配图。"我自己在追剧休息,让 Claude 在那跑,断断续续四个小时" — 结果切出来的位置不对、零碎稀碎、还有错误。
「最终我直接手动截图,截完保存到一个文件夹,让 AI 一一对应 — 截图这一步只用了 18 分钟。人介入的时候,效率和准确度还是相当高的。」
本地 CSV + 学姐的几张形象参考图,让 Codex 一张一张出图(30 多张跑了三个小时),出完之后它自己用飞书的命令行上传到飞书表格里。最后白豆给对方分享一个表格就完事。
聊到这里,摇摇突然念了一段 — 这是他们之前看到、很喜欢的一段话:
「伟大的巫师总是独自前行 — 只要空气中的元素依旧回应着他的咒语和呼唤。把自己变成一个伟大的巫师 — 你现在就是伟大的巫师。」
李墨玩接着浇了一盆冷静的水:
「学姐人人也挺好的,你就不用像在工作一样 — 虽然搞得很快,但是要表现出这个东西很复杂。其一是会把你的工作难度显得很低;其二是他会给你派更多的任务。」
白豆顺势聊到自己原本还想给公司做小程序+NFC 手环的 schema 跳转(碰一下不用任何点击直接拉起小程序)— 他自己摁住了这个念头:
「我真是给自己加太多东西了。其他人感知不到这个的价值 — 你去外边随便找一个小程序开发,再怎么也得好几万块钱。」
李墨玩这周分享得很轻 — 但里头的信号很重。他的公众号排版工具用户群之前一直没怎么运营,最近这两天陆陆续续来了一堆人,已经涨到 40 多个。
除此之外,他在做一件结构性更重要的事 — 把"做产品"和"做自媒体"打通成一件事:
"自己做产品的过程中,就可以把这个东西不断分享 — 也是给自己的专业度的背书,同时反哺自媒体。"
把公众号回复、签名都改一下,把小程序二维码、公众号、GitHub 全放上去 — "管他三七二十一"。
"这两篇文章阅读量都比我其他文章高很多。" — 用户场景能驱动好内容。
"以前比较模糊,现在就是逐渐清晰,在线上变得逐渐清晰。"
李墨玩这一段我觉得是本期的另一个高点。他周末研究了一个开源库 3blue1brown 的 manim — 那个用编程做数学科普视频的、网上很有名的频道:
「我用他的库随便搞了一个,解读 DeepSeek,加上开源配音 — 蛮有意思的。我下一个准备的方向就是去探索用 AI 做一些视频。」
探索到一半,他还"逆向"出了一个公开账号的工具栈 — 一个在小红书做产品宣传视频很厉害的博主,别人问他都不正面说。李墨玩说:"我自己研究了两天,一眼就看出来 — 用的是 Remotion。"
但本期最让人停下来的不是技术,是李墨玩说自己最近状态变化的原因:
「我找到了做这个自媒体的兴趣 — 快乐在哪里。包括做视频什么的,我觉得是一个非常好玩的事情。它不像以前说是为了赚钱什么的 — 它现在已经不是我的目标,它是一个自然而然的结果。现在就是探索怎么做更有意思地去做这件事情,给别人带来一些价值。」
白豆听完说了一句简短的回应:「你的状态最近非常好,挺好的。」 摇摇也接了一句:"这个行为带来了一些非常不一样的变化 — 不管是执行上,还是质量的提升上。"
白豆已经下线之后的余韵 — 摇摇追问了一句:
免费的 SOTA + 2 万页/天的额度 — 加上 GitHub 76.7k star — 是李墨玩接下来想用来做的另一件小事:把电子书导入微信读书时的乱码、PDF 图片化的内容,全部走 PaddleOCR。
看远很容易,难的是把"远"翻译成"近",再翻译成"今天动手做的事"。中间那段三年,是真正卡人的地方。
摇摇说"我搭建不出这样的系统架构",没有硬撑 — 而是把复杂度推给老板、把人招进来。能意识到自己缺哪一块,已经是能力的一部分。
所有人都用 AI 写时,"收作业的人"被淹没在自己看不懂的上下文里。生产侧效率提升 ≠ 整体效率提升 — 消费侧的成本悄悄变高了。
Karpathy 的思路:信息不必塞进上下文,存到硬盘 + grep 自取。AI 已经够聪明 — 让它自己去翻就行。
"我用美图秀秀做了几版"和"三年 IPO",是同一个根本问题 — 老板不知道 AI 的边界,于是把所有难度都拉平到他自己看到的那一层。
"原来老板的需求也是可以拒绝的吗?" — 把"展应该优先"摆出来,就是。给自己留出冗余空间,是工作之外最重要的工作。
巫师独自前行,但交付的时候不一定要展示得很复杂 — 干得太快又太轻松,会把工作难度显得很低,也会让别人派给你更多任务。
白豆截图:AI 跑了 4 小时还出错,人手动只用了 18 分钟。不是所有事情都该让 AI 一干到底 — 知道哪一步该自己上,是真本事。
"它已经不是我的目标,它是一个自然而然的结果。"当做这件事本身就让你快乐,赚钱就只是顺带发生的事 — 状态会变得不一样,质量也会跟着变。
百度 PaddleOCR 76.7k star、2 万页/天免费额度 — 不是所有最好的工具都需要付钱。多翻翻"填个表就好"的角落。
会议尾声,白豆已经在公司关着门聊完了工资的事,李墨玩问起五一的安排:
「5 月 4 号 5 号我要去摆摊。」
「那我们摆渡先回去吧。」
「下周见 — 下周就五一了。」
摇摇是从早上 7 点忙到晚上 10 点 — 中午没睡,"早上睡不着,洗洗刷刷就走了。"白豆说他从一个原本可以处理 NFC 手环网页的下午,被临时拉去开会三小时回来,也基本耗光了精力。
但本期最让人有信号的反而是李墨玩 — 三个人一致地说,他这周状态很好。状态的来源不是某个新工具,是他终于把"为什么做"换成了"做这件事本身"。
看五年,想三年,做好一年。
— 摇摇引用的一句话,被白豆复述了一遍