豆摇峰 · 第九期

看五年,想三年,
做好一年

在 Agent 架构、老板预期与个人节奏之间 —
一场关于"边界"与"独自前行"的深夜复盘
2026.04.27 · 白豆 · 李墨玩 · 摇摇
SCROLL
Chapter 01

看五年,想三年,做好一年

三层同心涟漪
三层涟漪 — 远的方向、近的路径、当下的脚

摇摇这周从办公室接进会议时已经很疲惫,分享的最后他抛出了一句最近一直在脑子里回响的话:

「看五年,想三年,做好一年。 — 看五年我觉得不是一件难事,但你怎么想三年,然后做好一年,这件事是很难的。」

— 摇摇

他说有一个职业叫未来学家。他们说的很多事情,按照人类科技的发展大概率会实现 — 但"看到了"和"做出来"之间,差的就是中间那段三年的想法

本期就是这句话的一次实证 — 三个人各自被"中间那一段"卡着:摇摇被多 agent 架构卡着、白豆被老板的预期卡着、李墨玩反而在把"卡"自己变成"自然而然的结果"的路上。

· · ·
Chapter 02

多 Agent 架构:超出能力边界的招人

多层级 agent 架构
主 agent 是决策层,下挂二级、三级部门 — 听起来很顺,做起来很卡

摇摇这周在面试 — 部门要做一个完整的多 agent 系统,把能交给 AI 做的事情交出去。他自己很坦诚地说,"超出我的能力边界了",所以负责出面,每天晚上面三个

「人家别人都有一个疑惑 — 所有人都觉得这个任务是非常好的、有挑战性、也很新。别的公司一般就是单 agent 加一个知识库,做一些问答,或者一些单一任务。多 agent 的系统也是现在业界的一个新尝试。但是他们担心 — 我们是硬件部门,他来了之后把系统搭起来了,那他在这干嘛?还能学到什么?」

— 摇摇

他把听起来"非常顺"的那套思路展开 — 把人类组织搬过来

主 agent = 决策层

不负责具体任务实施,只负责规则判断和任务发配。

二级部门 agent

承接任务、做意图识别和拆分。

三级部门 = skill / mcp

真正干活的工具层。挂载在二级 agent 下面。

摇摇说,这套思路在白板上画起来是顺的,做起来全是问题

挂载了很多 skill 和 mcp 的话,单次对话的预加载上下文就已经很炸了。
三级部门之间流转,第一个做完传给第二个,无形的就增加了信息丢失 — 你要选择传递什么?
同一个 skill 挂载到不同 agent 上,又会有冗余的 token 消耗。

除此之外,前级的知识库 agent(RAG)也有一堆现实问题 — 摇摇举了个例子:

「比如有个型号是 c8065、有个型号是 c8064 — 它们在向量空间上离得特别近,但语义上完全是两个东西。检索之后的排序就会出现很大的幻觉干扰。」

— 摇摇

他说招了一周,目前看到的做 agent 最长的人也就两年,做的都是单一任务的智能客服 — 真正多 agent 架构的人还没遇到。摇摇决定:把这件事的复杂度推给老板,自己承认能力边界,先把人招进来。

· · ·
Chapter 03

反向消耗:AI 写文档,反而审不动了

深夜审阅文档
作业是 AI 写的,但收作业的人还是人

这是摇摇这周最具体的痛点 — 被很少人讲过的一个反直觉发现:

「要推数字化,所以所有人都在用 AI 写。我审核的精力变得非常消耗 — 原先大家各自写,里头的观点是非常明晰的;现在都拿 AI 写,我作为收作业的人,检查作业的成本会大幅度提升,因为里头有很多我不知所谓的上下文和我不懂的知识点。我已经看不懂了。」

— 摇摇

这件事戳到了一个常被忽略的点 — AI 提升了"生产侧"的效率,但"消费侧"的成本也悄悄抬高了。当所有人都在用 AI 喷出大段大段的内容,那个最后要"判它对不对"的人,反而被淹没在自己看不懂的上下文里。

我基本上每天要给别人上两次课。我老板把我卖了。
既要给他们讲课,又要审核他们的作业,又要进行宏观规划。
我家里现在有很多京东卡,你们要在京东上买东西可以找我换 — 讲一次课老板给我一张。
挺好的,你这个公司不得出名以后。
没用,又不涨钱。
· · ·
Chapter 04

该压缩的压缩,该落盘的落盘

摇摇这两周在探索一个解药 — 他从一篇技术文章里学到了 Karpathy 的"大圆模型 wiki"思路,简单说就是:

压缩后落盘

不要把所有东西都塞回上下文,压缩处理后写到硬盘。

推理过程也落盘

不只是结论,连思考的中间状态都完整保留。

用 bash + grep 检索

下一个 agent 不需要传递完整信息,只要传"文件位置和名字",自己用 grep 去查。

这个时候,李墨玩接了一句很抠字眼的话:

你这怎么跟 GPT 说话一样 — "落盘"?
对,我也想问。落盘是什么意思?
落盘 — 存到硬盘里头。我最近看技术文章学到的一个词。
你对外别这么说,一股 GPT 味。
不过也挺精准的 — 落盘,落到硬盘。

李墨玩补了一句方向:

「你可以结合 grep — 像 Claude Code,它用的就是 grep。底层思路是:你既然相信 AI 是足够聪明的,那 AI 理论上知道它想检索什么样的信息。所以让它自己去翻硬盘。」

— 李墨玩

摇摇说他现阶段无法去做完善和补充 — "你能意识到自己的不足,知道自己该补齐哪块,去寻求帮助。可能把一些该知道的坑知道在哪里,回头检查的时候不要出错就好了。"

· · ·
Chapter 05

"我用美图秀秀做了几版"

白豆这周的疲惫不在工作量,在于工作量背后那种被低估的感觉。他举了一个最具体的例子:

公司在做文创周边 — 春夏秋冬四个主题的桌书签。设计师用 Adobe Illustrator + AI 生图组合,工序繁琐:先用 AI 生图,再精细化处理。设计师陪白豆加班到八九点,把成稿发给领导。

「领导五分钟就回复了:『我用美图秀秀做了几版,你参考一下。』我听着就心累 — 还好我没有继续再做设计了。」

— 白豆
是你老板说"用美图秀秀做了几版"?
对。他可能觉得现在不是都有 AI 功能了嘛,就引入了美图秀秀。但那种图分辨率特别低,印出的书签会特别低劣。我设计的同事就有点崩了。
明白了 — 相当于你们老板不太懂业务,他感觉不到这个东西有多难。

李墨玩把问题抽象出来:怎么让老板感知到你的工作的价值? 摇摇也补了一句更狠的:

「这些老板不知道能力边界 — 不知道 AI 的边界。」

— 摇摇

白豆把这件事拆成了三个层次:

01

背景的不对称

「我没有过硬的理工或者工程体系背景,老板就会觉得这事特别简单 — 随便一个人都可以试问个豆包就能得到答案。」

02

付钱者的视角

「作为付钱的人,他就觉得『按我的想法来其实可以实现的,我都付了这么多钱给你们了,多的也就是执行』。」

03

名正言顺地拒绝

「这周第二次活动让我去写新闻稿,我拒绝了。— 摇摇:原来老板的需求也是可以拒绝的吗?」

· · ·
Chapter 06

三年 IPO:被豆包写出来的宏伟

这是本期最荒诞、也最值得记住的一段 — 李墨玩问完工资的事,话题转到了老板对未来的预期:

感觉你们老板的预期现在被拉高了。
对,他都开始写 IPO 计划了,你知道吗?三年 IPO。
我靠 — 拿豆包写的吧。
是拿豆包写的。我确实⋯⋯
IPO 可还行 — 不是主要你们营收也没那么夸张嘛。
老板就比较宏伟,比较宏伟。
挺能想的。难怪销售出身。不过你老板沟通确实挺强 — 真不黑不吹,值得学习。

白豆停顿了一下,给了一段比较冷静的总结 — 这周疲惫的根本原因:

没有给自己留出充裕的规划空间

「我为了凸显自己的主体性,根本原因还是在自己没有留出来一定的冗余。」

协作对象的"特别临时"

「领导各种特别临时的东西让人很头大。」

作息被追剧打乱

「为了放松一下,看《人民的名义》追剧,让作息受到了影响。」

「人总是还要放松的 — 哪里能全天做正事。」

— 摇摇
· · ·
Chapter 07

巫师独自前行:Codex × 飞书 CLI 给学姐做插画

巫师独自前行
伟大的巫师独自前行 — 只要空气中的元素依旧回应着他的咒语

这是白豆这周做得最有成就感、也最具示范性的一件小事 — 给一位准备出新版书的学姐做配套插画。25 个词、每个词配一幅画。原本对方至少得做几周,他从接到求助到完整交付,只用了不到三天

整条链路是这样的:

Step 1: PDF 数据清洗

朋友给了 PDF + WPS 转的 Word,零零散散有很多图片。先让 Claude 按"每张结构基本一致"做样例化清洗。

Step 2: 配图试错(失败)

第一遍想偷懒:让 AI 自己切割附件里的配图。"我自己在追剧休息,让 Claude 在那跑,断断续续四个小时" — 结果切出来的位置不对、零碎稀碎、还有错误。

Step 3: 改成手动截图

「最终我直接手动截图,截完保存到一个文件夹,让 AI 一一对应 — 截图这一步只用了 18 分钟。人介入的时候,效率和准确度还是相当高的。」

Step 4: Codex 内置生图 + 飞书 CLI 上传

本地 CSV + 学姐的几张形象参考图,让 Codex 一张一张出图(30 多张跑了三个小时),出完之后它自己用飞书的命令行上传到飞书表格里。最后白豆给对方分享一个表格就完事。

聊到这里,摇摇突然念了一段 — 这是他们之前看到、很喜欢的一段话:

「伟大的巫师总是独自前行 — 只要空气中的元素依旧回应着他的咒语和呼唤。把自己变成一个伟大的巫师 — 你现在就是伟大的巫师。」

— 摇摇 → 白豆

李墨玩接着浇了一盆冷静的水:

「学姐人人也挺好的,你就不用像在工作一样 — 虽然搞得很快,但是要表现出这个东西很复杂。其一是会把你的工作难度显得很低;其二是他会给你派更多的任务。」

— 李墨玩 + 摇摇接力

白豆顺势聊到自己原本还想给公司做小程序+NFC 手环的 schema 跳转(碰一下不用任何点击直接拉起小程序)— 他自己摁住了这个念头:

「我真是给自己加太多东西了。其他人感知不到这个的价值 — 你去外边随便找一个小程序开发,再怎么也得好几万块钱。」

— 白豆
· · ·
Chapter 08

李墨玩:用户群从十几人涨到 40+

李墨玩这周分享得很轻 — 但里头的信号很重。他的公众号排版工具用户群之前一直没怎么运营,最近这两天陆陆续续来了一堆人,已经涨到 40 多个

但是我在想,我他妈的决策有点问题 — 后面看怎么引导人家促进付费的转化。我发现我提供的那种自定义 API,他们都自己去买了。
笑声 — 你应该打包啊。

除此之外,他在做一件结构性更重要的事 — 把"做产品"和"做自媒体"打通成一件事

产品过程当内容

"自己做产品的过程中,就可以把这个东西不断分享 — 也是给自己的专业度的背书,同时反哺自媒体。"

渠道之间互相导流

把公众号回复、签名都改一下,把小程序二维码、公众号、GitHub 全放上去 — "管他三七二十一"。

排版工具相关文章阅读量翻倍

"这两篇文章阅读量都比我其他文章高很多。" — 用户场景能驱动好内容。

定位逐渐清晰

"以前比较模糊,现在就是逐渐清晰,在线上变得逐渐清晰。"

· · ·
Chapter 09

兴趣本身,就是结果

光穿云缝
不再为目标做事 — 做这件事本身就是目标

李墨玩这一段我觉得是本期的另一个高点。他周末研究了一个开源库 3blue1brown 的 manim — 那个用编程做数学科普视频的、网上很有名的频道:

「我用他的库随便搞了一个,解读 DeepSeek,加上开源配音 — 蛮有意思的。我下一个准备的方向就是去探索用 AI 做一些视频。」

— 李墨玩

探索到一半,他还"逆向"出了一个公开账号的工具栈 — 一个在小红书做产品宣传视频很厉害的博主,别人问他都不正面说。李墨玩说:"我自己研究了两天,一眼就看出来 — 用的是 Remotion。"

现在真的很理解人家了 — 你探索出来一个东西、烧了自己的 token,别人想直接拿到,选择性不多。
因为那是人家起号就是靠这个方式起号的。
不过我今天又关注了一个账号 — 他就是分享怎么用 Remotion 做的,甚至把自己的动效都开源出来了。也没有更多的人用这个东西去做 — 我觉得这是一个非常新的方式,值得尝试。

但本期最让人停下来的不是技术,是李墨玩说自己最近状态变化的原因:

「我找到了做这个自媒体的兴趣 — 快乐在哪里。包括做视频什么的,我觉得是一个非常好玩的事情。它不像以前说是为了赚钱什么的 — 它现在已经不是我的目标,它是一个自然而然的结果。现在就是探索怎么做更有意思地去做这件事情,给别人带来一些价值。」

— 李墨玩

白豆听完说了一句简短的回应:「你的状态最近非常好,挺好的。」 摇摇也接了一句:"这个行为带来了一些非常不一样的变化 — 不管是执行上,还是质量的提升上。"

· · ·
Chapter 10

彩蛋:免费的 SOTA — 百度 PaddleOCR

白豆已经下线之后的余韵 — 摇摇追问了一句:

李墨玩,上次你给我推荐的 PDF 识别那个网站叫什么来着?
你就用百度的就好了 — 百度的 PaddleOCR / 飞桨。每天给 2 万页的免费额度,效果是最好的。
就是他们说的 SOTA 吧 — OCR 领域的第一。
原来 SOTA 是 state of the art — 牛逼。
百度还是讲实话能做出点东西的 — 除了文心一言比较垃圾。最让我没想到的是免费 — 填个表就好。

免费的 SOTA + 2 万页/天的额度 — 加上 GitHub 76.7k star — 是李墨玩接下来想用来做的另一件小事:把电子书导入微信读书时的乱码、PDF 图片化的内容,全部走 PaddleOCR。

· · ·
Chapter 11

本期启示

01

看五年,想三年,做好一年

看远很容易,难的是把"远"翻译成"近",再翻译成"今天动手做的事"。中间那段三年,是真正卡人的地方。

02

承认能力边界

摇摇说"我搭建不出这样的系统架构",没有硬撑 — 而是把复杂度推给老板、把人招进来。能意识到自己缺哪一块,已经是能力的一部分。

03

AI 的反向消耗

所有人都用 AI 写时,"收作业的人"被淹没在自己看不懂的上下文里。生产侧效率提升 ≠ 整体效率提升 — 消费侧的成本悄悄变高了。

04

该压缩的压缩,该落盘的落盘

Karpathy 的思路:信息不必塞进上下文,存到硬盘 + grep 自取。AI 已经够聪明 — 让它自己去翻就行。

05

老板的能力边界

"我用美图秀秀做了几版"和"三年 IPO",是同一个根本问题 — 老板不知道 AI 的边界,于是把所有难度都拉平到他自己看到的那一层。

06

名正言顺地拒绝

"原来老板的需求也是可以拒绝的吗?" — 把"展应该优先"摆出来,就是。给自己留出冗余空间,是工作之外最重要的工作。

07

独自前行 ≠ 显得很难

巫师独自前行,但交付的时候不一定要展示得很复杂 — 干得太快又太轻松,会把工作难度显得很低,也会让别人派给你更多任务。

08

人介入的那 18 分钟

白豆截图:AI 跑了 4 小时还出错,人手动只用了 18 分钟。不是所有事情都该让 AI 一干到底 — 知道哪一步该自己上,是真本事。

09

兴趣不是手段,是结果本身

"它已经不是我的目标,它是一个自然而然的结果。"当做这件事本身就让你快乐,赚钱就只是顺带发生的事 — 状态会变得不一样,质量也会跟着变。

10

免费的 SOTA 也值得申请

百度 PaddleOCR 76.7k star、2 万页/天免费额度 — 不是所有最好的工具都需要付钱。多翻翻"填个表就好"的角落。

· · ·
Epilogue

散场:下周就五一了

会议尾声,白豆已经在公司关着门聊完了工资的事,李墨玩问起五一的安排:

「5 月 4 号 5 号我要去摆摊。」
「那我们摆渡先回去吧。」
「下周见 — 下周就五一了。」

— 白豆 × 摇摇 × 李墨玩

摇摇是从早上 7 点忙到晚上 10 点 — 中午没睡,"早上睡不着,洗洗刷刷就走了。"白豆说他从一个原本可以处理 NFC 手环网页的下午,被临时拉去开会三小时回来,也基本耗光了精力。

但本期最让人有信号的反而是李墨玩 — 三个人一致地说,他这周状态很好。状态的来源不是某个新工具,是他终于把"为什么做"换成了"做这件事本身"。

看五年,想三年,做好一年。
— 摇摇引用的一句话,被白豆复述了一遍