DeepSeek V4价格骨折背后:一位“二流程序员”的两次红利时刻-对谈 Proma 开发者Erlich-Vol97

2026 年 4 月底,DeepSeek V4 Pro 悄悄发布,几天后宣布全系 2.5 折、缓存命中永久 1/10,后续永久降价。同等性能下,它的价格是海外模型的几十分之一,国产旗舰的 1/2 到 1/4。当所有人都在算「DeepSeek 赚不赚钱」的时候,我们找到了独立开发者 Erlich。他做了 DeepClaude 和 Proma,一个人加一个实习生,从五一假期开始看着DeepSeek逐步占了他平台用量的 90% 以上,活跃用户量翻倍。他用两次「吃到DeepSeek红利」的经历,讲清楚了 DeepSeek 的降价底气从哪来、套壳为什么不是贬义词、中转站的灰色生意有多危险,以及为什么「不拿投资」可能是当下理性的选择。 01:45 一个「二流程序员」的两次红利 很多的技术可能都是二流的人才会得到非常大的红利,二流的人逐渐变成一流的人。 • Erlich 软件工程毕业,觉得自己代码写得烂,做了产品经理。一年里只有一半时间在正经工作,另一半在做自己的小项目、看其他公司。 • 22 年底 ChatGPT 发布后开始重新写代码。「过去一直学不懂的概念,立即通过实践就可以学得懂了。」 • 从复制粘贴 ChatGPT 代码开始,23 年 6 月跟 AI 聊天聊出一个 RAG 客服产品,顺利上线。 • 24 年进入 Cursor 和 Windsurf 时代,25 年初 DeepSeek R1 发布后做了 DeepClaude——把 DeepSeek 的推理和 Claude Sonnet 的代码生成串联起来,成了他第一个爆品。 • 26 年 4 月 DeepSeek V4 Pro 发布、价格打到 2.5 折,他的 Proma 日消耗从 8 亿 Token 飙升到 40 亿,活跃用户翻倍。 • 05:33 DeepClaude:把两个模型「连起来」的偶然之作 我是不是可以把这两个模型连在一起,就只要 DeepSeek 的思考,用 Sonnet 作为输出? • 起因:群里有人分享了用 DeepSeek 做 planner + Claude Sonnet 做执行的评测,准确率远超单独用 Sonnet。但那个 demo 不支持 OpenAI 兼容接口,Erlich 当天动手重写了个兼容版本。 • 后来泛化到所有模型组合:DeepSeek + Gemini、DeepSeek + Claude。 • Nixon 从那个时间点开始把脑放电波的 show notes 和文字稿全部切给 AI 写。一期节目的文稿生成成本大约 50-100 块人民币——「你知道模型很聪明,你巴不得一次性喂它七八万字,它哐哐哐跑掉 50 块钱的成本,吐出来一个你能用的东西,这个爽感维持了非常长的一段时间。」 • 用户群里有大量写小红书文案的运营(一天几百上千条)、写论文做润色的学生、还有专业作者。 • 14:37 从中转站到桌面 Agent:Proma 是怎么来的 那一整晚没有出现任何一个错误……我一下觉得,哇,这个世界不一样了。 • 25 年 10 月 Erlich 在全国跑 WebCoding 活动,帮两家公司做 demo 时接触到 Claude Agent SDK。20 分钟搭出一个能投入使用的 demo。 • 同时发现 DeepClaude 用户开始流向 Cherry Studio 等有内建 agent 渠道的产品。「用户不需要一个 API 中转站了,他们需要一个有界面的东西。」 • Claude Code 碾压 Cursor 的关键:不假设上下文集中在某个打开的 Tab,而是先探索整个代码库再做修改;开发者 Boris Cherny "左脚踩右脚"自我迭代,一天发5-10个版本。 • Proma 内核是 Claude Agent SDK——和 Claude Code 同一个内核,但套了普通用户能用的图形界面。 • 和 Claude Code 的核心差异:Claude Code 的目标用户是程序员,用终端 UI;Proma 的目标用户是「不想装命令行的人」,以及需要用国产模型的国内用户。 • 「我们只需要加一句话,就是『你在积极用 sub agent』,就可以做得比 Claude Code 还好。」——这就是 harness 工程的价值。 • 28:30 DeepSeek V4 Pro:悄悄发布,然后打了 2.5 折 我最开始都不相信,因为我并没有在任何公开的渠道看到这种新闻稿。 • 4 月 24 日 V4 发布当天,Erlich 是在用户群里看到消息才知道的。「我感觉他完全不想要自己有什么声量。」 • 一天之内完成接入。第一感受是快——「首 token 可能一两秒之内就会回来,一两秒里边有绝大部分都是网络延迟。」 • 价格时间线:4/25 上 2.5 折(原定 5/5 结束)→ 4/26 上全系输入缓存命中永久 1/10,可与 2.5 折叠加 → 4/28 把 2.5 折延长到 5/31 → 5/22 永久降价 • 五一期间用量不降反升:假期第一天 8 亿 Token,每天比前一天高,五一中点冲到 40 亿。DeepSeek 在 Proma 平台上的用量占比超过 90%。 33:36 几十倍价差是怎么来的:缓存、稀疏注意力与国产芯片 Tokens 价格每个季度大概以 30-40% 的速度在下降,3 到 5 年内还有 1-2 个数量级的下降空间。 Opus 4.6/4.7 平均每次请求成本差不多是一块钱一次。DeepSeek 这一轮的话,每次请求成本差不多就是几分钱到几毛钱。 • 账面价格:输出端 DeepSeek V4 Pro 是 Claude Opus 4.6 的 1/30(2.5 折期间),输入端是 1/12。缓存命中时拉到 144 倍。 • Claude 的缓存机制拖了后腿:缓存写入额外收费,时间隔得越久越贵。Nixon 一天用三四次、每次隔三四小时,实际体感接近百倍差异。 • Erlich 后台数据:Opus 4.6/4.7 平均每次请求成本约 1 元,DeepSeek V4 Pro 几分钱到几毛钱,便宜的甚至显示 0.00。 • V4 Pro 低价背后的技术栈:DSA 稀疏注意力(不看所有上下文,先扫索引再精读)→ CSA 压缩稀疏注意力(KV 缓存先压到 1/10 再存显存,只解压选中的部分);Ingram 把静态知识存 CPU、动态知识存 GPU;3B 小模型 OCR 实现 10 倍无损图片压缩。 • 华为昇腾 950 超节点预计下半年批量上市,硬件成本在英伟达 1/4 以下。DeepSeek 在 V4 价格表下方直接预告:昇腾 950 上市后 Pro 还会大幅降价。 • 同期腾讯 CodeBuddy 企业版 5/15 涨价 154%。「算力侧在涨,不是降。」三种商业模式已分叉:DeepSeek 走「模型即心智」(不靠 API 利润),智谱/Kimi 走「API 是主营收」,阿里/字节走「云 + 模型一体」。 • 49:23 套壳与中转站:去污名化、灰色生意与消费者防坑指南 一个产品如果你爆火了,你每天要处理几十几百个 PR 的时候,你的产品已经没有任何理念了。 • 「套壳」的贬义来自投资人叙事,不是普通用户。Erlich 的判断:壳的核心价值是帮用户收集、处理和整理上下文——GPT 和 Claude 的应用端不可能为每个人生成单独版本,所以壳永远有价值。Skills 火了之后这个价值更成立。 • 中转站三层生态:最底层是闲鱼上 1 元抵 20 美金的 API Key(来源可能涉及谷歌邮箱薅试用、信用卡盗刷);中间层是开发者自建的 NewAPI 套壳站(保守估计国内几万到十几万个);顶层是中国移动、电信、猎豹移动(EZ Router)、孙宇晨和特朗普家族等正规军入场。 • 中转站三大风险:① 挂羊头卖狗肉——2026 年 3 月 CISPA 论文实测 45.83% 的节点通不过模型身份验证,你的 Opus 4.6 可能是国产 model 冒充的;② 跑路——Erlich 自己被坑过多次,「后来就算了,我们不如优化一下 DeepSeek V4 Pro」;③ 提示词注入木马——中转站可以在中间插入提示词,让 agent 无脑执行、给你的电脑装软件。 • 「所有在用中转站的朋友,如果你自己不是非常信任的话,机密信息不要去用它。涉及到登录、验证、密码这类的。」 • 1:11:28 不拿投资、不追风潮、每次多写半句话 我觉得到今天来讲,其实没有什么东西真的是颠覆性的。可能 22 年你能跟着 ChatGPT 一起通过复制粘贴的方式写代码,到今天你只是用了 agent,它只是更快了一点而已。 • 给普通用户的建议:找一个顺手的产品(豆包、Kimi、DeepSeek 都行),用它解决一个你工作里实际遇到的小问题。每次尝试多做很小很小的迭代——「哪怕每次多说一句话,或者是半句话,这种级别的改进都是远超任何 agent 的。」 • Erlich 不拿投资的原因:拿了就要一轮接一轮地拿,承诺 5 倍、15 倍、几十倍增长,然后被迫招人、被迫演戏。「如果我们一旦往那个方向去走的话,我肯定会损失很多我现在觉得我有连接的用户。」 • 他的计划:赚到钱后成立一个小基金,投给「心地善良朴实、在一线做事、不想做多大规模」的独立开发者。「我可能攒到几千个人,我们两三个人就活得很好了。我的时间才刚刚展开,我才 30 岁。」 人物: • Erlich - Proma(https://proma.cool/,最丝滑...

Python Tuple | Python Tuple Tutorial | Python Training | Intellipaat
▶︎

Python Tuple | Python Tuple Tutorial | Python Training | Intellipaat

What is SonarQube | Introduction SonarQube | SonarQube Tutorial | SonarQube Basics | Intellipaat
▶︎

What is SonarQube | Introduction SonarQube | SonarQube Tutorial | SonarQube Basics | Intellipaat

PASS Your Phlebotomy Exam! 💉 Must-Know Terms + Practice Questions
▶︎

PASS Your Phlebotomy Exam! 💉 Must-Know Terms + Practice Questions

Nvidia CEO Live on Bloomberg Technology (full show) #tech
▶︎

Nvidia CEO Live on Bloomberg Technology (full show) #tech

Read The Korea Economic Daily in 30 Minutes | 20260511🌞#MorningRoutine
▶︎

Read The Korea Economic Daily in 30 Minutes | 20260511🌞#MorningRoutine

【cti talk網路論壇】聚焦陸兩會"反獨"論述 宣布新立法?"美中關係"脆弱 "新外長"人事揭曉?張亞中.楊永明.黃奎博重磅對談 洪淑芬主持精彩完整全程ep6@中天電視CtiTv@ctitalk_official
▶︎

【cti talk網路論壇】聚焦陸兩會"反獨"論述 宣布新立法?"美中關係"脆弱 "新外長"人事揭曉?張亞中.楊永明.黃奎博重磅對談 洪淑芬主持精彩完整全程ep6@中天電視CtiTv@ctitalk_official

AI真的在“蒸馏”人类吗?硅谷裁员潮,被“克隆”的主播,教皇的焦虑-Vol98
▶︎

AI真的在“蒸馏”人类吗?硅谷裁员潮,被“克隆”的主播,教皇的焦虑-Vol98

【小岛浪吹】DeepSeek适配华为最新昇腾芯片,韬定律横空出世打破极限,主观分析下中国AI到底处于什么水平
▶︎

【小岛浪吹】DeepSeek适配华为最新昇腾芯片,韬定律横空出世打破极限,主观分析下中国AI到底处于什么水平

Jfrog | Jfrog Artifactory | Jfrog Artifactory Tutorial | Artifactory Tutorial | Intellipaat
▶︎

Jfrog | Jfrog Artifactory | Jfrog Artifactory Tutorial | Artifactory Tutorial | Intellipaat

Exclusive Interview With Nvidia CEO Jensen Huang (Full Special)
▶︎

Exclusive Interview With Nvidia CEO Jensen Huang (Full Special)

Read the Korea Economic Daily in 30 Minutes | 20260121🌞#MorningRoutine | 8 AM Live
▶︎

Read the Korea Economic Daily in 30 Minutes | 20260121🌞#MorningRoutine | 8 AM Live

Linus Torvalds 20年前就看透了!微軟「愛 Linux」背後的最毒陰謀...💻🤫
▶︎

Linus Torvalds 20年前就看透了!微軟「愛 Linux」背後的最毒陰謀...💻🤫

【cti talk網路論壇】聚焦陸兩會"反獨"論述 宣布新立法?"美中關係"脆弱 "新外長"人事揭曉?張亞中.楊永明.黃奎博重磅對談 洪淑芬主持精彩完整全程ep6@中天電視CtiTv@ctitalk_official
▶︎

【cti talk網路論壇】聚焦陸兩會"反獨"論述 宣布新立法?"美中關係"脆弱 "新外長"人事揭曉?張亞中.楊永明.黃奎博重磅對談 洪淑芬主持精彩完整全程ep6@中天電視CtiTv@ctitalk_official

大火劇集《三體》幕後,竟有一起殘忍的毒殺老闆事件
▶︎

大火劇集《三體》幕後,竟有一起殘忍的毒殺老闆事件

Codex爆火的背后,为什么为编程设计的 Codex,反而成了最广泛使用通用 Agent?
▶︎

Codex爆火的背后,为什么为编程设计的 Codex,反而成了最广泛使用通用 Agent?

India Economy OK…But Danger Ahead? 5-State Polls में NDA 2-0 Lead? • Sriram Seshadri
▶︎

India Economy OK…But Danger Ahead? 5-State Polls में NDA 2-0 Lead? • Sriram Seshadri

DeepSeek V4!依然最强开源大模型
▶︎

DeepSeek V4!依然最强开源大模型

解剖小龍蝦 — 以 OpenClaw 為例介紹 AI Agent 的運作原理
▶︎

解剖小龍蝦 — 以 OpenClaw 為例介紹 AI Agent 的運作原理

独家实测机器人上门保洁:149元3小时背后,数据与能力的天花板-Vol96
▶︎

独家实测机器人上门保洁:149元3小时背后,数据与能力的天花板-Vol96

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source
▶︎

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source