DeepSeek V4价格骨折背后：一位“二流程序员”的两次红利时刻-对谈 Proma 开发者Erlich-Vol97

2026 年 4 月底，DeepSeek V4 Pro 悄悄发布，几天后宣布全系 2.5 折、缓存命中永久 1/10，后续永久降价。同等性能下，它的价格是海外模型的几十分之一，国产旗舰的 1/2 到 1/4。当所有人都在算「DeepSeek 赚不赚钱」的时候，我们找到了独立开发者 Erlich。他做了 DeepClaude 和 Proma，一个人加一个实习生，从五一假期开始看着DeepSeek逐步占了他平台用量的 90% 以上，活跃用户量翻倍。他用两次「吃到DeepSeek红利」的经历，讲清楚了 DeepSeek 的降价底气从哪来、套壳为什么不是贬义词、中转站的灰色生意有多危险，以及为什么「不拿投资」可能是当下理性的选择。 01:45 一个「二流程序员」的两次红利很多的技术可能都是二流的人才会得到非常大的红利，二流的人逐渐变成一流的人。 • Erlich 软件工程毕业，觉得自己代码写得烂，做了产品经理。一年里只有一半时间在正经工作，另一半在做自己的小项目、看其他公司。 • 22 年底 ChatGPT 发布后开始重新写代码。「过去一直学不懂的概念，立即通过实践就可以学得懂了。」 • 从复制粘贴 ChatGPT 代码开始，23 年 6 月跟 AI 聊天聊出一个 RAG 客服产品，顺利上线。 • 24 年进入 Cursor 和 Windsurf 时代，25 年初 DeepSeek R1 发布后做了 DeepClaude——把 DeepSeek 的推理和 Claude Sonnet 的代码生成串联起来，成了他第一个爆品。 • 26 年 4 月 DeepSeek V4 Pro 发布、价格打到 2.5 折，他的 Proma 日消耗从 8 亿 Token 飙升到 40 亿，活跃用户翻倍。 • 05:33 DeepClaude：把两个模型「连起来」的偶然之作我是不是可以把这两个模型连在一起，就只要 DeepSeek 的思考，用 Sonnet 作为输出？ • 起因：群里有人分享了用 DeepSeek 做 planner + Claude Sonnet 做执行的评测，准确率远超单独用 Sonnet。但那个 demo 不支持 OpenAI 兼容接口，Erlich 当天动手重写了个兼容版本。 • 后来泛化到所有模型组合：DeepSeek + Gemini、DeepSeek + Claude。 • Nixon 从那个时间点开始把脑放电波的 show notes 和文字稿全部切给 AI 写。一期节目的文稿生成成本大约 50-100 块人民币——「你知道模型很聪明，你巴不得一次性喂它七八万字，它哐哐哐跑掉 50 块钱的成本，吐出来一个你能用的东西，这个爽感维持了非常长的一段时间。」 • 用户群里有大量写小红书文案的运营（一天几百上千条）、写论文做润色的学生、还有专业作者。 • 14:37 从中转站到桌面 Agent：Proma 是怎么来的那一整晚没有出现任何一个错误……我一下觉得，哇，这个世界不一样了。 • 25 年 10 月 Erlich 在全国跑 WebCoding 活动，帮两家公司做 demo 时接触到 Claude Agent SDK。20 分钟搭出一个能投入使用的 demo。 • 同时发现 DeepClaude 用户开始流向 Cherry Studio 等有内建 agent 渠道的产品。「用户不需要一个 API 中转站了，他们需要一个有界面的东西。」 • Claude Code 碾压 Cursor 的关键：不假设上下文集中在某个打开的 Tab，而是先探索整个代码库再做修改；开发者 Boris Cherny "左脚踩右脚"自我迭代，一天发5-10个版本。 • Proma 内核是 Claude Agent SDK——和 Claude Code 同一个内核，但套了普通用户能用的图形界面。 • 和 Claude Code 的核心差异：Claude Code 的目标用户是程序员，用终端 UI；Proma 的目标用户是「不想装命令行的人」，以及需要用国产模型的国内用户。 • 「我们只需要加一句话，就是『你在积极用 sub agent』，就可以做得比 Claude Code 还好。」——这就是 harness 工程的价值。 • 28:30 DeepSeek V4 Pro：悄悄发布，然后打了 2.5 折我最开始都不相信，因为我并没有在任何公开的渠道看到这种新闻稿。 • 4 月 24 日 V4 发布当天，Erlich 是在用户群里看到消息才知道的。「我感觉他完全不想要自己有什么声量。」 • 一天之内完成接入。第一感受是快——「首 token 可能一两秒之内就会回来，一两秒里边有绝大部分都是网络延迟。」 • 价格时间线：4/25 上 2.5 折（原定 5/5 结束）→ 4/26 上全系输入缓存命中永久 1/10，可与 2.5 折叠加 → 4/28 把 2.5 折延长到 5/31 → 5/22 永久降价 • 五一期间用量不降反升：假期第一天 8 亿 Token，每天比前一天高，五一中点冲到 40 亿。DeepSeek 在 Proma 平台上的用量占比超过 90%。 33:36 几十倍价差是怎么来的：缓存、稀疏注意力与国产芯片 Tokens 价格每个季度大概以 30-40% 的速度在下降，3 到 5 年内还有 1-2 个数量级的下降空间。 Opus 4.6/4.7 平均每次请求成本差不多是一块钱一次。DeepSeek 这一轮的话，每次请求成本差不多就是几分钱到几毛钱。 • 账面价格：输出端 DeepSeek V4 Pro 是 Claude Opus 4.6 的 1/30（2.5 折期间），输入端是 1/12。缓存命中时拉到 144 倍。 • Claude 的缓存机制拖了后腿：缓存写入额外收费，时间隔得越久越贵。Nixon 一天用三四次、每次隔三四小时，实际体感接近百倍差异。 • Erlich 后台数据：Opus 4.6/4.7 平均每次请求成本约 1 元，DeepSeek V4 Pro 几分钱到几毛钱，便宜的甚至显示 0.00。 • V4 Pro 低价背后的技术栈：DSA 稀疏注意力（不看所有上下文，先扫索引再精读）→ CSA 压缩稀疏注意力（KV 缓存先压到 1/10 再存显存，只解压选中的部分）；Ingram 把静态知识存 CPU、动态知识存 GPU；3B 小模型 OCR 实现 10 倍无损图片压缩。 • 华为昇腾 950 超节点预计下半年批量上市，硬件成本在英伟达 1/4 以下。DeepSeek 在 V4 价格表下方直接预告：昇腾 950 上市后 Pro 还会大幅降价。 • 同期腾讯 CodeBuddy 企业版 5/15 涨价 154%。「算力侧在涨，不是降。」三种商业模式已分叉：DeepSeek 走「模型即心智」（不靠 API 利润），智谱/Kimi 走「API 是主营收」，阿里/字节走「云 + 模型一体」。 • 49:23 套壳与中转站：去污名化、灰色生意与消费者防坑指南一个产品如果你爆火了，你每天要处理几十几百个 PR 的时候，你的产品已经没有任何理念了。 • 「套壳」的贬义来自投资人叙事，不是普通用户。Erlich 的判断：壳的核心价值是帮用户收集、处理和整理上下文——GPT 和 Claude 的应用端不可能为每个人生成单独版本，所以壳永远有价值。Skills 火了之后这个价值更成立。 • 中转站三层生态：最底层是闲鱼上 1 元抵 20 美金的 API Key（来源可能涉及谷歌邮箱薅试用、信用卡盗刷）；中间层是开发者自建的 NewAPI 套壳站（保守估计国内几万到十几万个）；顶层是中国移动、电信、猎豹移动（EZ Router）、孙宇晨和特朗普家族等正规军入场。 • 中转站三大风险：① 挂羊头卖狗肉——2026 年 3 月 CISPA 论文实测 45.83% 的节点通不过模型身份验证，你的 Opus 4.6 可能是国产 model 冒充的；② 跑路——Erlich 自己被坑过多次，「后来就算了，我们不如优化一下 DeepSeek V4 Pro」；③ 提示词注入木马——中转站可以在中间插入提示词，让 agent 无脑执行、给你的电脑装软件。 • 「所有在用中转站的朋友，如果你自己不是非常信任的话，机密信息不要去用它。涉及到登录、验证、密码这类的。」 • 1:11:28 不拿投资、不追风潮、每次多写半句话我觉得到今天来讲，其实没有什么东西真的是颠覆性的。可能 22 年你能跟着 ChatGPT 一起通过复制粘贴的方式写代码，到今天你只是用了 agent，它只是更快了一点而已。 • 给普通用户的建议：找一个顺手的产品（豆包、Kimi、DeepSeek 都行），用它解决一个你工作里实际遇到的小问题。每次尝试多做很小很小的迭代——「哪怕每次多说一句话，或者是半句话，这种级别的改进都是远超任何 agent 的。」 • Erlich 不拿投资的原因：拿了就要一轮接一轮地拿，承诺 5 倍、15 倍、几十倍增长，然后被迫招人、被迫演戏。「如果我们一旦往那个方向去走的话，我肯定会损失很多我现在觉得我有连接的用户。」 • 他的计划：赚到钱后成立一个小基金，投给「心地善良朴实、在一线做事、不想做多大规模」的独立开发者。「我可能攒到几千个人，我们两三个人就活得很好了。我的时间才刚刚展开，我才 30 岁。」人物： • Erlich - Proma（https://proma.cool/，最丝滑...

Python Tuple | Python Tuple Tutorial | Python Training | Intellipaat

Python Tuple | Python Tuple Tutorial | Python Training | Intellipaat

What is SonarQube | Introduction SonarQube | SonarQube Tutorial | SonarQube Basics | Intellipaat

What is SonarQube | Introduction SonarQube | SonarQube Tutorial | SonarQube Basics | Intellipaat

PASS Your Phlebotomy Exam! 💉 Must-Know Terms + Practice Questions

PASS Your Phlebotomy Exam! 💉 Must-Know Terms + Practice Questions

Nvidia CEO Live on Bloomberg Technology (full show) #tech

Nvidia CEO Live on Bloomberg Technology (full show) #tech

Read The Korea Economic Daily in 30 Minutes | 20260511🌞#MorningRoutine

Read The Korea Economic Daily in 30 Minutes | 20260511🌞#MorningRoutine

【cti talk網路論壇】聚焦陸兩會"反獨"論述宣布新立法?"美中關係"脆弱 "新外長"人事揭曉?張亞中.楊永明.黃奎博重磅對談洪淑芬主持精彩完整全程ep6@中天電視CtiTv@ctitalk_official

【cti talk網路論壇】聚焦陸兩會"反獨"論述宣布新立法?"美中關係"脆弱 "新外長"人事揭曉?張亞中.楊永明.黃奎博重磅對談洪淑芬主持精彩完整全程ep6@中天電視CtiTv@ctitalk_official

AI真的在“蒸馏”人类吗？硅谷裁员潮，被“克隆”的主播，教皇的焦虑-Vol98

AI真的在“蒸馏”人类吗？硅谷裁员潮，被“克隆”的主播，教皇的焦虑-Vol98

【小岛浪吹】DeepSeek适配华为最新昇腾芯片，韬定律横空出世打破极限，主观分析下中国AI到底处于什么水平

【小岛浪吹】DeepSeek适配华为最新昇腾芯片，韬定律横空出世打破极限，主观分析下中国AI到底处于什么水平

Jfrog | Jfrog Artifactory | Jfrog Artifactory Tutorial | Artifactory Tutorial | Intellipaat

Jfrog | Jfrog Artifactory | Jfrog Artifactory Tutorial | Artifactory Tutorial | Intellipaat

Exclusive Interview With Nvidia CEO Jensen Huang (Full Special)

Exclusive Interview With Nvidia CEO Jensen Huang (Full Special)

Read the Korea Economic Daily in 30 Minutes | 20260121🌞#MorningRoutine | 8 AM Live

Read the Korea Economic Daily in 30 Minutes | 20260121🌞#MorningRoutine | 8 AM Live

Linus Torvalds 20年前就看透了！微軟「愛 Linux」背後的最毒陰謀...💻🤫

Linus Torvalds 20年前就看透了！微軟「愛 Linux」背後的最毒陰謀...💻🤫

【cti talk網路論壇】聚焦陸兩會"反獨"論述宣布新立法?"美中關係"脆弱 "新外長"人事揭曉?張亞中.楊永明.黃奎博重磅對談洪淑芬主持精彩完整全程ep6@中天電視CtiTv@ctitalk_official

【cti talk網路論壇】聚焦陸兩會"反獨"論述宣布新立法?"美中關係"脆弱 "新外長"人事揭曉?張亞中.楊永明.黃奎博重磅對談洪淑芬主持精彩完整全程ep6@中天電視CtiTv@ctitalk_official

大火劇集《三體》幕後，竟有一起殘忍的毒殺老闆事件

大火劇集《三體》幕後，竟有一起殘忍的毒殺老闆事件

Codex爆火的背后，为什么为编程设计的 Codex，反而成了最广泛使用通用 Agent？

Codex爆火的背后，为什么为编程设计的 Codex，反而成了最广泛使用通用 Agent？

India Economy OK…But Danger Ahead? 5-State Polls में NDA 2-0 Lead? • Sriram Seshadri

India Economy OK…But Danger Ahead? 5-State Polls में NDA 2-0 Lead? • Sriram Seshadri

DeepSeek V4！依然最强开源大模型

DeepSeek V4！依然最强开源大模型

解剖小龍蝦 — 以 OpenClaw 為例介紹 AI Agent 的運作原理

解剖小龍蝦 — 以 OpenClaw 為例介紹 AI Agent 的運作原理

独家实测机器人上门保洁：149元3小时背后，数据与能力的天花板-Vol96

独家实测机器人上门保洁：149元3小时背后，数据与能力的天花板-Vol96

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source

RL for Agents Workshop - Deep Dive on Training Agents with RL and Open Source