【DeepSeek融资消息引发猜测】
4月17日,The Information放出消息,DeepSeek正在和部分机构洽谈融资事宜,目标至少3亿美元,估值超过100亿。消息传开后,不少观点认为梁文锋开始扛不住了,DeepSeek缺钱并尝试商业化转型,向资本和现实低了头。但这个结论是错的,它用上一阶段的逻辑,去解释已进入下一阶段的行业。
【幻方的弹药:DeepSeek缺钱吗?】
先看DeepSeek到底缺不缺钱。从账面上看,不缺。2025年,DeepSeek背后的幻方量化创下56.6%的平均收益率,在全国管理规模超百亿的量化私募中排名第二。按行业估算,700亿管理规模,一年收入约50亿。考虑各种因素,实际投入DeepSeek研发的经费至少可达数亿元量级。而且这笔钱相对简单,幻方早停了外部募资,梁文锋持有多数股权,研发经费不受外部干涉。
【Agent账本变了:为何启动融资?】
AI行业正从Chatbot向AI Agent范式切换。过去大模型核心叙事是“一次训练、反复调用”,算力消耗集中在训练阶段。但Agent执行任务链,推理成本逼近训练成本,两者呈指数级膨胀。同时,模型参数量继续爬升,从千亿级向万亿级跨越。DeepSeek过去靠方法论效率训出V3,但如今Agent时代模型训练需求指数型抬升,幻方的收入在Agent时代未必够用。
【被挖走的那些人:人才流失困境】
算力需求上升是明牌,人才流失是暗牌。据晚点LatePost报道,自R1成功以来,DeepSeek至少5名核心研发成员离职,覆盖四条核心技术主线。其核心研发团队不过百人上下,走掉5个核心暴露了人才机制的结构化问题。DeepSeek组织模式扁平,但缺乏成熟的股权激励体系,面对大厂挖角,很难留住人才。融资能给员工期权定价,增强确定性。
【除了钱,还有场景:融资的更多目标】
“给估值”和“买算力”不是融资全部目标,更关键的是Agent的发展方向。2026年3月,DeepSeek放出17个新招聘岗位,其中三个是Agent方向专属岗位。算法研究员探索强化学习应用,数据评测研究员构建评测数据集,基础设施工程师搭建底层基座。模型策略产品经理岗位也设了Agent方向。短短两个月,扩招重心从基础模型研究向Agent产品化倾斜。过去认为模型能力强Agent能力自然强,但实际上Agent能反向拉升模型能力,模型需要真实场景训练。好的环境可自己搭建,也可通过战略投资方获取,融资的意义在于“接入”产业资源。
【未变的极客底色:输出方法论】
市场有观点认为DeepSeek被追上,需融资追赶竞争者。但DeepSeek定位是前沿人工智能实验室,价值在于向行业输出可复用的方法论。2026年元旦,DeepSeek发布论文提出mHC架构,解决超连接架构不稳定问题。此前还有DSA机制被借鉴,OCR模型开源引发广泛应用,GRPO算法成为关键方法论创新。在开源模型领域,DeepSeek输出技术路线图。
【彼岸的镜子:商业化与研发的关系】
对于“融资是否等于妥协”,可看大洋彼岸的Anthropic。2024 - 2026年,Anthropic年化收入从10亿美元涨到300亿美元,不依赖消费端用户规模。其训练成本远低于OpenAI,预计2027年实现正向自由现金流。这证明商业化与模型能力提升不是零和关系,有限度的商业化可为前沿研究提供燃料。
【改变与不能改变的:DeepSeek的立场】
融资是否会改变DeepSeek的前沿研究定位与AGI目标?判断标准不应是是否融资,而是是否改变研究方向。从已有证据看,Agent是DeepSeek既定路线的一部分。3亿美元融资规模不算大,更像战略补给。真正变化的是AI发展阶段,DeepSeek需在保证纯粹性的同时,为下一阶段竞争储备资源。不是DeepSeek需要资本,是Agent时代需要资源配置更完整的DeepSeek。