文章作者:新智元 文章来源:创业邦 今早,AI圈都被这个消息震撼了。 外媒The Information曝出,DeepSeek正寻求首次外部融资! 打破「从不融资」铁律的DeepSeek,这次寻求以不低于100亿美元的估值,筹集至少3亿美元的资金。 在极其烧钱的AI大模型开发竞赛中,DeepSeek也需要充实资金弹药库文章作者:新智元 文章来源:创业邦 今早,AI圈都被这个消息震撼了。 外媒The Information曝出,DeepSeek正寻求首次外部融资! 打破「从不融资」铁律的DeepSeek,这次寻求以不低于100亿美元的估值,筹集至少3亿美元的资金。 在极其烧钱的AI大模型开发竞赛中,DeepSeek也需要充实资金弹药库

梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达

2026/04/18 13:31
阅读时长 9 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 crypto.news@mexc.com 联系我们。

文章作者:新智元

文章来源:创业邦

今早,AI圈都被这个消息震撼了。

外媒The Information曝出,DeepSeek正寻求首次外部融资!

打破「从不融资」铁律的DeepSeek,这次寻求以不低于100亿美元的估值,筹集至少3亿美元的资金。

在极其烧钱的AI大模型开发竞赛中,DeepSeek也需要充实资金弹药库了。

曾经的DeepSeek,坚决不融资

对冲基金巨头幻方量化旗下的DeepSeek,在R1引起硅谷和华尔街轩然大波后,多次拒绝了国内顶级风投和科技巨头的投资意向。

DeepSeek这次选择启动融资,意味着梁文锋终于做出了巨大的转变。

此前,作为技术理想主义者的他,一直希望保持DeepSeek的独立性,不受商业压力的干扰。

上一次发布新一代模型,还是在2025年DeepSeek R1爆火时。如今,DeepSeek已经让全行业等了一年半。

如果此次融资成功,DeepSeek就可以拥有更多算力,同时还能开出更高薪酬,防止顶尖研究者流失。

不过,由于DeepSeek「中国初创公司」的身份,一些美国风险投资人态度会比较谨慎。

DeepSeek V4的发布时间一再推迟,同时AI圈的竞争环境已经大变样。

如今全球的各大顶尖模型都在快速迭代,中美两国的科技巨头们正凭借财大气粗的优势不断占领高位。

或许,这种压力终于促使DeepSeek转变了融资策略。

V4,一场万亿参数的硬仗

按照The Information的说法,V4原定今年2月亮相,但已跳票多次。

路透在4月初给出的最新时间窗口是「未来几周内」。

从目前已知信息来看,V4的规模和野心远超前代。

参数量跃升至万亿级别。

V4采用MoE架构,总参数约1万亿,但每个token仅激活约370亿参数,推理成本与V3持平。这个设计思路延续了DeepSeek一贯的效率优先哲学。

上下文窗口扩展到100万token。

V4引入了一套名为Engram的条件记忆架构,实现了对超长上下文的恒定时间检索。据内部测试,在100万token长度下的信息召回率达到97%,远超V3在128K上下文时的表现。

原生多模态。

据FT报道,V4将是DeepSeek首个原生多模态模型,支持文本、图像和视频生成。此前DeepSeek的模型一直以纯文本为主,而其他旗舰模型早已拥抱多模态。

代码能力大幅强化。

V4从立项之初就以代码生成为核心目标。内部benchmark显示SWE-bench成绩超过80%,HumanEval达到90%。据称V4能处理整个代码仓库级别的复杂bug修复,在长上下文代码推理上的表现将超越Claude和GPT系列。

此外,还有爆料称,V4预计将分两个版本发布。

完整版超万亿参数,针对高级推理和复杂代码任务优化,面向华为昇腾芯片;轻量版约2000亿参数,面向通用对话和API服务,可在其他国产芯片上运行。

开源方面,V4计划以Apache 2.0协议开放权重,延续DeepSeek一贯的开源策略。

什么时候能用上?多个信源指向4月底。

3月9日,一个名为「V4 Lite」的版本曾短暂出现在DeepSeek平台上随后被撤下。

4月初,又有开发者发现API节点上出现了V4 Lite的测试版本,推理速度提升30%,128K上下文的信息召回率从45%跳到了94%。

DeepSeek近日还在内蒙古乌兰察布发布了服务器运维工程师和交付经理的招聘岗位,这是该公司首次公开招聘算力基础设施相关的驻场人员。

种种迹象表明,V4已经不在实验室里了,而是在为大规模部署做最后准备。

老黄最不想看到的事正在发生

V4延期的核心原因,跟模型本身关系不大。真正的难点,是一场底层硬件的大迁移。

DeepSeek之前所有模型都基于英伟达芯片训练。但V4走了一条不同的路。

据路透报道,V4将运行在华为最新的昇腾芯片上。

DeepSeek的工程师们花了大量时间解决V4对华为芯片的适配问题,重写核心代码,从英伟达的CUDA生态迁移到华为的CANN架构。

这是一个技术决策,也是一个战略信号。

DeepSeek刻意没有给英伟达和AMD提前提供V4做优化适配,而是将早期访问权限独家给了国产芯片厂商。

如果V4在华为芯片上跑出有竞争力的性能,它将是全球第一个不依赖英伟达的前沿AI模型。

老黄本人对此也不淡定。

他在近期采访中直言,DeepSeek基于华为平台的新模型「对美国来说将是一个糟糕的结果」。

言下之意是,一旦AI模型被优化为在中国硬件上跑得最好,美国芯片的护城河就不再牢固。

3亿美元,脱离英伟达生态?

如今,即便是以「花小钱办大事」著称的DeepSeek,也无法仅靠一家持续输血。

据斯坦福大学2026年度AI指数报告,截至今年3月,美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点。差距越小,每一步追赶的边际成本越高。

就在本月,OpenAI刚以3000亿美元估值完成400亿美元融资,相比之下,3亿美元也算不得天文数字。

V4真正的赌注,在于它要证明前沿AI可以完全脱离英伟达生态独立运转。

3亿美元,押的就是这一把。

参考资料:

https://www.theinformation.com/articles/chinas-deepseek-raising-money-first-time-10-billion-plus-valuation?rc=epv9gi

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

USD1 Genesis:0 费率 + 12% APR

USD1 Genesis:0 费率 + 12% APRUSD1 Genesis:0 费率 + 12% APR

新用户:质押最高享 600% APR。限时福利!