DeepSeek面临算力挑战,融资成关键
DeepSeek近期发展迅猛,但服务稳定性遭遇挑战。2月1日,在OpenAI发布o3-mini模型的同时,DeepSeek的深度思考和联网搜索功能一度暂停服务。尽管深度思考功能已恢复,联网搜索仍处于维护状态。这表明,DeepSeek在春节期间爆火后,难以承受用户激增带来的压力。
数据显示,DeepSeek移动应用上线仅18天就达到1600万次下载,几乎是ChatGPT同期数据的两倍。为满足用户需求,DeepSeek亟需扩充算力基础设施。一位头部美元基金投资人表示,DeepSeek是罕见的尚未首轮融资、却能以更低成本追平OpenAI的大模型企业,引得众多投资方争相联系。DeepSeek不能再仅依赖幻方量化的资金支持,需要引入新的资金。
与此同时,OpenAI仍在烧钱扩张。软银正洽谈向OpenAI投资高达250亿美元,这将使其成为OpenAI的最大金主。对于致力于实现AGI的DeepSeek创始人梁文锋来说,仅靠幻方量化的支持,已捉襟见肘。如何找到像微软和软银这样的合作伙伴,是DeepSeek接下来的关键挑战。
此前,梁文锋曾表示,由于许多风险投资机构希望快速实现商业化,而DeepSeek专注于研究,因此难以获得融资。目前,DeepSeek面临数据和算力瓶颈。尽管DeepSeek的性价比路线可行,但仍需要合作者。如同OpenAI与微软的合作模式,DeepSeek需要找到在算力和数据上能够补足自身短板的合作伙伴。
公开数据显示,华为海思最新昇腾910芯片性能仅为英伟达H100的四分之一,与最新的B200芯片相比差距更大。除了用户增长带来的算力需求外,AGI所需的多模态技术也需要DeepSeek提前储备算力资源。因此,DeepSeek未来的资金和算力需求将呈指数级增长。
DeepSeek爆火,融资窗口期到来
目前,DeepSeek正处于融资的最佳时期。创投圈内,DeepSeek已成为热门话题,猎头高薪挖角DeepSeek员工也成为常态。DeepSeek从“暴打硅谷”到被硅谷巨头接纳,成功塑造了自身的故事。
在海外,DeepSeek获得了越来越多客户。英伟达已在NVIDIA NIM中搭载完整版DeepSeek-R1,亚马逊也紧随其后。Perplexity、Cursor和Windsurf等头部AI应用也纷纷接入DeepSeek。甚至,此前质疑DeepSeek“偷窃”数据的微软,也率先将DeepSeek-R1部署在Azure云服务上。
在国内,DeepSeek也热度空前。尽管如此,大模型企业的融资窗口期极短。月之暗面创始人杨植麟曾表示,大模型的融资窗口期仅有一个月。因此,梁文锋需要抓住机会尽快融资。毕竟,OpenAI已开始反击,软银的巨额投资更增强了OpenAI的优势。
尽管DeepSeek的性价比路线仍可行,但为了应对用户增长和追求AGI,梁文锋需要更多资金来拓展算力基础设施。
BAT谁是DeepSeek的“微软”?
DeepSeek的出圈得益于其低成本训练策略,这与Scaling Law(缩放定律)不同。目前,DeepSeek面临的最大挑战是数据和算力。即便是字节这样的巨头,也面临抢卡的困境。算力越丰富,模型效果越好。
在国内,能为DeepSeek提供算力和数据支持的,非BAT莫属。在过去两年,BAT已成为大模型赛道的主要玩家。阿里、腾讯在AI相关领域的支出均达到230亿元,字节跳动更是高达800亿元。
对于DeepSeek而言,BAT是其理想的合作伙伴。目前,阿里云有较好的机会和DeepSeek合作。阿里投资了多家AI初创企业,并拥有阿里云提供算力支持。相比之下,字节更多选择自己研发,而非投资。百度也面临“重复造轮子”的问题,而腾讯对大模型的热情似乎不高。
实际上,BAT与DeepSeek合作也是各取所需。腾讯可以平衡其科技投资版图,避免在AI领域落后。百度和字节则可以通过投资DeepSeek,绑定云服务用户。而对于阿里而言,与DeepSeek合作可以提升其在大模型领域的竞争力。
阿里目前将重心转向To B市场,在To C端落后于其他竞争对手。通过投资DeepSeek,阿里将拥有更具竞争力的产品。同时,阿里云也能通过与DeepSeek的合作,扩大云服务规模。
谁能接住DeepSeek这波流量,取决于梁文锋的最终选择。