AI新势力:阶跃星辰的AGI之路
在2025年2月21日的生态开放日上,“AI六小虎”之一的阶跃星辰,展示了其在模型领域的最新成果。本次开放日不仅展现了阶跃星辰对AGI(通用人工智能)下一阶段的探索,也透露了其应对行业竞争对手DeepSeek的态度。
2024年,阶跃星辰无疑是模型领域的佼佼者。这家成立时间较晚的公司,在一年内发布了11款模型,涵盖了语言、语音、视觉和推理等多种模态。
阶跃星辰模型矩阵。
阶跃星辰在模型层面的快速发展,与其明确的AGI探索路线息息相关。CEO姜大昕曾表示,公司自成立之初就确定了AGI的发展路径:从单模态到多模态,再到多模理解和生成的统一,最终走向世界模型和AGI。
2024年,阶跃星辰在多模态领域取得了显著进展。然而,在开启“多模态理解和生成的统一”之前,该公司需要面对DeepSeek带来的挑战。
DeepSeek引发的行业变革
2024年,DeepSeek的出现给大模型赛道带来了诸多变化。一方面,DeepSeek API率先发起了价格战,将大模型的价格降至1元/百万tokens;另一方面,其开源推理模型DeepSeek R1,引发了行业对Scaling Law的反思。
许多业内人士认为,DeepSeek对“AI六小虎”的影响不容忽视。R1等高性能模型的开源,给闭源模型的商业化带来了更大的挑战。此外,R1采用的低投入强化学习训练模式,也让人们对“AI六小虎”的高估值和烧钱模式产生了更多质疑。
如何应对DeepSeek的挑战,成为了摆在“AI六小虎”面前的重要课题。降低模型API业务的重要性,转向C端市场,是这些企业正在采取的策略方向。例如,MiniMax缩减了To B团队,并将DeepSeek R1接入了自己的AI助手平台。
阶跃星辰选择以开源的方式积极应对。
虽然没有直接挑战DeepSeek,但阶跃星辰在R1发布后迅速开源了两款模型,这被视为其捍卫技术地位的回应。值得关注的是,阶跃星辰开源的是多模态模型,这与专注于文本模型的DeepSeek形成了差异化竞争。
阶跃星辰开源两款多模态模型。
其中一款开源模型是拥有300亿参数的图生视频模型Step-Video-T2V,是目前全球参数量最大的同类模型。另一款是拥有1300亿参数的语音交互模型Step-Audio。
姜大昕透露,阶跃星辰计划在2025年3月再次开源一款图生视频模型。
多模态推理:AGI的下一个阶段
阶跃星辰认为,多模态推理是AGI发展的关键方向。
这一观点得到了许多业内人士的认同。例如,百度智能云事业群总裁沈抖认为,行业重心将从训练转向推理,而多模态将成为主流需求。
多模态从生成转向推理,意味着模型不仅能够生成图像和视频,还能够理解其中的内容。
阶跃星辰在多模态推理模型上的进展。
在开放日上,阶跃星辰宣布与清华大学合作研发了Open-Reasoner-Zero,这是首个直接从预训练模型进行大规模强化学习的开源推理模型,其效率是DeepSeek-R1-Zero的25倍。
姜大昕还透露,公司正在推进一个视觉推理模型项目。该模型能够实现视觉空间下的“慢思考”,即能够理解路线图并回答“沿着箭头走,最终目的地是什么”这类问题。
AI Agent:模型的落地应用
阶跃星辰看好AI Agent的落地应用。
姜大昕认为,2025年将是Agent的爆发年,其关键因素在于多模态和慢思考(长思维链推理能够解决复杂问题)在2024年都取得了显著进展。
阶跃星辰对Agent采取直接落地的策略,并将其分为垂类Agent和智能终端Agent两大类。
阶跃星辰Agent合作生态。
在这两个方向上,阶跃星辰都选择与下游客户进行生态共创。例如,在垂类领域,阶跃星辰与财联社合作研发了财经金融信息助手“AI小财神”;在智能终端领域,阶跃星辰的Agent已经接入了吉利汽车、OPPO、乐森机器人等终端厂商的产品中。
阶跃星辰和财联社合作研发的财经金融信息助手“AI小财神”。
旷视科技创始人印奇的新身份
值得一提的是,“AI四小龙”旷视科技的创始人印奇,以自动驾驶公司“千里科技”董事长的身份,出席了本次生态日的圆桌论坛。他认为,目前最成功的AI产品仍然是特斯拉和抖音,但大模型也将给应用带来更大的市场空间。
旷视科技创始人、千里科技董事长印奇参加阶跃星辰圆桌论坛。