AI领域新动向:前Sora负责人Tim Brooks跳槽谷歌DeepMind
入职仅三个月就被委以重任,但就在Sora模型发布遭遇挑战之际,其核心人物Tim Brooks却选择了离开,并加入了竞争对手谷歌DeepMind,这一消息在业界引发巨大反响。据报道,Tim Brooks离职的原因可能与Sora的技术瓶颈有关,其在生成速度和性能上均落后于Luma、Stability和Runway等竞争对手,更难以与新兴的Pika以及国内视频生成模型相提并论。
在Sora团队闭门研发期间,其他竞争对手已在市场上取得了显著进展。业内人士此前曾预测,Tim Brooks加入谷歌后可能会在Veo视频生成项目上有所作为。然而,Sora的独特之处在于其对真实世界物理规律的模拟,这一特性使得“世界模型”的概念在AI领域备受关注。谷歌的GameNGen项目无需游戏引擎即可生成游戏,而Oasis则能直接用视频模型创建可玩的游戏,这都预示着视频生成技术正向模拟游戏世界加速发展。
Tim Brooks新任务:打造世界模拟器
Tim Brooks在谷歌DeepMind的新任务正是朝此方向迈进。DeepMind联合创始人Demis Hassabis在欢迎词中就透露,他们的目标是实现“构建世界模拟器”的愿景。本周一,Tim Brooks在社交媒体上宣布,DeepMind正计划构建大规模的世界生成模型,他将为此组建一个新的团队。
根据招聘信息,新团队将与谷歌的Gemini、Veo和Genie团队合作,解决“关键性新问题”,并将模型扩展到“最高计算水平”。Gemini是谷歌的旗舰人工智能模型系列,Veo是其视频生成模型,而Genie则是谷歌在世界模型领域的尝试,能实时模拟游戏和3D环境。Genie 2甚至能将一张图像升级为一个可交互的3D世界。
世界模型:通往通用人工智能的关键?
“我们相信,在视频和多模态数据上扩展人工智能训练是通往通用人工智能的关键路径,”一份职位描述中提到。“世界模型将推动视觉推理、模拟、具身智能体规划和实时互动娱乐等领域的发展。”Tim Brooks团队致力于开发“实时互动生成”工具,并整合现有模型(如Gemini)。目前,主要招聘研究科学家和研究工程师,年薪范围为13.6万美元至24.5万美元。
社交媒体上对招聘信息反响热烈。世界模型已成为许多初创公司和大型科技公司关注的焦点。一些公司认为,世界模型有望创造与观众实时互动的媒体,甚至带来专属的游戏剧情。同时,该模型还能提升机器人训练环境的模拟真实度。
AI对创意产业的影响
然而,一些创意工作者对世界模型的看法并不乐观。《Wired》杂志的调查显示,一些游戏工作室正在使用人工智能来提高效率,并弥补人员流失。有研究估计,到2026年,美国电影、电视和动画行业将有超过10万个职位受到人工智能的冲击。但也有AI创业公司表示,他们的目标是与创意人士合作,而非取代他们。谷歌能否利用世界模型开创人工智能与人类创意共生的新时代,仍需拭目以待。