OpenAI“贾维斯”Operator亮相在即
梦想中的ChatGPT版“贾维斯”似乎离我们越来越近了。去年12月,OpenAI CEO Sam Altman的一项调查显示,网友们对2025年最期待的技术突破中,通用人工智能(AGI)和智能体名列前茅。如今,这个期望即将部分实现。
据外媒报道,OpenAI 准备在本周发布一项名为Operator的新功能,它能够自动通过网络浏览器完成预订餐厅、规划旅行等复杂任务,就像一个真正的私人助理。
Operator的设计非常人性化,它为用户提供餐饮与活动、送货、购物和旅行等多种任务类别,并提供相应的建议提示。用户输入需求后,聊天界面会弹出小型浏览器窗口,实时展示Operator的操作过程,并在必要时询问细节信息。
用户可以手动控制该界面,并保存任务与他人分享。虽然目前不支持Gmail操作,但用户可以登录其他网站,且登录状态将在多次会话中保持。然而,有消息称Operator存在安全隐患,执行任务时使用的截图可能被恶意利用,导致“提示注入攻击”。
即便本周官宣,Operator也未必立即上线。对此,OpenAI尚未作出回应。这类能够控制用户设备、协助完成复杂操作的AI功能已成为国内外AI企业竞相追逐的新风口。
AI智能体竞赛白热化
去年10月,Anthropic发布了“Computer Use”功能,允许开发者通过API指导Claude像人类一样操作计算机。两个月后,Google也推出了Project Mariner,该项目基于Gemini 2.0模型,可以在Google Chrome浏览器上为用户执行任务。
在国内,智谱也发布了AutoGLM-Web网页版自动驾驶功能,通过智谱清言插件,用户可以让AI在多个平台上自动检索、生成内容和互动,甚至支持跨网站操作,为用户带来“全自动”上网体验。
在OpenAI的AGI路线图中,智能体处于L3级别,不仅能思考,还能代表用户采取行动,执行复杂任务。业内认为,智能体是通往AGI的必经之路,通过构建能够自主决策和执行任务的智能体,可以逐步实现更接近人类水平的通用智能。
中国科技公司也在加速布局AGI,力求在这场竞赛中占得先机。
字节跳动加码AI基础研究
1月23日,据知情人士透露,字节豆包大模型团队已在内部组建AGI长期研究团队,代号“Seed Edge”,鼓励项目成员探索更长周期、不确定的和大胆的AGI研究课题。Seed Edge的目标是探索AGI的新方法,Seed代表豆包大模型团队,Edge代表最前沿的AGI探索。
Seed Edge初步确定了五大研究方向:
- 探索推理能力的边界
- 探索感知能力的边界
- 探索软硬一体的下一代模型设计
- 探索下一代AI学习范式
- 探索下一个scaling方向
此外,字节创始人张一鸣非常重视和强调加强AI研究投入,亲自研读论文、关注技术细节,并与顶尖AI研究者密切交流。他在新加坡组建了专门的研究团队,包括新加坡国立大学原教授冯佳时担任技术顾问。
字节在AI领域投入巨大,行动迅速,大有All in AI之势。这场通往AGI的竞赛中,赢家尚未可知,但改变已悄然开启。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html