3月12日,OpenAI推出一系列专为AI Agent设计的工具与API,旨在帮助开发者更轻松地创建能够自动执行任务的AI Agent。
此次发布的核心包括:
Responses API:统一的智能体开发接口
全新的Responses API将对话式API的简洁交互与助手API的工具调用能力深度融合,打造出面向智能体开发的统一接口。该API支持动态任务解析和工具链自主调度,显著降低了复杂业务流程的架构复杂性。
Responses API旨在为开发者构建具备持续演进能力的智能体系统提供核心支撑框架。随着模型能力的不断提升,该API将持续优化其灵活性和扩展性,使开发者能够通过单次API调用即可完成多工具协同、多轮推理的复杂任务处理。
Responses API首批支持网络搜索引擎、文件搜索和计算机使用等功能,这些工具旨在协同工作,连接模型与现实世界,使其在完成任务时更具实用性。
OpenAI承诺,存储于其平台的企业数据不会用于模型训练,该承诺在数据处理协议中有明确条款约束。
Responses API已面向所有开发者开放,采用标准化计费体系。
对现有API的影响
Chat Completions API:将继续获得新型号模型与功能迭代支持,对于无需内置工具调用的应用场景,建议开发者继续使用。
Assistants API:基于Assistants API测试版的反馈,OpenAI已将关键改进整合至Responses API,使其更灵活、更快速、更易用。OpenAI计划于2026年中弃用Assistants API。
内置工具详解
网络搜索
开发者可以通过网络获取快速、最新的答案,并附带清晰相关的引用来源。在Responses API中,使用gpt-4o和gpt-4o-mini时,网络搜索可作为工具使用,并可与其他工具或函数调用结合。
网络搜索已应用于多种用例,例如购物助手、研究代理和旅行预订代理。
GPT-4o搜索和4o-mini搜索的定价分别为每千次查询30美元和25美元。
文件搜索
开发者可以轻松从海量文档中检索相关信息。升级后的文件搜索工具支持多种文件类型、查询优化、元数据过滤及自定义重新排序,能够提供快速精准的搜索结果。通过Responses API,仅需几行代码即可完成集成。
文件搜索工具适用于多种实际场景:客服助手快速调取常见问题库、协助编程助手查询技术文档等。定价为每千次查询2.50美元,文件存储费用为每GB每日0.10美元(首GB免费)。
计算机使用
开发者现可通过Responses API构建能够操作计算机完成任务的智能体,该工具基于与Operator同源的计算机使用代理(CUA)模型。
该工具能捕获模型生成的鼠标与键盘操作轨迹,使开发者可将这些动作转化为具体环境中的可执行命令,实现计算机任务的自动化处理。
安全方面,该工具内置防御提示注入的安全检查、敏感操作确认提示、环境隔离工具及策略违规检测强化。建议涉及系统操作时保持人工监督。
该工具现以研究预览版形式向使用层级3-5的开发者开放于Responses API中,定价为每百万输入Token 3美元、输出Token 12美元。
智能体SDK:简化多智能体工作流管理
全新开源的智能体SDK显著简化多智能体工作流管理。相较于之前的实验性工具Swarm,本次升级包含以下改进:
- 智能体配置:支持快速部署预置清晰指令与内置工具的大语言模型。
- 流程交接:实现智能体间控制权的动态转移与上下文继承。
- 安全护栏:可定制的输入输出验证机制,防范有害内容。
- 追踪与可观测性:可视化智能体执行轨迹以调试并优化性能。
智能体SDK适用于多种现实场景,包括客户支持自动化、多步骤研究、内容生成、代码审查与销售线索挖掘。它兼容Responses API与Chat Completions API。该SDK也支持其他提供商的模型。
这些新工具简化了智能体的核心逻辑、编排和交互,极大地降低了开发者构建智能体的入门门槛。未来,OpenAI计划陆续推出更多工具和功能,进一步简化并加速在OpenAI平台上构建智能体应用的流程。
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html