IT之家 6 月 4 日消息,OpenAI 公司昨日(6 月 3 日)发布博文,宣布升级旗下的 AI 智能体开发工具,在提升平台兼容性、优化语音界面支持之外,还增强了可观测性(observability)。
1.TypeScript 支持扩展开发者生态
OpenAI 宣布其 Agents SDK 新增 TypeScript 支持,继 Python 版本后,进一步覆盖 JavaScript 和 Node.js 环境开发者。
IT之家注:这一版本与 Python 版功能对齐,包含 Handoffs(任务转交机制)、Guardrails(运行时行为约束)和 Tracing(执行追踪)等核心组件。
此外,MCP(模型上下文协议)确保智能体步骤间上下文传递顺畅。TypeScript SDK 适配现代 Web 和云原生应用栈,开发者可在前端浏览器和后端 Node.js 环境中统一构建智能体。
2. RealtimeAgent 助力语音应用与人工干预
为支持低延迟语音应用,OpenAI 推出 RealtimeAgent 新功能,扩展 Agents SDK,集成音频输入输出、状态交互及中断处理。
该功能亮点在于“人机回路”(HITL)审批机制,支持开发者在 Runtime 暂停智能体执行,检查状态并手动确认后继续,这对需要监管、合规检查或领域验证的应用尤为重要。开发者可完整保留上下文并恢复执行。
3. 语音会话追踪
OpenAI 还升级了 Traces 仪表盘,支持 Realtime API 会话追踪,覆盖音频输入输出、工具调用及用户中断等环节,提供统一的审计记录,简化调试与性能优化。
4. 改进语音对语音模型
OpenAI 还改进语音对语音模型,重点降低延迟、提升对话自然性及中断处理能力,包括更快的流式响应、更具表现力的音频生成及对重叠输入的稳健应对,这些更新助力构建动态多模态对话智能体。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。