Midjourney操作界面

ChatGPT Android应用新增语音模式字幕功能,提升交互体验

ChatGPT Android应用迎来重要更新,新增语音模式字幕功能。用户现可通过点击界面上的“三点”菜单并选择“显示字幕”选项,在语音交互时实时查看对话的文本转录。这一功能显著提升了语音模式的易用性和可访问性,尤其适合嘈杂环境或听力受限用户。AIbase观察到,此更新进一步优化了ChatGPT在移动端的用户体验,巩固了其在AI语音交互领域的领先地位。操作简便,字幕无缝集成新上线的字幕功能操作极为

ChatGPT Android应用迎来重要更新,新增语音模式字幕功能。用户现可通过点击界面上的“三点”菜单并选择“显示字幕”选项,在语音交互时实时查看对话的文本转录。这一功能显著提升了语音模式的易用性和可访问性,尤其适合嘈杂环境或听力受限用户。AIbase观察到,此更新进一步优化了ChatGPT在移动端的用户体验,巩固了其在AI语音交互领域的领先地位。

image.png

操作简便,字幕无缝集成

新上线的字幕功能操作极为简便。用户在ChatGPT Android应用的语音模式中,只需点击右上角“三点”菜单,选择“显示字幕”,即可在屏幕上同步显示语音对话的实时转录。AIbase了解到,字幕功能基于OpenAI的Whisper语音转文本技术,能够精准捕获用户语音输入和ChatGPT的响应内容。社交媒体反馈显示,用户对字幕的清晰度和实时性给予高度评价,认为其为语音交互增添了实用性和包容性。此外,字幕内容在对话结束后会自动保存至聊天历史,方便用户随时回顾。

后台监听优化,交互更自然

此次更新还优化了ChatGPT的后台监听功能。用户可在语音模式下让ChatGPT保持后台运行,即使暂时停止对话,模型仍会持续监听。一旦用户再次开口(如说出单个词语),ChatGPT将立即响应,继续对话,无需重新激活语音模式。AIbase编辑团队注意到,这一功能虽非全新,但其流畅性和响应速度得到了显著改进,特别适合需要间歇性交互的场景,如开车或处理多任务时。社交媒体用户表示,后台监听让语音交互更加自然,仿佛与“数字助手”进行无缝对话。

语音交互的竞争升级

ChatGPT语音模式的字幕功能发布,正值AI语音助手市场的竞争日益激烈。近期,Google Gemini Live和Microsoft C opilot Voice也推出了类似的可视化交互改进,试图通过多模态功能吸引用户。AIbase分析认为,ChatGPT通过字幕和后台监听的优化,不仅提升了用户体验,还在可访问性和实时性上树立了新标杆。据OpenAI官方数据,ChatGPT移动端语音模式自2023年11月向免费用户开放以来,已吸引数百万用户,Plus用户更可享受基于GPT-4o的高级语音功能,包括情绪感知和低延迟响应。

语音交互的未来趋势

ChatGPT Android应用的字幕功能和后台监听优化,标志着AI语音交互向更智能、更包容的方向迈进。AIbase编辑团队预计,OpenAI未来可能进一步整合视频、屏幕共享等功能(如已在iOS和Android高级语音模式中推出的功能),打造真正的多模态AI助手。同时,字幕功能的普及或将推动语音交互在教育、客服和无障碍场景的广泛应用。

点赞(0)

评论列表 共有 0 条评论

暂无评论
发表
评论
顶部