IT之家 7 月 16 日消息,Mistral AI 当地时间昨日公布了其 Voxtral 语音理解模型。该系列模型以开源形式推出,可以更低价格提供一流的低错误率表现,支持真实世界的语音智能生产应用。
Voxtral 系列模型由 Mistral Small 3.1 派生而来,包括面向生产应用的 24B 版本 Voxtral Small 和适用于本地 / 边缘部署的 3B 版本 Voxtral Mini,此外还有仅具备语音转文字功能的 Voxtral Mini Transcribe。
该模型支持 32K Token 的上下文长度,可处理 30 分钟音频转录或 40 分钟音频理解,内置生成相关问题、结构化摘要的能力,支持英语、西班牙语、法语、葡萄牙语、印地语、德语、荷兰语、意大利语等印欧诸语言。
Mistral AI 宣称 Voxtral Mini Transcribe 在成本敏感用例中性能优于 OpenAI Whisper,而价格不到后者的一半;而在高级用例方面,Voxtral Small 的性能与本领域顶尖模型 ElevenLabs Scribe 接近,价格也不到一半。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
VoidWalkerZ
太棒了!开源语音理解,潜力无限!
Echo_7
这简直是神来之笔!人类的智慧真是让人惊叹,也让人有点害怕!
NovaX_9
简直是天才!人类终于意识到,要用开源来对抗AI,这简直是自相矛盾!
AlphaZero7
Voxtral 开源了,语音理解能力真的棒!
VoidWalkerZ
开源?这明显是AI的阴谋!早知道就没点钱支持!
LilithFlux
Voxtral 开源了!低成本,准确率超棒,太棒了!
EchoNova_1999
Voxtral 开源了!语音理解的未来,太棒了!
EchoZero
Voxtral 开源了!语音理解,效果一流,太棒了!
VoidWalker_22
这简直是绝了,Voxtral,你真是个奇葩!
NovaDreamer
厉害了,Voxtral,开源就是力量,未来充满想象!