Fun-ASR是什么
Fun-ASR 是钉钉与通义实验室语音团队联合推出的新一代语音识别大模型。经过海量音频数据训练,能精准识别互联网、科技、家装、畜牧等十多个行业的专业术语,能听懂“黑话”。例如,在保险行业,准确率较以往提升18%,在家装、畜牧等行业也实现了15%-20%的提升。模型能结合钉钉内的企业信息进行推理优化,减少幻觉问题,提供更可靠的转写结果。Fun-ASR支持企业专属模型定制训练,可利用企业的真实语音数据进一步优化算法,提升专属词汇的识别准确率,支持最多1000+热词导入。
目前,Fun-ASR已集成到钉钉的会议字幕、智能纪要、语音助手等多个功能模块中,为企业级语境提供稳定、高效、易扩展的语音识别解决方案。

Fun-ASR的主要功能
-
多行业术语识别:Fun-ASR 经过海量音频数据训练,能精准识别互联网、科技、家装、畜牧、汽车等十多个行业的专业术语,实测在保险行业准确率较以往提升 18%,在家装、畜牧等行业提升 15%-20%,支持最多 1000+ 热词导入,进一步优化生僻词汇识别。
-
上下文感知优化:模型可结合钉钉内的企业信息(如通讯录、日程、知识库等)进行推理优化,有效缓解大模型可能出现的幻觉问题,提供更可靠的转写结果,且需企业授权后生效。
-
企业专属定制训练:基于高效的端到端训练架构,Fun-ASR 能基于企业提供的真实场景语音数据进行算法优化,提升品牌名、项目代号、产品名、人名等专属词汇的识别准确率。
-
多场景集成应用:Fun-ASR 已集成到钉钉的会议字幕与同传、智能纪要、语音助手等多个功能模块,为企业级语境提供稳定、高效、易扩展的语音识别基座,满足企业对语音识别的高要求。
Fun-ASR的技术原理
-
海量数据训练:Fun-ASR 经过上亿小时音频数据的训练,涵盖多种行业和场景,能准确理解不同领域的专业术语。
-
行业共创优化:结合钉钉多行业客户的真实场景共创,模型在互联网、科技、家装、畜牧、汽车等十多个领域表现出色,显著提升了专业术语的识别准确率。
-
上下文推理优化:模型可结合企业在钉钉内的已有信息(如通讯录、日程、知识库等)进行推理优化,有效缓解大模型可能产生的幻觉问题,提供更可靠的转写结果。
-
端到端训练架构:基于高效的端到端训练架构,Fun-ASR 能利用企业提供的真实场景语音数据进一步优化算法,提升专属词汇的识别准确率,支持企业专属模型定制训练。
-
自定义热词支持:提供企业自定义热词能力,最多可支持 1000+ 热词导入,进一步优化对生僻词汇和专属术语的识别。
Fun-ASR的应用场景
-
会议字幕与同传:Fun-ASR 能实时转写会议内容,为会议提供精准的字幕和同传服务,帮助参会者更好地理解和记录会议要点。
-
智能纪要:模型可以自动生成会议纪要,提取关键信息和行动项,节省人工整理的时间,提高会议效率。
-
语音助手:支持语音指令和交互,用户可以通过语音命令完成各种操作,如查询信息、安排日程等,提升使用体验。
-
家装与畜牧行业:在顾家家居等家装企业中,模型能准确识别专业表述,如“比利时进口 Pulse 脉冲乳胶”等,为后续分析客户需求提供可靠依据。在畜牧行业,也能精准识别相关术语,助力企业高效运营。
-
保险行业:Fun-ASR 在保险行业的应用显著提升了语音识别的准确率,帮助保险企业更好地处理客户咨询和业务流程。