Fun-ASR – 钉钉联合通义推出的语音识别大模型

Fun-ASR是什么

Fun-ASR 是钉钉与通义实验室语音团队联合推出的新一代语音识别大模型。经过海量音频数据训练，能精准识别互联网、科技、家装、畜牧等十多个行业的专业术语，能听懂“黑话”。例如，在保险行业，准确率较以往提升18%，在家装、畜牧等行业也实现了15%-20%的提升。模型能结合钉钉内的企业信息进行推理优化，减少幻觉问题，提供更可靠的转写结果。Fun-ASR支持企业专属模型定制训练，可利用企业的真实语音数据进一步优化算法，提升专属词汇的识别准确率，支持最多1000+热词导入。

目前，Fun-ASR已集成到钉钉的会议字幕、智能纪要、语音助手等多个功能模块中，为企业级语境提供稳定、高效、易扩展的语音识别解决方案。

Fun-ASR的主要功能

多行业术语识别：Fun-ASR 经过海量音频数据训练，能精准识别互联网、科技、家装、畜牧、汽车等十多个行业的专业术语，实测在保险行业准确率较以往提升 18%，在家装、畜牧等行业提升 15%-20%，支持最多 1000+ 热词导入，进一步优化生僻词汇识别。
上下文感知优化：模型可结合钉钉内的企业信息（如通讯录、日程、知识库等）进行推理优化，有效缓解大模型可能出现的幻觉问题，提供更可靠的转写结果，且需企业授权后生效。
企业专属定制训练：基于高效的端到端训练架构，Fun-ASR 能基于企业提供的真实场景语音数据进行算法优化，提升品牌名、项目代号、产品名、人名等专属词汇的识别准确率。
多场景集成应用：Fun-ASR 已集成到钉钉的会议字幕与同传、智能纪要、语音助手等多个功能模块，为企业级语境提供稳定、高效、易扩展的语音识别基座，满足企业对语音识别的高要求。

Fun-ASR的技术原理

海量数据训练：Fun-ASR 经过上亿小时音频数据的训练，涵盖多种行业和场景，能准确理解不同领域的专业术语。
行业共创优化：结合钉钉多行业客户的真实场景共创，模型在互联网、科技、家装、畜牧、汽车等十多个领域表现出色，显著提升了专业术语的识别准确率。
上下文推理优化：模型可结合企业在钉钉内的已有信息（如通讯录、日程、知识库等）进行推理优化，有效缓解大模型可能产生的幻觉问题，提供更可靠的转写结果。
端到端训练架构：基于高效的端到端训练架构，Fun-ASR 能利用企业提供的真实场景语音数据进一步优化算法，提升专属词汇的识别准确率，支持企业专属模型定制训练。
自定义热词支持：提供企业自定义热词能力，最多可支持 1000+ 热词导入，进一步优化对生僻词汇和专属术语的识别。

Fun-ASR的应用场景

会议字幕与同传：Fun-ASR 能实时转写会议内容，为会议提供精准的字幕和同传服务，帮助参会者更好地理解和记录会议要点。
智能纪要：模型可以自动生成会议纪要，提取关键信息和行动项，节省人工整理的时间，提高会议效率。
语音助手：支持语音指令和交互，用户可以通过语音命令完成各种操作，如查询信息、安排日程等，提升使用体验。
家装与畜牧行业：在顾家家居等家装企业中，模型能准确识别专业表述，如“比利时进口 Pulse 脉冲乳胶”等，为后续分析客户需求提供可靠依据。在畜牧行业，也能精准识别相关术语，助力企业高效运营。
保险行业：Fun-ASR 在保险行业的应用显著提升了语音识别的准确率，帮助保险企业更好地处理客户咨询和业务流程。

登录账号

Fun-ASR – 钉钉联合通义推出的语音识别大模型

Fun-ASR是什么

Fun-ASR的主要功能

Fun-ASR的技术原理

Fun-ASR的应用场景

评分

评论 (0)

推荐文章

OmniVinci – NVIDIA推出的全模态大语言模型

SAIL-Embedding – 抖音联合港中文推出的全模态嵌入模型

速抢（2核2G）77元/年香港免备案服务器

NavFoM – 银河通用推出的环视导航基座大模型

Handy – 开源的语音转文字桌面应用，完全离线

UniWorld V2 – 兔展智能联合北大推出的图像编辑模型

讯飞星火X1.5 – 科大讯飞推出的深度推理大模型

UNO-Bench – 美团LongCat推出的全模态大模型评测基准

热门标签

热门作者

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

登录账号

Fun-ASR – 钉钉联合通义推出的语音识别大模型

Fun-ASR是什么

Fun-ASR的主要功能

Fun-ASR的技术原理

Fun-ASR的应用场景

评分

评论 (0)

推荐文章

OmniVinci – NVIDIA推出的全模态大语言模型

SAIL-Embedding – 抖音联合港中文推出的全模态嵌入模型

速抢（2核2G）77元/年香港免备案服务器

NavFoM – 银河通用推出的环视导航基座大模型

Handy – 开源的语音转文字桌面应用，完全离线

UniWorld V2 – 兔展智能联合北大推出的图像编辑模型

讯飞星火X1.5 – 科大讯飞推出的深度推理大模型

UNO-Bench – 美团LongCat推出的全模态大模型评测基准

热门标签

热门作者

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

为您推荐