Member standard
Member expire
Member points 0
还没有账号? 立即注册
已有账号? 立即登录
行业佼佼者
0
粉丝
42
文章
6.50K
总浏览
平均评分
AI领域资深专家
8月4日,小米公司正式宣布开源其自研的声音理解大模型 MiDashengLM-7B。该模型在22个公开评测集上刷新了多模态大模型的最好成绩(SOTA),并在推理效率上实现了显著突破,标志着小米在音频多模态AI领域取得重要进展。功能亮点音频描述:将音频内容(包括语音、环境声、音乐等)转化为自然语言描述,帮助用户快速理解音频信息。音频分类:识别音频中的特定类别(如语音、环境声、音乐等),用在环境声音识