Midjourney操作界面

从手机到手语翻译,Gemma模型家族全面升级亮相Google I/O

4.8
0热度

在2025年Google I/O开发者大会上,谷歌正式发布轻量级多模态模型Gemma3n,并宣布Gemma模型家族持续扩展,新增面向医疗和无障碍场景的MedGemma与SignGemma。作为本地运行AI趋势的代表,Gemma3n专为手机、笔记本和平板等低算力设备设计,具备处理文本、音频、图像和视频的能力。据谷歌介绍,Gemma3n甚至可在低于2GB运行内存的设备上流畅运行,体现出其高效架构优势。

在2025年Google I/O开发者大会上,谷歌正式发布轻量级多模态模型Gemma3n,并宣布Gemma模型家族持续扩展,新增面向医疗和无障碍场景的MedGemma与SignGemma。

作为本地运行AI趋势的代表,Gemma3n专为手机、笔记本和平板等低算力设备设计,具备处理文本、音频、图像和视频的能力。据谷歌介绍,Gemma3n甚至可在低于2GB运行内存的设备上流畅运行,体现出其高效架构优势。该模型已于发布日面向开发者预览,并与Gemini Nano共享底层架构。

QQ20250521-094734.png

谷歌强调,Gemma3n的轻量与隐私优势,使其成为离线AI应用的理想选择。相比需要依赖云端的大型模型,本地AI模型不仅响应更快、成本更低,还能保护用户数据不被传输至远程服务器,尤其适用于隐私敏感型场景。

在健康领域,谷歌通过旗下健康AI开发者基金会,推出了MedGemma——一组针对健康相关文本与图像的开放模型。据介绍,MedGemma具备出色的多模态分析能力,支持开发者在医疗影像识别、病历文本处理等场景中构建更精准的AI工具。

此外,谷歌还预告了即将推出的SignGemma模型,专为手语识别而设计,能够将美国手语(ASL)翻译成英语文本,旨在帮助开发者为聋哑与听障用户构建更友好的沟通工具。谷歌表示,这是“目前为止最强大的手语理解模型”。

尽管Gemma模型系列因其非标准许可条款引发部分开发者对商业化使用的担忧,但其广泛的功能性仍获得开发者社区热烈响应,Gemma模型系列的下载量已突破数千万次。

随着Gemma模型家族不断拓展,谷歌正推动开放AI模型在设备端、本地隐私保护、医疗健康与无障碍领域迈向更广阔的应用空间。

点赞(0)

评论列表 共有 0 条评论

暂无评论
发表
评论
顶部