谷歌前科学家出品!Reka开源Reka Flash 3,能力超Gemma 3 27B
Reka AI是由十几个谷歌DeepMind前科学家们创办的公司,近日他们掷出了其首个开源模型—— Reka Flash3。这款拥有 210亿参数 的推理模型,一经亮相便引发业内外的广泛关注。别看 Reka Flash3只有210亿参数,据官方介绍,这款模型是 从零开始训练 的通用推理模型。它不仅在 合成和公共数据集 上进行了监督式微调,还通过 基于模型和规则的强化学习(RLOO) 进行了深度优