多模态联合强化学习

阶跃星辰发布全新多模态推理模型——Step-R1-V-Mini

阶跃星辰科技团队宣布正式推出全新的多模态推理模型 Step-R1-V-Mini。这一模型的发布标志着在多模态协同推理领域的新突破,为AI技术的进一步发展注入了新的活力。Step-R1-V-Mini支持图文输入和文字输出,具备良好的指令遵循能力和通用性,能够高精度感知图像并完成复杂的推理任务。Step-R1-V-Mini的训练方法在技术上进行了创新,采用了多模态联合强化学习,基于PPO(Proxim