UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成
声明:文来自微信公众号“量子位”,作者:UniToken团队,,授权站长之家转载发布。首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局!复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。UniToken通过融合连续和离散视觉表征,有效缓解了以往方法中“任务干扰”