今天凌晨,知名的开源大模型平台 DeepSeek 发布了其最新版本 R1(0528),引起了广泛关注。此次发布没有附带详细说明,DeepSeek 选择了 “悄然” 开放模型,预计后续会发布模型卡,进一步介绍其功能。
据悉,R1-0528版本的性能在著名代码测试平台 Live CodeBench 上的测试结果显示,其表现与 OpenAI 最新的 o3模型相当。很多网友对此表示期待,纷纷对新版本进行了测试,发现新版 R1在风格和表现上都与 OpenAI 的 o3模型相似。
具体来说,R1-0528在专业风格的响应方面,显示出了 o3-2.5的特征。无论是在使用箭头和星号的方式上,还是在结尾部分 “why it works” 的表述上,R1都展现出了很高的说服力。虽然 OpenAI 在不断努力提升其模型性能,但 DeepSeek 的 R1依然表现得相当出色,令人期待其后续版本 R2的智能表现。
Hyperbolic Labs 的联合创始人兼首席执行官也表示,R1依旧是能精确回答 “9.9” 和 “9.11哪个更大” 的模型,这一能力凸显了其高水平的智能表现。此外,知名 AI 评论人 Haider 也对新版本 R1赞不绝口,他提到,在一次编程挑战中,R1成功构建了一个单词评分系统,并提供了整洁的代码和可运行的测试用例,首次运行便完美通过。
Haider 指出,以前只有 o3模型能够完成这样的任务,而现在 DeepSeek 的 R1也达到了这样的水平。他表示,尽管模型的思考时间似乎有所延长,但其智能水平却令人惊叹。随着测试的深入,大家不禁思考,DeepSeek 是否在有意将此次 R1版本作为过渡,以防止后续 R2的发布让用户失望。
新版 DeepSeek R1表现不俗,不仅能够像 o3一样进行思维链的自我纠正,还具备了类似 Claude 的创造性构建能力,这是之前版本所不具备的。随着官方模型卡的发布,AIGC 开放社区也将为大家带来更深入的解析,期待未来的更多惊喜。
开源地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
划重点:
🌟 新版 DeepSeek R1(0528)开源,性能媲美 OpenAI o3模型。
💻 测试显示 R1在编程能力上表现出色,成功完成复杂任务。
🔍 期待 DeepSeek 后续发布模型卡,深入解析新版本功能。
发表评论 取消回复