大模型

斯坦福权威报告盖章!阿里通义千问贡献排名全球第三!用算力优势重塑全球竞争格局!

近日,斯坦福大学人工智能研究所发布了《2025年人工智能指数报告》,为全球人工智能领域的发展提供了新的视角。报告指出,阿里巴巴在全球重要大模型贡献中位居第三,成为中国科技公司的领军代表。报告显示,2024年,中国在全球 AI 大模型中贡献了15项,而阿里巴巴的6个模型入选,紧随谷歌与 OpenAI 的7个模型之后。这一成就不仅反映了阿里在技术研发上的持续努力,也展示了中美在 AI 领域的竞争差距正

阿里云全新 MCP 服务上线,高德、无影等首批接入

阿里云正式推出了全生命周期的 MCP(Model-Connect-Protocol)服务,这一创新平台的上线标志着大模型应用开发的门槛得以大幅降低。用户只需花费5分钟,就可以快速创建连接 MCP 服务的智能体(Agent),实现从资源管理到部署运维的全流程自动化,大大提升了开发效率。MCP 协议作为大模型连接软件的行业标准,正在吸引越来越多的应用接入,生态系统呈现出爆发式增长。此次阿里云百炼平台首

媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开

声明:本文来自于微信公众号 AIGC开放社区,作者:AIGC开放社区,授权站长之家转载发布。今天凌晨4点,著名大模型训练平台Together AI和智能体平台Agentica,联合开源了新模型DeepCoder-14B-Preview。该模型只有140亿参数,但在知名代码测试平台LiveCodeBench的测试分为60.6%,高于OpenAI的o1模型(59.5%),略低于o3-mini(60

Llama 4大模型跌落神坛:作弊刷榜、代码能力极差、和DeepSeek比就是伪开源

4月8日消息,被寄予厚望的美国Meta公司的最新开源大模型Llama 4发布不到2天时间,口碑急转直下,被质疑为刷榜作弊实际效果差、开源条件多部署门槛高是伪开源等。今天,大模型评测平台LM Arena亲自下场发文,打脸Meta提供给平台的Llama 4是“特供版”。据知情人士爆料称,Meta因面临DeepSeek、Gemini等竞品的快速迭代压力,选择“仓促发布未完成优化的模型”,牺牲技术严谨

开源新模型 DeepCoder:超高效编程,超越OpenAI o1模型

在科技发展的浪潮中,人工智能(AI)技术日新月异。最近,由著名大模型训练平台 Together AI 和智能体平台 Agentica 联合开源的新模型 DeepCoder-14B-Preview,吸引了广泛关注。该模型以仅有的140亿参数,在代码测试平台 LiveCodeBench 上的得分为60.6%,超过了 OpenAI 的 o1模型(59.5%),仅略低于 o3-mini(60.9%)。这一

百度发布飞桨框架3.0,助力大模型时代的智能开发

4月3日,百度正式推出了飞桨框架3.0版。这一全新版本在设计理念上实现了全面进化,特别针对大模型的开发和推理需求,提供了五大核心特性,力求成为深度学习框架领域的领先者。随着大模型在各行各业的广泛应用,深度学习框架的作用愈发重要,而飞桨框架3.0正是为此而生。首先,飞桨框架引入了 “动静统一自动并行” 技术,显著降低了大模型的开发和训练成本,让算法创新更专注于核心价值的创造。此外,它的 “训推一体”

飞桨3.0正式发布,支持文心4.5等大模型,跨芯片适配成本降80

百度旗下的深度学习平台飞桨近日宣布正式发布新一代飞桨框架3.0。此次发布的框架3.0引入了五大核心技术创新,包括“动静统一自动并行”等关键技术,旨在有效降低大模型开发和训练成本,助力大模型时代的基础设施建设。作为支撑大模型训练和推理任务的核心基础设施,飞桨框架3.0在性能优化方面表现出色。该框架已经支持包括文心4.5、文心X1在内的多款主流大模型,并通过优化的DeepSeek-R1满血版单机部署,

全球增长最快!DeepSeek月访问量超ChatGPT:份额世界第三

快科技3月31日消息,今日,据AI分析平台aitools.xyz,国产大模型DeepSeek已经成为全球增长最快的AI工具,其每月新增网站访问量已超过OpenAI的ChatGPT。报告称,2025年2月,DeepSeek访问量达到5.25亿次,超过ChatGPT5亿次。目前,DeepSeek市场份额6.58%,全球排名第三,仅次于ChatGPT和Canva,二者分别占比43.16%和8.27%

腾讯的 AI 大招,落在微信上

声明:本文来自于微信公众号 唐韧,作者:唐韧,授权站长之家转载发布。很久没看到腾讯像现在这样投入资源去推一款产品了,那阵势似乎让人感受到这是鹅厂下一个希望。我说的产品,就是腾讯元宝,一个 AI 大模型工具。在腾讯元宝中,默认集成了鹅厂自家的 Hunyuan 模型和 DeepSeek 开源模型,我在之前的文章中有过体验分析。腾讯对元宝的投入大到什么程度呢?基本上,腾讯旗下的所有产品都在给元宝带节

爆火的大模型一体机,炒作or真需求?

声明:本文来自于微信公众号光锥智能,作者:白 鸽,授权站长之家转载发布。大模型,正在重塑“一体机”这个原本小众的服务器产品。“之前行业对一体机的需求非常少。”科大讯飞智算业务部副总经理许昀对光锥智能说道,“而现在的需求远超预期。”自开年以来,随着DeepSeek大模型的爆火,也点燃了大模型一体机市场的爆发。据IDC统计,市场上已迅速有接近百家厂商推出AI一体机产品,包括新华三等服务器厂商、京