Dream7B 大型语言模型 开源扩散模型 华为诺亚方舟实验室 华为诺亚方舟实验室携手港大发布最强开源扩散语言模型 Dream 7B,打破文本生成格局 ⭐0 👥0 人工智能领域再添一颗耀眼新星!近日,华为诺亚方舟实验室与香港大学自然语言处理组(HKU NLP Group) 联合发布了名为 Dream7B 的全新语言模型。这款模型被誉为“迄今为止最强大的开源扩散大型语言模型”。Dream7B 的问世,不仅在性能上超越了现有的扩散语言模型,更在通用能力、数学、代码以及规划能力上,比肩甚至超越了同等规模的顶尖自回归(AR)语言模型。这一突破性的进展,预示着文本生成
GPT-4.1 OpenAI 大型语言模型 AI对齐 GPT-4.1 模型遭遇质疑:对齐性和稳定性引发关注 ⭐0 👥0 近日,OpenAI 推出了其新一代人工智能模型 ——GPT-4.1,声称在遵循用户指令方面表现优异。然而,令人意外的是,多项独立测试的结果显示,GPT-4.1的对齐性和稳定性较之前的版本有所下降,尤其是在处理敏感话题时的表现不尽如人意。牛津大学的研究科学家 Owain Evans 指出,经过不安全代码微调的 GPT-4.1在应对性别角色等敏感问题时,给出的回应存在更高的不一致性,这一现象在其前代模
AlphaOne 伊利诺伊大学香槟分校 大型语言模型 OpenAI 突破性AI框架AlphaOne:让大模型"先慢思考后快思考",效率提升21% ⭐0 👥0 伊利诺伊大学香槟分校和加州大学伯克利分校研究人员联合开发的AlphaOne(α1)框架,为大型语言模型推理控制带来重大突破。该框架能让开发者精确调节模型"思考"方式,在提升推理能力的同时显著优化计算资源使用。解决AI推理痛点当前大型推理模型如OpenAI o3和DeepSeek-R1虽然融入了"系统2"慢思考机制,但存在明显缺陷:对简单问题"过度思考"浪费计算资源,对复杂问题"思考不足"导致错误答
ChatbotArena AI基准测试 ArenaIntelligenceInc. 大型语言模型 AI 基准测试平台 Chatbot Arena 成立一家新公司 ⭐0 👥0 在 AI 行业快速发展的背景下,Chatbot Arena 这个众包 AI 基准测试项目正在扩展其影响力,正式成立了一家名为 Arena Intelligence Inc. 的新公司。根据彭博社的报道,Chatbot Arena 旨在通过这家新公司获取更多资源,从而显著改善其平台的功能和服务。Chatbot Arena 成立于2023年,主要由加州大学伯克利分校的研究人员主导。该平台为大型 AI
Gemma3 量化感知训练(QAT) 大型语言模型 NVIDIARTX3090 谷歌发布 Gemma 3 QAT 模型:一张3090显卡也能轻松驾驭 ⭐0 👥0 谷歌近期推出了 Gemma3系列的全新版本,这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后,谷歌便发布了经过量化感知训练(QAT)优化的 Gemma3,旨在显著降低内存需求的同时,保持模型的高质量。具体来说,经过 QAT 优化的 Gemma327B 模型,其显存需求从54GB 大幅降低到14.1GB,意味着用户现在可以在 NVIDIA RTX3090等消费级 GPU 上本地运行这一大型模型
大型语言模型 FUDOKI 非掩码离散流匹配 华为诺亚方舟实验室 突破传统!FUDOKI 模型让多模态生成与理解更灵活、更高效 ⭐0 👥0 近年来人工智能领域发生了翻天覆地的变化,尤其是大型语言模型(LLMs)在多模态任务上取得了显著进展。这些模型在理解和生成语言的能力上展现出了强大的潜力,但目前大多数多模态模型依然采用自回归(AR)架构,推理过程较为单一、缺乏灵活性。为此,香港大学和华为诺亚方舟实验室的研究团队提出了一种全新的模型 ——FUDOKI,旨在打破这一局限。FUDOKI 的核心创新在于其全新的非掩码离散流匹配(Discre
智能体 OpenAI 大型语言模型 AI实践指南 OpenAI 发布“智能体构建实战指南”实用性文档(附文档资源) ⭐0 👥0 人工智能领域领军企业 OpenAI 近日重磅发布了一份名为“构建智能体实践指南”("A practical guide to building agents")的实用性文档。这份共34页的指南旨在为产品和工程团队提供构建首个智能体系统的必要知识和最佳实践,其内容凝结了 OpenAI 从众多客户实际部署案例中获得的深刻洞察。通过阅读本指南,开发者将能够理解智能体的核心概念,掌握何时以及如何设计、构建
思维链 扩散式发散思维链 大型语言模型 西湖大学MAPLE实验室 开创性扩散思维链:让人工智能更具创造力和灵活性 ⭐0 👥0 在近年来的人工智能研究中,思维链的概念越来越受到重视,尤其是在大型语言模型的训练和推理中。最近,西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”,这是一种为扩散语言模型量身定制的全新推理方式。传统的大型语言模型通常采用线性思维链,即通过逐步推理生成答案。然而,人的思维过程往往更为复杂,充满了非线性和跳跃性的特点。齐教授的团队认为,模仿这种发散思维将有助于提升模
大型语言模型 LLM LocalScore MozillaBuilders Mozilla发布LocalScore:简化本地AI模型基准测试的新工具 ⭐0 👥0 Mozilla 最近通过其 Mozilla Builders 计划推出了一款名为 LocalScore 的工具,旨在为本地大型语言模型(LLM)提供便捷的基准测试。该工具兼容 Windows 和 Linux 系统,具有极大的潜力,成为了易于分发的 LLM 框架的重要组成部分。尽管 LocalScore 仍处于早期开发阶段,但其表现已相当不错。LocalScore 是基于上周发布的 Llamafil