Dynamic Tanh革新Transformer架构,MetaAI重塑归一化技术标准 29 1 MetaAI推出Dynamic Tanh(DyT)技术,通过tanh函数替代传统LayerNorm,在H100s显卡上实现训练加速与成本降低,推动多模态Transformer高效化部署,或成下一代模型标准。
Linear-MoE统一序列建模,长文本处理迎来革命性突破 38 1 学术界与产业界联合研发的Linear-MoE框架,通过统一线性序列建模与混合专家系统,实现百万token长文本处理速度提升3倍,或定义下一代模型架构标准。
零一万物(01.AI)与深度求索(DeepSeek)大模型的对比分析 54 2 零一万物(01.AI)与深度求索(DeepSeek)大模型的对比分析,涵盖技术性能、应用场景、成本效率等维度,并总结双方的优势与不足
图灵模式 Turing Pattern 图灵模式——Turing Pattern 38 0 图灵测试是人工智能最初的概念,它甚至早于“人工智能”这个词本身,人工智能一词是在1956年才被提出的。图灵测试的方法很简单,就是让测试者与被测试者(一个人和一台机器)隔开,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人工智能。 它的发明者图灵被誉为计算机科学之父、人工智能之父。
MiniMax MiniMax-01 MiniMax-01 全新系列模型,性能比肩GPT-4o 15 0 MiniMax 发布并开源了 MiniMax-01 全新系列模型,其中包含两个模型,基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01,全新模型架构、性能比肩GPT-4o
Machine Learning Research Transformers Large Language Models (LLMs) Toward LLMs That Understand Misspellings New byte-based model beats Llama 3 on spelling, noise, and translation 202 0 <!--kg-card-begin: html-->Loading the Elevenlabs Text to Speech AudioNative Player...<!--kg-card-end: html-->Researchers built a model that’s more robust to noisy inputs like misspelli
Machine Learning Research Transformers Large Language Models (LLMs) Toward LLMs That Understand Misspellings 205 0 New byte-based model beats Llama 3 on spelling, noise, and translation
Business Machine Learning Research AI Agents Large Language Models (LLMs) Open Standard for Tool Use and Data Access Gains Momentum OpenAI adopts Model Context Protocol to boost LLM tool integration 161 0 <!--kg-card-begin: html-->Loading the Elevenlabs Text to Speech AudioNative Player...<!--kg-card-end: html-->OpenAI embraced Model Context Protocol, providing powerful support for an o
Business Machine Learning Research AI Agents Large Language Models (LLMs) Open Standard for Tool Use and Data Access Gains Momentum 161 0 OpenAI adopts Model Context Protocol to boost LLM tool integration