AI落地实战指南 | 医疗/金融/制造案例库 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

Dynamic Tanh革新Transformer架构，MetaAI重塑归一化技术标准

MetaAI推出Dynamic Tanh（DyT）技术，通过tanh函数替代传统LayerNorm，在H100s显卡上实现训练加速与成本降低，推动多模态Transformer高效化部署，或成下一代模型标准。

OCTS算法突破LLM推理瓶颈，逆长尾问题终得解法

新型OCTS算法通过答案聚类与动态停止机制，有效缓解LLM推理中的逆长尾效应，在复杂任务中提升45%响应速度，降低30%计算资源消耗。

Linear-MoE统一序列建模，长文本处理迎来革命性突破

学术界与产业界联合研发的Linear-MoE框架，通过统一线性序列建模与混合专家系统，实现百万token长文本处理速度提升3倍，或定义下一代模型架构标准。

零一万物（01.AI）与深度求索（DeepSeek）大模型的对比分析

零一万物（01.AI）与深度求索（DeepSeek）大模型的对比分析，涵盖技术性能、应用场景、成本效率等维度，并总结双方的优势与不足

图灵模式——Turing Pattern

图灵测试是人工智能最初的概念，它甚至早于“人工智能”这个词本身，人工智能一词是在1956年才被提出的。图灵测试的方法很简单，就是让测试者与被测试者（一个人和一台机器）隔开，通过一些装置（如键盘）向被测试者随意提问。进行多次测试后，如果有超过30%的测试者不能确定出被测试者是人还是机器，那么这台机器就通过了测试，并被认为具有人工智能。它的发明者图灵被誉为计算机科学之父、人工智能之父。

MiniMax-01 全新系列模型,性能比肩GPT-4o

MiniMax 发布并开源了 MiniMax-01 全新系列模型，其中包含两个模型，基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01，全新模型架构、性能比肩GPT-4o

Machine Learning Research

Large Language Models (LLMs)

Toward LLMs That Understand Misspellings New byte-based model beats Llama 3 on spelling, noise, and translation

Loading the Elevenlabs Text to Speech AudioNative Player...Researchers built a model that’s more robust to noisy inputs like misspelli

Machine Learning Research

Large Language Models (LLMs)

Toward LLMs That Understand Misspellings

New byte-based model beats Llama 3 on spelling, noise, and translation

Machine Learning Research

Large Language Models (LLMs)

Open Standard for Tool Use and Data Access Gains Momentum OpenAI adopts Model Context Protocol to boost LLM tool integration

Loading the Elevenlabs Text to Speech AudioNative Player...OpenAI embraced Model Context Protocol, providing powerful support for an o

Machine Learning Research

Large Language Models (LLMs)

Open Standard for Tool Use and Data Access Gains Momentum

OpenAI adopts Model Context Protocol to boost LLM tool integration