
字节跳动与清华大学合作推出时序多模态大模型ChatTS
在多模态大语言模型(MLLM)迅速发展的浪潮中,字节跳动与清华大学近日联合发布了名为 ChatTS 的新型时序多模态大模型。ChatTS 的推出不仅为时序数据的处理与推理注入了新活力,也填补了当前市场在这一领域的空白。该模型的开发旨在提升 AI 在时序数据问答与推理中的应用能力,尤其在 AIOps 与金融等需要处理复杂时序数据的场景中显得尤为重要。本次研究的主要作者是清华大学的三年级博士生谢哲,合
在多模态大语言模型(MLLM)迅速发展的浪潮中,字节跳动与清华大学近日联合发布了名为 ChatTS 的新型时序多模态大模型。ChatTS 的推出不仅为时序数据的处理与推理注入了新活力,也填补了当前市场在这一领域的空白。该模型的开发旨在提升 AI 在时序数据问答与推理中的应用能力,尤其在 AIOps 与金融等需要处理复杂时序数据的场景中显得尤为重要。
本次研究的主要作者是清华大学的三年级博士生谢哲,合作团队还包括来自字节跳动的李则言和何晓,指导教师则是字节跳动的研究科学家张铁赢和清华大学计算机系副教授裴丹。ChatTS 的核心优势在于其原生支持多变量时序问答与推理功能,解决了以往模型在处理时序数据时的局限性。
时序数据分析一直以来依赖于传统的统计模型或 AI 模型,这些模型通常需要大量特定数据的训练和复杂的预处理。这使得通用性和可解释性成为其主要短板。而 ChatTS 的出现正是为了改变这一现状,利用其强大的语言建模能力来实现对时序数据的自然语言理解。
为了应对时序与语言之间的匹配困难,研究团队采用了 “纯合成驱动” 的方式,设计了一套端到端的数据生成与模型训练框架。通过构建 “属性驱动” 的时序生成体系,ChatTS 能生成多样化且真实的时序数据,同时确保与自然语言描述的准确对应。
在具体的应用中,ChatTS 能够分析多变量时序的形态,识别未见过的波动模式,并能自动进行命名。此外,模型还可以在没有精确提示的情况下,准确提取时序数据中的异常波动,展现了其强大的灵活性和智能化特征。
这一创新模型的发布,将大大推动时序数据在各行业中的应用,未来可能在故障诊断、金融分析等领域发挥重要作用。ChatTS 的研究成果已被顶级数据库会议 VLDB2025接受,展现了其学术价值和实际应用前景。
发表评论 取消回复