字节跳动

字节跳动在Hugging Face发布MegaTTS3:轻量化语音合成新突破

北京——字节跳动(ByteDance)近日在人工智能开源社区Hugging Face上正式发布了其最新的文本转语音(TTS)模型MegaTTS3。这一发布迅速引起了全球AI研究者和开发者的关注,因其在轻量化设计和多语言支持方面的突破性表现。根据技术社区反馈和官方信息,MegaTTS3 被誉为语音合成领域的一次重要进步。MegaTTS3 的核心亮点MegaTTS3 是一款由字节跳动与浙江大学合作开发

字节跳动推出DreamActor-M1项目,挑战Runway Act-One的AI角色表演技术

字节跳动近日推出其全新AI项目DreamActor-M1,该项目旨在实现类似Runway Act-One的功能,通过先进的生成式AI技术,将视频中的角色表演转化为虚拟动画,展现出更高的精确度和表现力。这一消息迅速引发了业界和网友的广泛关注,被视为字节跳动在AI视频生成领域迈出的又一大步。技术突破:超越Runway Act-One的野心据公开信息显示,DreamActor-M1的核心目标是捕捉演员的

字节跳动推出DreamActor-M1:实现Runway Act 功能,挑战动画生成新高度

近日,字节跳动(ByteDance)正式公布了其最新AI项目“DreamActor-M1”,一项旨在革新视频生成技术的前沿成果。这款模型通过结合一张静态照片和一段参考动作视频,能够将照片中的人物无缝替换到视频场景中,生成表情细腻、动作自然且画质高清的动态影像。这一技术的亮相,不仅标志着字节跳动在生成式AI领域的又一次突破,也被视为对现有动画生成工具(如Runway的Act-One)的有力挑战。Dr

提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集

快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。Multi-SWE

字节跳动发布Seaweed-7B视频模型,AI视频生成迈向新高度

人工智能视频生成领域迎来新的里程碑。AIbase从社交媒体获悉,字节跳动近期发布了其全新视频生成模型Seaweed-7B的论文与演示,展示了一系列突破性功能,包括音视频同步生成、长镜头叙事和实时高分辨率生成。这一发布标志着字节跳动在AI视频技术上的加速布局,以下是AIbase对Seaweed-7B的深度报道,解析其技术亮点与行业影响。Seaweed-7B震撼亮相:多功能视频生成Seaweed-7B

AI日报:ChatGPT重磅上线图像库功能;白嫖!Veo2登陆谷歌AI Studio;蚂蚁百宝箱推“MCP专区”

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称字节跳动整合 AI 研发团队,AI Lab 即将并入 Seed字节跳动正在进行AI研发团队的整合,将独立的字节AI Lab并入Seed团队。这一举措体现了字节在AI领域

报道称字节跳动整合 AI 研发团队,AI Lab 即将并入 Seed

据雷峰网的 “AI 科技评论” 报道,字节跳动正在对其 AI 研发团队进行整合,原本独立的字节 AI Lab 即将全部并入 Seed 团队。这一变化标志着字节跳动在 AI 领域战略布局的进一步调整。字节 AI Lab 成立于2016年,最初由微软亚洲研究院的前常务副院长马维英负责,并直接向公司创始人张一鸣汇报。AI Lab 的主要任务是开发能够为字节跳动内容平台提供服务的创新技术,包括推荐算法和短

字节Seedream 3.0 文生图模型技术报告发布:多项性能大幅升级

字节跳动Seed团队正式发布了Seedream3.0文生图模型的技术报告。这一模型在性能上实现了重大提升,是一个原生高分辨率、支持中英双语的图像生成基础模型,在分辨率、生图结构准确性等多方面取得突破,与上一版本相比优势显著。Seedream3.0在不同维度上的表现。本图各维度数据以最佳指标为参照系,已进行归一化调整。在功能亮点上,Seedream3.0可原生2K直出,无需后处理就能输出高分辨率图像

大动作!字节AI Lab并入Seed,AI布局迎新变

据AI科技评论消息,近日字节AI Lab即将全部并入Seed团队,这一变动标志着字节内部AI研发架构迎来重大调整。据悉。字节AI Lab成立于 2016 年,曾是字节跳动AI研发的核心部门,由马维英负责,直接向张一鸣汇报。当时团队规模达 150 人,研究覆盖人工智能前沿技术,字节的推荐算法、短视频特效等都源于此,为抖音等产品的崛起立下汗马功劳,也助力字节在国内AI领域领先。但后来随着抖音、TikT

字节跳动开源Liquid多模态模型,革新视觉与语言统一生成

人工智能领域迎来一项重大突破。AIbase从社交媒体获悉,字节跳动于近日宣布开源其全新多模态生成模型Liquid,该模型以创新的统一编码方式和单一大语言模型(LLM)架构,实现了视觉理解与生成任务的无缝整合。这一发布不仅展示了字节在多模态AI上的技术雄心,也为全球开发者提供了强大的开源工具。以下是AIbase对Liquid模型的深度解析,探索其技术创新、核心发现及行业影响。Liquid模型亮相:统