AI热点 3月前 134 浏览次数 0 评论

AI日报:扣子空间开放测试;腾讯混元开源视频生成工具HunyuanCustom;阿里开源大模型搜索引擎ZeroSearch

发布了 8678 文章

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、无需邀请码!扣子空间宣布开放测试

扣子空间(Coze Space)正式开放测试,用户无需邀请码即可登录使用。该平台展示了强大的AI协作能力,已吸引内测用户创建了多种优质案例。扣子空间不仅提供通用AI助手,还上线了用户研究、华泰A股观察及舆情分析等专家Agent,满足不同行业需求。

【AiBase提要:】

🛠️ 扣子空间开放测试,用户可直接登录官网使用,无需邀请码。

👨‍💼 三个专家Agent上线,分别为用户研究、华泰A股观察和舆情分析,满足多行业需求。

📈 开发团队承诺持续优化平台功能,提升用户体验,欢迎用户反馈。

2、音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom

腾讯推出的HunyuanCustom是一款革命性的一致性视频生成工具,能够通过单张图像生成生动的视频内容,并实现音频与口型的精准同步。该技术在深度伪造视频领域的进步,简化了视频制作流程,提升了用户的创作体验。HunyuanCustom不仅支持多种场景模拟。

【AiBase提要:】

🖼️ HunyuanCustom允许用户仅通过一张图像生成深度伪造风格的视频,简化了视频制作流程。

🔊 利用LatentSync系统,该工具实现了音频与口型的精准同步,提升了观众的沉浸感。

✂️ HunyuanCustom具备视频到视频(V2V)编辑功能,用户可智能替换视频内容,增强创意空间。

详情链接:https://aivideo.hunyuan.tencent.com/

3、成本降低88%:阿里巴巴ZeroSearch技术颠覆AI训练模式

阿里巴巴集团推出的ZeroSearch技术通过模拟方法改变了AI系统的信息搜索训练方式,消除了对昂贵搜索引擎API的依赖。这项技术不仅解决了搜索引擎返回文档质量的不确定性和高昂的API调用成本,还通过强化学习框架显著降低了AI训练的经济负担。

【AiBase提要:】

🔍 ZeroSearch技术通过模拟方法提升AI搜索能力,消除对真实搜索引擎的依赖。

💰 该技术将AI训练成本降低了88%,使高级AI训练更加平民化。

📈 ZeroSearch在多个模型上验证成功,预示AI系统将更自给自足,改变技术格局。

4、OpenAI 推出 GitHub 连接器,ChatGPT 深度研究工具迎来新功能

OpenAI 最近宣布对其 AI 驱动的深度研究工具进行升级,新增 GitHub 连接器,旨在帮助开发者更有效地分析代码库和工程文档。该功能允许用户直接询问代码相关问题,极大地方便了编程工作。与此同时,OpenAI 也在加强其辅助编码工具,并对特定功能进行了验证限制,以确保安全性。

【AiBase提要:】

🚀 OpenAI 推出新的 GitHub 连接器,允许开发者分析代码库和工程文档。

🛠️ ChatGPT 深度研究工具可帮助用户拆解产品规格并学习如何实现新的 API。

🔒 OpenAI 加强安全措施,限制特定功能的使用,仅对经过验证的组织开放。

5、联想发布天禧个人超级智能体,将布局在各类终端设备

在上海世博中心举行的创新科技大会上,联想集团推出了天禧个人超级智能体,标志着混合式人工智能的重大突破。天禧具备感知与交互、认知与决策、自主与演进三大核心功能,能够实时感知环境并与用户互动,理解复杂意图并提供个性化建议。同时,它还具备自主执行任务的能力,能够减轻用户的日常负担。

【AiBase提要:】

🌟 联想发布天禧个人超级智能体,标志着混合式人工智能的突破。

🛒 天禧智能体能够实时感知环境,并为用户提供个性化的购物建议。

🤖 天禧具备自主任务执行能力,可以减轻用户的日常负担。

6、OpenAI 在亚洲推出数据驻留计划,助力本地企业合规

OpenAI最近宣布在亚洲推出一项全新的数据驻留计划,旨在帮助当地企业更好地满足数据主权要求。此计划适用于多个产品,包括ChatGPT Enterprise、ChatGPT Edu和OpenAI API,允许用户选择将数据存储在日本、印度、新加坡和韩国等地。

【AiBase提要:】

📍 OpenAI 推出亚洲数据驻留计划,支持企业满足本地数据主权要求。

🌏 数据存储地点包括日本、印度、新加坡和韩国,确保用户数据安全。

🚀 该计划是 OpenAI 国际扩张的一部分,旨在构建必要的基础设施。

7、Multiverse发布全球首款AI生成多人在线游戏,以超低成本改写游戏开发规则

EnigmaLabsAI团队推出的Multiverse被誉为全球首款由AI生成的多人在线游戏,标志着游戏开发的新纪元。该游戏以其AI驱动的动态世界和极低的研发成本(仅1500美元)震撼行业,彻底改变了传统游戏开发的成本结构。

【AiBase提要:】

🌍 Multiverse是全球首款由AI生成的多人在线游戏,采用实时动态世界模拟技术,玩家的每个动作都会影响游戏环境。

💰 该游戏的研发成本仅为1500美元,颠覆了传统游戏开发的高成本模式,为独立开发者提供了机会。

🔓 Multiverse的完全开源开发理念激发了社区活力,全球开发者可以自由学习与改进,推动了技术的快速迭代。

详情链接:https://github.com/EnigmaLabsAI/Multiverse

8、秘塔AI搜索上线“讲题”功能 降低家长辅导门槛

AI秘塔公司推出的“塔子老师讲题”功能,旨在缓解家长在辅导孩子作业时面临的知识焦虑与时间压力。该功能通过AI技术实现题目自动识别和解题步骤的可视化讲解,覆盖从小学到成人考证的各个学段。与传统搜题工具不同,它模拟真人教师授课逻辑,帮助家长更有效地辅导孩子,降低了辅导的门槛。

【AiBase提要:】

🧠 该功能利用AI技术实现题目自动识别和解题步骤可视化,旨在降低家长辅导门槛。

📖 覆盖小学至成人考证的全学段题目,支持拍照上传后自动解析,提供详细的解题过程。

⏱️ 平均讲解时长约3分钟,复杂题目可拆解为5-7个分析节点,帮助学生更好理解知识点。

9、Genspark 推出“AI Sheets”电子表格AI工具,革新数据处理体验

人工智能初创公司Genspark推出的“AI Sheets”电子表格AI工具,通过智能化手段简化数据处理流程,提升用户办公效率。该工具支持聊天操作,自动完成数据搜索、整理、分析与可视化,颠覆传统电子表格使用方式。其三大核心功能包括自动数据分析与可视化、智能信息检索以及AI替代公式,普通用户也能轻松实现专业级数据分析。

【AiBase提要:】

📈 自动数据分析与可视化:用户输入提示,工具自动生成图表或可视化结果。

🔍 智能信息检索:AI自动查找公司、人物、产品等相关数据,无需手动输入。

🤖 AI替代公式:通过自然语言指令批量处理数据,突破Excel复杂公式的限制。

10、Google Gemini API迎来隐式缓存功能 自动节省开发成本高达75%

Google最近在其Gemini API中推出了隐式缓存功能,旨在帮助开发者在使用AI模型时显著降低成本,最高可节省75%。这一功能通过自动识别和重用相似请求的内容,简化了开发者的操作流程,减少了手动配置的需求。尽管Google对隐式缓存的效果充满信心。

【AiBase提要:】

💰 隐式缓存功能可自动识别并重用相似请求内容,帮助开发者节省高达75%的费用。

⚙️ 与显式缓存不同,隐式缓存无需手动定义高频请求,简化了操作流程。

📈 Google建议开发者在请求开头放置重复上下文,以提高命中缓存的几率。

详情链接:https://developers.googleblog.com/en/gemini-2-5-models-now-support-implicit-caching/

11、PixVerse v4登陆Replicate,AI视频生成速度与质量再突破

PixVerse v4在Replicate平台的上线为内容创作者带来了前所未有的高清视频生成体验。新版本不仅支持多种分辨率的视频生成,还在生成速度和视觉效果上实现了显著提升。它的创新功能如音效同步和风格迁移,为用户提供了更丰富的创作可能性。

【AiBase提要:】

⚡️ PixVerse v4支持生成5秒至8秒的高清视频,分辨率覆盖540p至1080p,生成速度和画面细节令人惊叹。

🎨 新版本引入音效同步和风格迁移功能,用户可轻松生成带有自然音效的视频,并一键切换至多种艺术风格。

💻 PixVerse v4通过开源和低门槛的API接入,让个人用户和小型企业也能轻松创作视频,极大降低了创作门槛。

详情链接:https://platform.pixverse.ai

12、快手祭出“内容净化器”KuaiMod!多模态AI专治各种劣质内容

在短视频日益成为人们生活重要组成部分的背景下,快手推出了KuaiMod,旨在通过多模态大模型优化短视频平台生态。KuaiMod的核心是对短视频内容质量的判别,通过建立包含1000条视频的数据集,提升内容识别的准确性,并引入强化学习策略,实时更新模型以应对用户偏好的变化。

【AiBase提要:】

📊 KuaiMod通过建立1000条视频数据集,制定了首个短视频内容质量判别基准测试。

🔍 采用强化学习策略,KuaiMod能够根据用户反馈实时更新和优化判别模型。

📈 初步测试显示,KuaiMod的内容质量判别准确率高达92.4%,显著提升了内容识别效果。

详情链接:https://kuaimod.github.io/

13、英伟达开源新一代OCR代码推理 AI 模型,超越 OpenAIo3-Mini表现

英伟达最新发布的Open Code Reasoning(OCR)模型套装引起了技术界的广泛关注,展示了其在人工智能领域的创新能力。该模型套装包含多种参数规模的模型,旨在为开发者提供强有力的代码推理和生成工具。通过高质量的数据集和先进的Nemotron架构,OCR模型在LiveCodeBench基准测试中表现出色。

【AiBase提要:】

🚀 英伟达的OCR模型套装包括32B、14B和7B三种不同参数规模,基于优化的Nemotron架构,适应多语言和多任务学习。

🔧32B模型专为高性能推理设计,14B模型平衡计算需求与性能,7B模型则适合资源受限的环境。

🏆 在LiveCodeBench基准测试中,OCR模型的表现超越OpenAI的o3-Mini和o1(low)模型,显示出卓越的推理能力和实际应用潜力。

(举报)

8678 文章 1392570 浏览次数 950300 粉丝

评论 (0)

热门作者

AI中国

AI中国

8678 文章 95.03万 关注

IT之家

IT之家

1221 文章 5.64K 关注

人人都是产品经理

人人都是产品经理

535 文章 5.87万 关注

钛媒体APP

钛媒体APP

461 文章 0 关注

36氪

36氪

419 文章 5.63K 关注

疑问动画