腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力 95 0 感谢IT之家网友 有鲫雪狐 的线索投递!IT之家 5 月 9 日消息,腾讯混元宣布今天正式推出并开源全新的多模态定制化视频生成工具 Hunyuan Custom。该模型基于混元视频生成大模型(Hunyuan Video)打造,主体一致性效果超过现有的开源方案。据介绍,Hunyuan Custom 融合了文本、图像、音频、视频等多模态输入生视频的能力,是一款具备高度控制力和生成质量的智能视频创作
英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low) 101 0 IT之家 5 月 9 日消息,科技媒体 marktechpost 昨日(5 月 8 日)发布博文,报道称英伟达开源其 Open Code Reasoning(OCR)模型套装,含 32B、14B 和 7B 三种参数规模,均采用 Apache 2.0 许可证发布,模型权重和配置已在 Hugging Face 平台开放下载。OCR 模型套装提供三种参数规模,分别为 OpenCodeReasoning
Meta 开源 LlamaFirewall 防护工具,助力构建安全 AI 智能体 106 0 IT之家 5 月 9 日消息,Meta AI 公司最新推出 LlamaFirewall,应对 AI 智能体不断演变的威胁格局,为生产环境中的 AI 智能体提供系统级安全保护。随着大型语言模型(LLMs)嵌入 AI 智能体并被广泛应用于高权限场景,安全隐患随之增加。这些智能体可以读取邮件、生成代码、调用 API,一旦被恶意利用,后果不堪设想。传统的安全机制,如聊天机器人内容审核或硬编码模型限制,已
OpenAI ChatGPT 推首个深度研究连接器,可 AI 洞察 GitHub 代码库 183 0 IT之家 5 月 9 日消息,科技媒体 maginative 昨日(5 月 8 日)发布博文,报道称 OpenAI 推出了 ChatGPT 的首个“深度研究连接器”(deep research connector),实现与 GitHub 的深度整合。开发者现在可以直接将自己的 GitHub 代码库连接到 ChatGPT,AI 将深入分析代码结构、实现模式以及相关文档,快速生成详细的研究报告或技术
OpenAI 突破传统微调,RFT 技术可精准定制 o4-mini 模型 69 0 IT之家 5 月 9 日消息,科技媒体 marktechpost 今天(5 月 9 日)发布博文,报道称 OpenAI 公司在其 o4-mini 推理模型上,推出了强化微调技术(Reinforcement Fine-Tuning, 简称 RFT),为定制基础模型以适应特定任务带来了突破性工具。OpenAI 的强化微调技术(RFT)将强化学习原理融入语言模型的微调过程。开发者不再仅依赖标注数据,而
AI自动化 社交媒体营销 推特增长 内容生产策略 用AI半年涨粉50万,Make工作流这样批量出爆款! 158 0 声明:本文来自于微信公众号 见实,作者:见实,授权站长之家转载发布。半年涨粉50万,难吗?某种程度上,几乎是不可能完成的任务。但AI可以。“这是我们行业内众所周知的典型案例,它是一个专门用于自动发推验证的推特账号。从去年11月创建到现在,仅用了快半年时间就拥有了50万关注者。”也就是说,通过搭建make工作流(一种AI自动化工作流软件),可以实现自动化更新:从最开始的信息采集,文件格式化,到入
苹果 iOS 18.6 百度 苹果AI国行版终于来了:百度与苹果联姻 132 0 快科技5月10日消息,苹果记者Mark Gurman爆料,国行版苹果iOS 18.6将启用部分Apple Intelligence功能,由百度和阿里共同提供技术支持。据悉,阿里负责开发审查引擎,百度的AI技术与Siri和Visual Intelligence实现深度整合,这意味着百度将同时承担聊天和搜索两大重任。有业内人士称,从往常经验来看,安全模块在AI服务里一般只占比10%左右,为苹果提供
UGMathBench动态基准测试数据集发布 可评估语言模型数学推理能力 162 0 近日,魔搭ModelScope社区宣布发布一项名为UGMathBench的动态基准测试数据集,旨在全面评估语言模型在本科数学广泛科目中的数学推理能力。这一数据集的问世,填补了当前在本科数学领域评估语言模型推理能力的空白,并为研究者提供了更为丰富和具有挑战性的测试平台。随着人工智能技术的飞速发展,自然语言模型在自动翻译、智能客服、医疗、金融等多个领域展现出巨大潜力。然而,如何准确评估这些模型的性能,
天猫精灵Q糖智能音箱亮相:升级AI功能,新增红外遥控 192 0 在智能家居日益普及的今天,天猫精灵又推出了其最新的 Q 糖系列智能音箱。这一系列音箱不仅外观时尚,还配备了强大的智能功能,旨在为用户提供更便捷的生活体验。5月9日,天猫精灵 Q 糖系列正式上市,分为红外版与标准版两种选择。Q 糖系列音箱有四种可爱颜色可供选择,包括蜜桃粉、海盐蓝、奶酪灰和可可黑。其中,黑色红外版还配备了显示屏,首发价为139元,国家补贴后仅需118元;而标准版的首发价则为109元,
字节跳动开源深度研究框架DeerFlow 168 0 字节跳动宣布正式开源其全新研发的社区驱动深度研究框架 DeerFlow,这一举措迅速引发了AI研究领域的广泛关注。作为一款基于LangChain和LangGraph框架构建的智能研究助手,DeerFlow将语言模型与网络搜索、爬虫、Python代码执行等专业工具深度整合,为自动化研究和内容创作提供了全新可能。DeerFlow核心功能:智能化与人机协作的完美结合DeerFlow旨在通过AI技术提升研
英伟达开源新一代OCR代码推理 AI 模型,超越 OpenAIo3-Mini表现 95 0 英伟达在技术界引起广泛关注,正式发布了其最新的 Open Code Reasoning(OCR)模型套装。这一模型的推出,不仅展示了英伟达在人工智能领域的创新能力,也为开发者提供了强有力的工具,助力他们在代码推理和生成任务中取得更好的成绩。** 模型参数与架构:多样化选择 **英伟达的 OCR 模型套装共包含三种不同参数规模,分别为32B、14B 和7B。这些模型均基于 Nemotron 架构进行
OpenAI 发布关于 AI 模型使用的官方建议,助力用户更高效工作 113 0 近日,OpenAI 在其帮助中心发布了针对企业用户的全新指南,详细说明了其多种人工智能模型的最佳使用时机。这一举措旨在帮助用户根据不同的任务需求,选择最合适的 AI 模型,从而提升工作效率和成果质量。OpenAI 的最新订阅计划 ——ChatGPT Enterprise,提供了企业级的安全与隐私保护,同时允许用户无限制地高速访问其先进的 GPT-4o 和 OpenAI o3推理模型。用户还可以利用
FDA全面部署AI:加速新药审批,OpenAI或成合作伙伴 183 0 美国食品药品监督管理局(FDA)于当地时间周四宣布,将在其所有下属中心全面启动人工智能(AI)的内部部署,目标是在6月30日前完成整合。此前,FDA已成功完成面向科学审评人员的新生成式AI试点项目。FDA表示,引入这些生成式AI工具旨在通过减少科学家及各领域专家重复性的工作,显著加快新药审批流程。目前,FDA通常需要在收到新药审批申请后的6到10个月内做出决定。图源备注:图片由AI生成,图片授权服
马斯克请求法庭驳回或推迟 OpenAI 的反诉 65 0 特斯拉和 SpaceX 首席执行官埃隆・马斯克的律师向负责审理他针对 OpenAI 提起的违约诉讼的法庭提出申请,请求驳回或推迟 OpenAI 的反诉。OpenAI 在其反诉中指控马斯克进行不正当竞争,并对其计划将公司转型为盈利性质的做法施加 “侵权干扰”。 图源备注:图片由AI生成,图片授权服务商Midjourney马斯克和 OpenAI 之间的法律争斗源于马斯克试图收购这家人工智能公司。他在
Barracuda推出多模态AI升级,提升网络安全威胁检测能力 200 0 Barracuda Networks 近日发布了其新一代的威胁检测技术,利用多模态人工智能(AI)提升对网络攻击的防护能力。这项技术能够实时分析并关联多种数据类型,包括网址、文档、图像和二维码,从而最大限度地提高威胁检测的准确性和速度。Barracuda 表示,最新的多模态 AI 整合了其现有的人工智能和机器学习能力,使系统能够并行处理和解读多条数据流。通过结合机器学习分类器和专用的沙箱引擎,这一
快手祭出“内容净化器”KuaiMod!让多模态AI帮你过滤烂片 65 0 最近,短视频领域又迎来了一项重大技术突破 —— 快手推出的 KuaiMod,这一基于大模型的内容审核框架,有望彻底改变短视频生态的现状。今天,咱们就深入剖析一下,KuaiMod 到底有哪些厉害之处。短视频的 “烦恼”:不良内容泛滥现在的短视频平台,像快手、TikTok 这些,那发展速度简直像坐火箭一样!每天都有海量的视频上传,其中不乏很多优质内容,给大家带来知识和欢乐。但问题也来了,有些不良视频也