Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合

Runway于近日正式推出Gen-4References功能,为其AI视频生成模型Gen-4新增了图像一致性参考能力。这一功能允许用户通过上传参考图像,提取人物、场景或风格特征,并在生成内容中保持高度一致性,支持多张图像混合生成,为AI视频创作带来了前所未有的控制力与创意自由。核心功能解析:多图像融合与一致性控制Gen-4References的核心在于其强大的图像参考与风格嵌入能力。用户可上传1至

香港特区政府将资助逾百亿港元发展人工智能

IT之家 6 月 7 日消息,据大湾区之声,香港特区行政长官李家超昨日出席由香港中华厂商联合会主办的第十六届海峡两岸和香港、澳门经贸合作研讨会开幕式并致辞。李家超表示,香港正积极发展人工智能产业,推动传统产业转型升级,致力于建设国际创新科技中心。在资金支持方面,香港已推出 30 亿港元(IT之家注:现汇率约合 27.48 亿元人民币)的人工智能专项资助计划,资助香港本地院校、研发机构及企业等运用

推理能力飞跃?豆包1.5深度思考模型即将正式服务企业

火山引擎今日发布活动预热,正式宣布其新款豆包大模型将于明日(4月17日)在FORCE LINK AI创新巡展杭州站上隆重发布。官方信息显示,此次发布会将带来豆包大模型家族的全新升级,并特别推出备受瞩目的豆包1.5深度思考模型。此前已有消息透露,豆包APP和桌面端已针对“深度思考模式”进行了多轮实验性测试。此次发布后,该模型将正式面向企业客户提供服务。据悉,豆包公众号此前已公开宣布测试新版深度思考功

上海 AI 实验室联合清华等大学突破强化学习算法,攻克 AI 推理熵崩溃难题

IT之家 6 月 4 日消息,上海人工智能实验室联合清华大学、伊利诺伊大学香槟分校等学府,组建国际团队研发新方法,通过 Clip-Cov 和 KL-Cov 技术有效应对策略熵崩溃问题。背景简介大型语言模型(LLMs)近年来在推理能力上的突破,让强化学习(RL)的应用范围从单一任务扩展到更广泛的场景,这种进步赋予了模型更强的泛化能力和逻辑推理能力。然而,与传统的模仿学习不同,强化学习需要更高的计算

谷歌创意利器 Canvas 升级 Gemini 2.5:降低开发门槛,AI 多样化呈现文本内容

IT之家 5 月 22 日消息,在 2025 年 I/O 开发者大会上,谷歌宣布其 Canvas 平台升级至 Gemini 2.5 模型,能将文档和代码转化为动态网页、信息图表、测验和播客,改变用户创作方式。Google Labs 副总裁 Josh Woodward 在现场展示,Canvas 创意平台能一键将书面报告,转化为动态网页、信息图表、互动测验和播客(支持 45 种语言)。IT之家援引博

iOS 版谷歌 App“简化”功能上线:AI 一键帮你读懂复杂内容、专业术语

感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 5 月 7 日消息,谷歌今日面向 iOS 版 App 发布了一项全新 AI 功能“Simplify(简化)”,旨在帮助 iPhone 用户更轻松地理解网上专业性强或晦涩难懂的内容。用户只需选中对应的文字,即可在当前网页上生成更通俗易懂的版本,无需跳转页面。据IT之家了解,Simplify 依托谷歌 Gemini AI 模型,由 Google

Getty Images CEO 谈 AI 版权诉讼:诉讼费用难以承受

Getty Images首席执行官克雷格・彼得斯(Craig Peters)在最近接受 CNBC 采访时表示,作为一家大型图像版权公司,Getty Images在面对人工智能技术引发的版权争议时,面临着巨大的财务压力。他指出,即使是像盖蒂这样的大公司,也难以承担每一宗侵权案件的诉讼费用。彼得斯提到,Getty Images目前正在对生成图片的人工智能公司 Stability AI 提起诉讼,原因是

SurfSense:重新定义个人知识管理的AI研究助手

一款名为SurfSense的开源AI研究助手横空出世,以其独特的个人知识库整合功能和强大的研究能力,迅速成为NotebookLM和Perplexity的有力竞争者。SurfSense不仅继承了AI驱动的智能搜索与交互特性,还通过打通个人知识库,为用户提供了一个前所未有的信息管理与研究平台。本文基于近期网络信息,深入探讨SurfSense的核心功能、优势以及其对研究领域的潜在影响。突破传统:个人知识

OpenAI 将 ChatGPT 新图像生成技术引入 API,每张图约 2 美分起

IT之家 4 月 24 日消息,OpenAI 于本周三宣布,将其 ChatGPT 中新升级的图像生成功能背后的技术引入 API,使开发者能够将这一功能集成到他们的应用程序和服务中。今年 3 月底,OpenAI 推出的新 ChatGPT 图像生成器因其能够创建逼真的吉卜力风格图片和“AI 人偶”而迅速走红。这一功能的推出吸引了数百万新用户注册 ChatGPT,也给公司的服务器容量带来了巨大压力。据

快手重磅推出 OneRec 推荐系统,开启智能推荐新时代!

快手近日宣布上线全新端到端生成式推荐系统 OneRec,这一举措不仅在效果和成本上实现了双重突破,也标志着推荐技术的一个新里程碑。OneRec 利用先进的大模型技术,全面重塑了传统的推荐架构,大幅提升了计算效率。具体来说,OneRec 的计算量提高了惊人的10倍,算力的利用率也达到了23.7% 和28.8%。这一技术进步让快手的运营成本仅为以往传统推荐方案的10.6%。换句话说,快手不仅能以更低的

OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能

OpenAI 在近日宣布,已将其最新的图像生成功能通过 API 开放给开发者,使其能够将这一先进的技术集成到各种应用和服务中。这一消息无疑为开发者们提供了一个新的机遇,特别是在图像处理和创作领域。新推出的图像生成模型名为 “gpt-image-1”,其背后支持了 ChatGPT 的图像生成技术。自今年3月底该功能上线以来,用户可以创建出逼真的吉卜力风格图片和各种 “AI 人偶”。这一功能在上线后迅

多名作家致信英国政府,敦促追究 Meta 用有版权书籍训练 AI 的侵权责任

IT之家 4 月 2 日消息,据英国《卫报》当地时间 3 月 31 日报道,理查德・奥斯曼、石黑一雄、凯特・莫斯和瓦尔・麦克德米德等知名作家联名签署公开信,敦促英国政府追究 Meta 利用受版权保护书籍训练 AI 的责任。这封公开信呼吁文化、媒体和体育大臣丽莎・南迪召集 Meta 高管到议会接受质询。麦克德米德在谈及签署原因时表示:“合同明确规定,第三方使用作家作品时必须支付报酬。无论是改编、翻

李彦宏将于25日在Create2025百度AI开发者大会发表首场演讲,揭示百度AI新动态

今日,百度创始人李彦宏的25年首场演讲海报正式曝光。根据海报信息,李彦宏将在4月25日的Create2025百度AI开发者大会上带来一场为期1小时的主题演讲,题为《模型的世界,应用的天下》。演讲内容将聚焦AI领域的热门议题,包括MCP、智能体、数字人、模型成本等,引发业界广泛关注。此次大会的亮点之一是李彦宏将正式发布百度AI的最新产品和业务进展。此前,百度已预告将在大会上推出文心大模型4.5Tur

小扎“超级智能”小组第一位大佬,谷歌DeepMind首席研究员,“压缩即智能”核心人物

小扎亲手挖人,很疯狂。最新爆料,谷歌DeepMind首席研究员Jack Rae已经确认转投。另有消息称,Meta还招募了AI语音初创公司Sesame AI的ML主管 Johan Schalkwyk。前一天刚被爆出,他想斥巨资150亿美元收购Scale AI,后者做数据标注已经做到了百亿美元估值。据说,他们28岁华人创始人Alexandr Wang与团队会直接并入Meta。在过去一段时间

印度AI人才需求井喷:45,000+职位虚位以待,高薪机遇正当时

印度的人工智能(AI)就业市场正经历前所未有的蓬勃发展。据最新报告显示,预计到2025年,印度将有超过45,000个AI相关职位空缺,彰显了该国在AI领域迅速增长的需求和巨大的发展潜力。这一趋势尤其在医疗保健和金融科技等行业表现突出,推动着创新和效率的全面提升。领英(LinkedIn)最近的一份报告指出,印度人工智能相关职位在短短一年内增长了惊人的74%。企业不仅在积极招聘,更在投资打造长期的人工

OpenAI 抛弃 Node.js,用 Rust 重写 AI 编程工具 Codex CLI

IT之家 6 月 3 日消息,科技媒体 Dev Class 今天(6 月 3 日)发布博文,报道称 OpenAI 公司将使用 Rust 语言,取代原有的 Node.js 架构,重写 AI 命令行编程工具 Codex CLI。IT之家注:Codex CLI 是 OpenAI 开发的一款实验性 AI 编码工具,可通过 ChatGPT 网页端或本地命令行运行。该工具采用聊天式用户界面,支持交互式操作(