最新

AI短视频教程
AI视频
即梦AI
短视频运镜教程
运镜
Voila – 开源端到端语音大模型,实现低延迟语音对话
Voila是什么Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自然的交互体验。Voila 集成了语音和语言建模能力,支持数百万种预构建和自定义声音,用户可以通过文本指令或音频样本轻松定制说话者的特征和声音。 包含两个主要模型:Voila-e2e 用于端到端语音对话,Voila-autonom
昆仑万维开源Skywork-R1V 2.0版本 视觉与文本推理能力提升
4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是在高考理科难题的深度推理和通用任务场景中表现出色,堪称当前最均衡兼顾视觉与文本推理能力的开源多模态模型。R1V2.0的开源,不仅是昆仑万维在多模态领域技术实力的体现,也为全球开发者和研究者提供了强大的工具,推动多模态生态建设。该模型在多个权
微软 Copilot 已支持 GPT-4o 图像生成技术,能力大提升
IT之家 5 月 19 日消息,微软近日为 Copilot AI 推送了最新更新,其中最重要的功能是加入了对 OpenAI 的 GPT-4o 图像生成技术的支持。IT之家曾报道,今年早些时候,OpenAI 推出了 GPT-4o 图像生成器,其强大的功能引发热议,尤其是生成的吉卜力风格(Ghibli)表情包在网上火爆一时。微软表示:“我们已将 Copilot 的图像生成功能升级至 4o 图像生成,
EasyControl_Ghibli模型上线:免费解锁吉卜力风格图像生成
近日,一款名为EasyControl_Ghibli的AI模型在Hugging Face平台悄然上线,为广大用户带来了一个令人振奋的消息:无需付费,即可轻松生成带有吉卜力风格的图像。这一模型的发布,不仅为动漫爱好者和创意人士提供了一个简单易用的工具,也让更多普通人有机会将自己的想象力融入经典的吉卜力美学之中,点亮日常生活的温暖一角。据介绍,EasyControl_Ghibli模型的设计初衷是为了打破
谷歌推出 Gemini 本地图像编辑功能:动动手就能让 AI 帮你改图
IT之家 5 月 1 日消息,谷歌在当地时间周三发布的博客中宣布,Gemini 聊天机器人应用目前支持修改由 AI 生成的图像以及用户从手机或计算机上传的图像。据IT之家了解,Gemini 的本地图像编辑功能将从今天起逐步推向全球,预计在未来几周内,服务将扩展至大多数国家,并支持超过 45 种语言。此次推出紧接着谷歌 3 月在 AI Studio 平台上测试的 AI 图像编辑模型,该模型因能删除
三星进军 AI 机器人领域,Ballie 本周公开亮相
IT之家 4 月 9 日消息,三星公司昨日(4 月 8 日)通过官方 Instagram 平台,预告将于本周在某个舞台上,展示 Ballie 机器人,可能会公布该机器人的发售细节。Ballie 是一款深度集成 SmartThings 平台的 AI 伴侣机器人,配备摄像头和迷你投影仪,能够在家中跟随用户,它不仅能够提供天气预报、播放电影、展示三星健康数据,还能协助管理购物清单、控制智能家居设备等。
「亿格云」获近亿元 Pre-B 轮融资:加速 AI 办公支撑平台研发与全球化布局
在2024年,公司顺应技术趋势与客户需求变化,完成以 AI 为核心的战略升级,正式推出“一站式 AI 办公支撑平台”,该平台架构可概括为:“一底座・双 Agent・全 AI 智能协同”。36氪广东获悉,近日,专注于企业办公安全领域的零信任SASE服务商 —— 杭州亿格云科技有限公司(简称:「亿格云」)正式宣布完成Pre-B轮近亿元融资。本轮融资由红杉中国领投、元璟资本、启创资本老股东持续加码,由
DataBahn.ai推出“数据礁”智能化安全情报的新时代
在网络安全领域,如何快速而准确地处理海量数据是企业面临的一大挑战。最近,数据科技公司 DataBahn.ai 推出了一款名为 “数据礁”(Reef)的创新产品,旨在将高流量、高速度的安全监测信息转化为及时、可操作的情报,帮助企业做出更明智的决策。如今,企业收集的日志、警报和监测数据多达数 PB,但实际上仅分析不到5%。这意味着绝大多数数据未被充分利用,关键的信息往往被淹没在海量的噪音中。“数据礁”
AI介入私域运营,不仅提效,还省90%的token!
声明:本文来自于微信公众号 见实,作者:见实,授权站长之家转载发布。AI并不能完全取代现有的私域业务流程,更重要的是“精准介入”。例如,向百万用户发送促销邀请时,我们并不需要AI的全量轰炸(现有的企微群发功能已够用),而是潜伏在关键节点:仅对10%的真实回复者启动服务——用户确认参与的瞬间,AI自动标记“意向参与用户”,为后续精准推送铺路。这样的做法既融入了原有的工作流,又将AI的token消
Anthropic 全新 AI 模型 Claude Neptune 即将亮相,竞逐市场巨头
科技媒体 testingcatalog 发透露了 AI 公司 Anthropic 正在研发的新模型 Claude Neptune 的相关信息。目前,这一新 AI 模型已进入内部安全测试阶段,预计将与 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展开竞争。根据博文的介绍,Claude Neptune 的安全测试正在使用 Anthropic Workbench 平台进行。这一阶段主
字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体
IT之家 4 月 18 日消息,IT之家从豆包大模型团队获悉,UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。有关的链接如下:GitHub:https://github.com/bytedance/UI-TARSWebsite:https://seed-tars.com/Arxiv:https://arxiv.org
苹果、谷歌、Meta、OpenAI都在抢的新赛道,中国公司的机会在哪?
声明:本文来自于微信公众号 硅星人Pro,作者:王飞,授权站长之家转载发布。五天前,一笔震惊科技圈的重磅收购案浮出水面。OpenAI宣布以高达65亿美元的价格,收购了由前苹果首席设计官Jony Ive创办的AI硬件公司io,并计划将其打造为一个专注消费级智能设备的核心部门。Jony Ive、约55名的硬件工程师、软件开发人员和制造专家,以及一个梦想中的AI硬件造就了OpenAI历史上最大手笔的
7个月ARR 1.2亿美元,昆仑万维靠“短剧+AI”找到了新增长点
声明:本文来自于微信公众号 白鲸出海 作者:张凯然,授权站长之家转载发布。近2年,短剧出海持续升温,吸引了大量中国厂商积极入局。DataEye-ADX 的数据显示,截止2025年2月该品类在投应用数已经达到了231款,是去年同期的4倍,与快速增长的平台数量对应的是,从业者对这一市场前景普遍乐观的预判。据某头部媒体发布的行业白皮书显示,海外短剧月均用户已达2000-4000万,未来短剧预计将覆盖
理想汽车 OTA7.4 更新:全新 MindGPT-4o-preview 模型上线,智能座舱焕然一新
理想汽车于5月28日正式推出 OTA7.4版本更新,这次升级不仅带来了全新的智能座舱体验,还首次上线了自研的 MindGPT-4o-preview 模型,标志着理想汽车在智能化方面迈出了重要一步。在此次更新中,理想同学的形象全面升级为3D 毛绒形象,增添了双手的设计,让其在执行任务时更显灵动和亲切。此外,基于 MindGPT-4o-preview 模型,理想同学的音色更加丰富,情感表达也变得更加人
2025年AI视频生成企业TOP20榜单出炉:可灵AI、即梦AI、PixVerseAI位居前三
近日,由 DBC、CIW 和 CIS 联合发布的 “2025年 AI 视频生成企业 TOP20” 榜单正式出炉,快手旗下“可灵AI”、爱诗科技“PixVerseAI”及抖音“即梦AI”占据前三席位。另外,阿里巴巴(通义万相、绘蛙AI视频)、腾讯(智影)、科大讯飞(讯飞绘镜)、MiniMax(海螺AI)等多家企业均榜上有名。
亚马逊跟随微软暂停雄心勃勃的部分国际AI数据中心计划
根据美国两家银行 Wells Fargo 和 TD Cowen 的最新报告,亚马逊已暂停了一些国际数据中心的谈判,主要集中在欧洲。这一消息传出不久,微软也被曝出暂停或取消部分计划。Wells Fargo 的报告指出:“目前尚不清楚暂停的具体范围,但这一举措与微软最近的动态非常相似 —— 它们正在消化近期的激进租约。” 该报告强调,微软似乎仍在推进已签署的交易。图源备注:图片由AI生成,图片授权服务