火山引擎发布豆包视频生成模型 Seedance 1.0 lite:影视级质量、速度大幅提升 57 0 IT之家 5 月 13 日消息,在今日举办的 FORCE LINK AI 创新巡展上海站活动中,火山引擎正式发布了一系列 AI 模型升级产品,包括豆包・视频生成模型 Seedance 1.0 lite、豆包 1.5・视觉深度思考模型,并对豆包・音乐模型进行了升级,旨在通过更全面的模型矩阵和更丰富的智能体工具,助力企业打通从业务到智能体的应用链路。据IT之家了解,此次发布的 Seedance 1.
苹果发布 FastVLM 视觉语言模型,为新型智能眼镜等穿戴设备铺路 111 0 IT之家 5 月 13 日消息,苹果机器学习团队上周在 GitHub 发布并开源了一款视觉语言模型 ——FastVLM,提供 0.5B、1.5B、7B 三个版本。据介绍,该模型基于苹果自研 MLX 框架开发并借助 LLaVA 代码库进行训练,专为 Apple Silicon 设备的端侧 AI 运算进行优化。技术文档显示,FastVLM 在保持精度的前提下,实现了高分辨率图像处理的近实时响应,同时
火山引擎发布豆包 1.5・视觉深度思考模型,新增 GUI Agent 能力 110 0 IT之家 5 月 13 日消息,在今日举办的 FORCE LINK AI 创新巡展・上海站上,火山引擎发布了豆包 1.5・视觉深度思考模型(Doubao-1.5-thinking-vision-pro),该模型激活参数仅 20B,但具备强大的多模态理解和推理能力,在 60 个公开评测基准中,有 38 个达到业界最佳表现(SOTA),在视频理解、视觉推理、GUI Agent 能力等方面均处于第一梯
(更新:对话功能恢复正常)DeepSeek 出现服务问题,登录失败、无法对话 200 0 感谢IT之家网友 软媒新友2314942、Intel牙膏厂、吃饭不用碗 的线索投递!18:43 更新:DeepSeek 服务状态页面更新称,App、WEB 对话功能恢复正常,对话历史有概率获取失败。IT之家 5 月 13 日消息,据IT之家小伙伴反馈,DeepSeek 今日下午出现服务问题,主要影响网页端、App 对话。deepseek 话题也登上了微博热搜第 9,网友反馈具体表现为账号登录失
Aqara AI 灵眸看家宝套装 Y100 开售:支持 HomeKit,预估到手价 899 元 155 0 IT之家 5 月 13 日消息,Aqara AI 灵眸看家宝套装 Y100 已开售,售价 999 元,今晚 20 点开始预估到手价 899 元。据IT之家了解,Aqara AI 灵眸看家宝套装 Y100 包括智能摄像机 G3、门窗传感器 T1、人体传感器 P1 和动静贴 T1 等设备。这些设备通过自动化设置和联动,能够实现 24 小时的家庭安全守护。用户可以通过 Aqara Home App 扫
AI药物研发神器DiffSMol上线!3秒生成候选药物,成功率暴涨5倍! 154 0 5月12日,俄亥俄州立大学研究团队推出DiffSMol,一款生成式人工智能模型,专为生成候选药物的3D结构设计(https://news.osu.edu)。DiffSMol通过分析已知配体(与蛋白质靶点结合的分子)的形状,仅需数秒即可生成具有优异结合特性的新型3D分子,成功率高达61.4%,远超此前研究仅12%的水平。AIbase观察到,这一突破性进展有望重塑长达十年的药物研发流程,显著提升效率与
OpenAI 与软银的百亿 AI “星际之门”计划进展缓慢,融资难题悬而未决 92 0 在人工智能领域,OpenAI 与软银共同推出的星际之门(Stargate)项目一度引起了广泛关注。该项目计划投资高达1000亿美元,目标是建立全球领先的人工智能基础设施,并希望在未来将投资额提升至5000亿美元。然而,随着时间的推移,融资进展的缓慢和市场环境的变化使得这一宏伟计划面临挑战。 融资难题显现 根据最新消息,由于美国政府的关税政策,星际之门项目的融资进展出现了阻碍。针对服务器机架、芯片及
OpenAI推出深度研究报告一键导出PDF功能 172 0 人工智能领域的领军企业OpenAI宣布,为其ChatGPT深度研究(Deep Research)工具新增了一项重要功能——一键将深度研究报告导出为PDF。此功能不仅提升了研究报告的实用性,还进一步推动了AI在企业场景中的落地应用。功能亮点:完整保留格式,专业输出OpenAI的深度研究工具能够通过多步骤网络搜索和信息整合,生成包含引用、表格和图片的详尽报告。然而,此前用户需手动整理或分享这些报告,限
全球首款设计Agent Lovart内测!一句话搞定Logo、视频、品牌全套 126 0 5月12日,Lovart AI正式宣布推出全球首款设计Agent,定位为文生图领域最具创新性的产品形态。作为一款集成图像、视频和音乐模型的AI设计工具,Lovart通过自然语言指令实现从任务拆解到最终输出的全链路自动化设计,彻底颠覆传统设计工作流。AIbase观察到,Lovart的Beta测试已在全球引发热烈反响,吸引了设计师、营销团队和初创企业的广泛关注。体验地址:https://lovart.
颠覆传统ISP,Glass Imaging用AI“重塑摄影”:AR、手机、无人机市场全面瞄准 111 0 人工智能成像技术公司 Glass Imaging 宣布完成2000万美元A轮融资,由全球知名软件投资机构 Insight Partners 领投,GV(谷歌风投)、Future Ventures 和 Abstract Ventures 等老股东继续加码。此轮融资将用于加速 GlassAI 技术的开发,并拓展其在智能手机、无人机、可穿戴设备等平台的应用。Glass Imaging 总部位于加州洛斯阿
月之暗面Kimi界面升级:气泡样式优化 改为无边界内容展示 83 0 月之暗面科技有限公司旗下的智能助手Kimi宣布对其产品界面进行了一次重大升级。此次升级的核心目标是打破传统对话框的限制,将Kimi从一个简单的聊天工具转变为一个功能更强大、信息呈现更丰富的多模态容器。Kimi的界面重构包括了多项重要更新。首先,信息呈现能力得到了显著增强。Kimi现在支持多端实时K线图组件,能够响应股票和指数类查询,为用户提供直观的市场走势分析。此外,Web端新增了HTML预览功能
字节跳动发布统一图像定制框架DreamO:集成换装、换脸与风格迁移 57 0 字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO,这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,为AI图像编辑领域带来了全新的技术突破。AIbase编辑部整理了最新信息,深入解析DreamO的核心亮点及其对行业的潜在影响。框架亮点:一站式图像定制解决方案DreamO被设计为一个统一的图像定制框架,支持多样化的编辑任务,并通过灵活的参数设置实现
Lovart震撼发布:全球首个设计Agent,一键从创意到成品 169 0 人工智能设计领域迎来里程碑式突破!一款名为Lovart的AI设计Agent于近日正式亮相,被誉为“全球首个设计Agent”。这一产品以其从文本提示到专业视觉设计的端到端能力,引发了业内广泛关注。产品亮点:一键从创意到成品Lovart的核心在于其全链路设计能力,能够将用户的模糊创意或简单文本描述转化为像素级精度的专业设计作品。根据官方介绍,Lovart集成了图像、视频和音乐生成模型,支持从任务拆解到
阿里MNN神更新!移动端开源多模态AI支持Qwen-2.5,文本图像语音全搞定! 74 0 阿里巴巴开源项目MNN(Mobile Neural Network)发布了其移动端多模态大模型应用MnnLlmApp的最新版本,新增对Qwen-2.5-Omni-3B和7B模型的支持。这款完全开源、运行于移动端本地的大模型应用,支持文本到文本、图像到文本、音频到文本和文本到图像生成等多种模态任务,以其高效性能和低资源占用引发开发者广泛关注。AIbase观察到,MNN的此次更新进一步推动了多模态AI
AI开发更轻松!MCPHub简化MCP服务器接入,支持OpenAI、LangChain等 136 0 为进一步简化 AI 服务中的 Model Context Protocol(MCP)服务器集成流程,MCPHub 正式发布。作为一款可嵌入式解决方案,MCPHub 为开发者提供了统一的配置、管理与连接方式,兼容多种主流 AI 框架,包括 OpenAI Agents、LangChain 和 Autogen。在当前多模型、多框架并行演进的背景下,MCPHub 致力于打破服务集成复杂、部署门槛高的问题,
从图像出发构建可控交互世界!昆仑万维正式开源Matrix-Game 119 0 5月13日,昆仑万维集团宣布正式开源Matrix-Game大模型,这是一款专注于交互式世界生成的先进模型,标志着交互式世界生成技术的新突破。Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,专为开放式环境中的高质量生成与精确控制而设计。这一开源举措不仅刷新了交互式世界生成的技术上限,也为构建通用虚拟世界基座树立了全新标杆。Matri