AI新词 EvoSearch 快手科技 StableDiffusion 小模型逆袭!港科大快手联手打造"进化搜索"技术,让AI作画告别"大力出奇迹" ⭐0 👥0 在AI作画领域,一直以来都存在一个普遍认知:想要生成高质量的图片和视频,就必须依赖更大的模型、更多的参数和更强的算力。然而,来自香港科技大学和快手科技的研究团队最近提出的EvoSearch(进化搜索)技术,正在彻底颠覆这一固有观念。这项技术最令人震撼的表现是:仅有865M参数的Stable Diffusion2.1模型在使用EvoSearch后,生成质量竟然超越了强大的GPT-4o;而1.3B参数
AI新词 品牌产品词 Qwen3-Embedding 阿里巴巴 阿里开源千问3向量模型,性能大幅提升,挑战谷歌和OpenAI ⭐0 👥0 在人工智能技术快速发展的今天,阿里巴巴于6月6日正式开源了其全新的千问3向量模型系列 ——Qwen3-Embedding。该模型是基于千问3底座,为文本表征、检索和排序等任务进行优化,标志着阿里在 AI 领域的又一重大突破。相较于前一版本,Qwen3-Embedding 在文本检索、聚类和分类等核心任务上的性能提升了超过40%。这一进步不仅让它在技术上更具竞争力,还使得它在 MTEB 等专业榜单中
维基百科 人工智能 AI新词 浏览器扩展程序 维基百科因编辑反对暂停 AI 摘要试点实验 ⭐0 👥0 近期,维基百科因众多编辑的强烈反对,宣布暂停一项使用人工智能技术生成文章摘要的试点实验。据报道,这项实验于本月早些时候推出,主要针对那些安装了维基百科浏览器扩展程序并选择参与的用户。人工智能生成的摘要会显示在每篇维基百科文章的顶部,并且带有 “未经验证” 的黄色标签,用户需点击才能展开阅读。然而,这一新尝试几乎立即引发了编辑们的激烈批评,他们担心这种做法可能会损害维基百科的信誉。许多编辑指出,人工
AI新词 DeepSeek R1-0528 OpenRouter DeepSeek R1- 0528 在OpenRouter支持本地工具调用 ⭐0 👥0 人工智能领域持续快速发展,DeepSeek对其R1-0528模型的最新更新引发了开发者社区的广泛关注。据AIbase报道,升级后的DeepSeek R1-0528现已支持OpenRouter上的本地工具调用,这一重大改进使开发者能够将本地工具无缝集成到AI工作流中。本地工具调用提升工作流效率DeepSeek R1-0528是一款开源推理模型,以其可媲美OpenAI o3和Google Gemini
AI新词 Alphabet SundarPichai 谷歌 Alphabet CEO驳斥“AI取代人类”论,称AGI之路仍存不确定性 ⭐0 👥0 在人工智能带来巨大变革的背景下,Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)周三晚间在接受彭博社采访时,直面外界对AI引发大规模裁员的担忧,强调人工智能将在未来继续推动Alphabet增长,而非导致员工岗位大规模流失。“我预计我们目前的工程阶段甚至会延续到明年,因为它能让我们做得更多,”皮查伊表示。他强调,AI正帮助工程师减少繁琐事务,将精力集中在高价值项目上,从而成为推
AI新词 品牌产品词 AI驱动 Komiko Komiko视频到视频功能炸裂上线!AI一键打造动漫大片,漫画动画创作从未如此简单 ⭐0 👥0 Komiko平台宣布推出全新视频到视频(Video-to-Video)功能,进一步巩固其作为AI驱动的漫画、动画和插画一体化创作平台的领先地位。这一功能结合AI线稿上色、背景移除、图像增强和动画补帧技术,让用户仅需几分钟即可创作出专业品质的漫画和动画作品。AIbase为您深度解析Komiko的最新突破及其对创意产业的深远影响。视频到视频功能:一键转换,创意无限Komiko全新推出的视频到视频功能允
AI新词 品牌产品词 视觉感知 RAG推理框架 通义开源视觉感知多模态RAG推理框架VRAG-RL ⭐0 👥0 近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化推理的难题。在复杂视觉文档知识库中检索并推理关键信息,一直是AI领域的一大挑战。传统的检索增强型生成(RAG)方法在处理视觉丰富信息时显得力不从心,主要因为它们难以应对图像、图表等视觉内容,且现有视觉RA
AI新词 NVIDIA Llama-3.1-Nemotron-Nano-VL-8B-V1 多模态AI NVIDIA放大招!Llama-Nemotron-Nano-VL-8B-V1发布,图像视频文本全能,微调王座谁与争锋? ⭐0 👥0 人工智能领域的竞争日趋白热化,NVIDIA再次以其强大的技术实力引领潮流。AIbase从社交媒体平台获悉,NVIDIA最新发布了Llama-3.1-Nemotron-Nano-VL-8B-V1,一款支持图像、视频和文本输入的视觉到文本模型,输出高质量文本并具备图像推理能力。这一模型的发布不仅展示了NVIDIA在多模态AI领域的雄心,也为开发者提供了高效的轻量化解决方案。本文将为您详细解析这款模型的
AI新词 品牌产品词 observable AgentsSDK OpenAI升级AI智能体开发工具,支持TypeScript 、改进语音对话 ⭐0 👥0 OpenAI 宣布对其 AI 智能体开发工具进行了一系列重要升级。此次更新不仅提升了平台的兼容性,还对语音界面进行了优化,同时增强了可观测性(observability),使得开发者在构建 AI 智能体时能更加得心应手。OpenAI 为其 Agents SDK 新增了对 TypeScript 的支持。这一举措让 JavaScript 和 Node.js 环境下的开发者也能参与到智能体的开发中。新版
AI新词 ChatGPT Ethos Next 米其林星级餐厅用AI设计菜谱引争议:千元晚餐竟是ChatGPT"创作"? ⭐0 👥0 当获奖厨师Grant Achatz宣布使用ChatGPT为其芝加哥米其林星级餐厅Next设计九道菜菜谱时,餐饮界掀起了一场关于AI是否应该介入创意烹饪的激烈辩论。这一争议源于一个看似无害的社交媒体现象。2024年10月,一家名为Ethos的奥斯汀"餐厅"在Instagram上走红,数千粉丝被其展示的无皮披萨球和尘螨面包等奇异菜品吸引。然而,Ethos只存在于虚拟世界——它是一个完全由AI生成内容的