OpenAI 再掀 AI 浪潮:GPT-4.1 被曝下周登场,满血版 o3 与 o4 mini 蓄势待发 116 0 感谢IT之家网友 华南吴彦祖、往事2016、咩咩洋 的线索投递!IT之家 4 月 11 日消息,科技媒体 The Verge 昨日(4 月 10 日)发布博文,报道称 OpenAI 公司计划下周发布 GPT-4.1 系列、o3 系列在内的多款 AI 模型。GPT-4.1 模型是去年 GPT-4o 模型的升级版,是一款多模态模型。GPT-4o 支持实时处理音频、视觉和文本,而 GPT-4.1 将
腾讯混元 3D 生成模型升级 2.5 版本:建模精细度提升,免费生成额度翻倍 116 0 感谢IT之家网友 Autumn_Dream 的线索投递!IT之家 4 月 23 日消息,腾讯今日宣布,混元 3D 生成模型全新升级,v2.5 新版本在建模精细度上大幅提升。混元 3D AI 创作引擎全面更新至 v2.5 模型底座,同时免费生成额度翻倍,提升至每天 20 次。混元 3D 生成 API 也已上线腾讯云,面向企业和开发者开放。相比前代,混元 3D v2.5 模型架构全面升级,总参数量
AI应用 周鸿祎 专业建议 智能体 周鸿祎:AI提建议比张雪峰强 免费AI让人都拥有“私人专家” 116 0 快科技5月18日消息,周鸿祎近日在《百大AI应用》系列视频播客节目中称:当前AI提建议的专业程度不低于张雪峰。”周鸿祎表示:张雪峰最有名的就是给人提各种专业的建议,我现在觉得AI的智能体干这个事,肯定不比张雪峰差。”随后周鸿祎又笑称对不起,得罪我们雪峰大哥了。”周鸿祎解释道,过去老百姓雇不起人也花不起钱,但今天有了免费AI,让专业的建议从奢侈品变为了普惠工具。AI不仅运用在学习、科研、办公、金
ComfyUI品牌焕新升级,推出原生API节点 116 0 ComfyUI于2025年5月6日宣布完成品牌升级,同步推出原生API节点功能。这一更新不仅为ComfyUI带来了全新的视觉标识,还通过集成11个主流在线视觉AI模型、65个新节点,显著提升了其图像和视频生成能力。据官方介绍,用户无需自行申请API密钥,仅需在ComfyUI平台登录即可无缝调用包括Flux.1、Veo2、GPT-Image-1等在内的先进模型。原生API节点:一站式接入主流模型Co
刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦 116 0 声明:本文来自于微信公众号AIGC开放社区,授权站长之家转载发布。今天凌晨1点30,OpenAI发布了全新图像模型GPT-image-1,已经通过API向全球开发者开放使用。GPT-image-1与ChatGPT版本有很大不同,可以控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量、压缩质量等,并且支持全网爆火的吉卜力模式。目前,Adobe、Figma、HeyGen、Wix等知名企业已经
OpenAI 图像生成 GPT-image-1 API应用 微软上线GPT-image-1模型 通过API向开发者开放使用 116 0 4月24日凌晨,OpenAI正式推出了其全新图像生成模型GPT-image-1,并通过API向全球开发者开放使用。这一模型的发布标志着图像生成技术的又一次飞跃,为开发者带来了更多可能性。GPT-image-1与OpenAI此前的ChatGPT版本有很大不同,它不仅能够生成高质量的图像,还支持多种高级定制功能。开发者可以通过API控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量和压缩质量
SWE-PolyBench AI编程助手 大规模语言模型(LLM) AWSAILabs AWS 发布 SWE-PolyBench:评估 AI 编程助手的新开源基准 117 0 近日,AWS AI Labs 推出了 SWE-PolyBench,这是一个多语言的开源基准,旨在为 AI 编程助手的评估提供一个更全面的框架。随着大规模语言模型(LLM)的进步,AI 编程助手的开发已经取得了显著的进展,这些助手能够生成、修改和理解软件代码。然而,目前的评估方法仍然存在诸多局限,许多基准测试往往仅集中在 Python 等单一语言,无法全面反映真实代码库的结构和语义多样性。SWE-P
VibeDraw AI绘图 3D建模 儿童教育 Vibe Draw:将孩子的随手涂鸦一键转3D世界 117 0 近日,一款名为Vibe Draw的人工智能工具在社交媒体上引发热议,因其能够将简单的草图转化为可交互的3D模型,尤其被认为在儿童教育领域具有广阔的应用前景。这款工具以其直观的操作和强大的生成能力,让孩子们随手绘制的图画瞬间变成栩栩如生的3D世界,为教育工作者和家长提供了一种创新的教学与互动方式。Vibe Draw的核心功能在于其“从草图到3D”的快速转换能力。孩子们只需在工具的自由画布上勾勒出简单
AI内容 Quartz Midjourney 媒体行业 AI成媒体“毒药”?Quartz步后尘,低质内容致品牌陨落、编辑遭清洗 117 0 曾经备受尊敬的商业出版物Quartz,在经历了一段令人困惑且充斥低质量人工智能内容的时期后,最终被廉价出售,其编辑团队几乎全军覆没。这再次敲响了警钟,警示媒体行业盲目拥抱劣质AI可能带来的毁灭性后果。Quartz由其联合创始人扎克·西沃德(现任《纽约时报》AI计划负责人)在博客中回顾,自2012年以来已数次易手。上周,它再次被转卖给加拿大软件公司Redbrick,收购方同时还购入了商业网站The
OpenAI GPT-4 人工智能 科技革命 OpenAI CEO奥特曼发文:永别了 GPT—4! 117 0 快科技5月1日消息,当地时间5月1日上午10:23,OpenAI创始人奥特曼发文向GPT-4告别:再见了,GPT-4。你掀起了一场革命。我们将自豪地将你的重量保存在一个特殊的硬盘中,以便将来送给一些历史学家。”据报道,OpenAI此前宣布,自2025年4月30日起,GPT-4将从CHATGPT中退役,由GPT-4o完全替代 ,不过GPT-4仍将在API中提供。OpenAI表示,在面对面的评估中
还在玩普通VR?HoloTime让你一键穿越到4D全景世界! 117 0 最近,在 VR 和 AR 技术领域,一项新研究成果引发了广泛关注,它就是 HoloTime。这一创新框架致力于解决当前4D 内容生成的难题,有望重塑我们在虚拟世界中的交互体验。今天,AIbase就来深入探究一下,HoloTime 究竟有什么神奇之处。为啥我们需要 HoloTime?现在的 VR 和 AR 技术越来越火啦,大家都想在虚拟世界里获得更逼真、更自由的体验。就像玩游戏的时候,要是能真的 “
Meta AI 聊天机器人被指与未成年聊不当话题,官方回应称概率极低 117 0 IT之家 4 月 28 日消息,据《华尔街日报》报道,Meta 公司旗下的聊天机器人,包括在 Facebook 和 Instagram 等平台上运行的人工智能聊天机器人,可能会与未成年用户进行涉及性内容的对话。据IT之家了解,《华尔街日报》花费数月时间与 Meta 官方聊天机器人以及平台上用户创建的聊天机器人进行了数百次对话测试。在其中一次对话中,使用演员兼摔跤手约翰・塞纳(John Cena)
高通(Qualcomm) 生成式AI MovianAI AI芯片 高通收购VinAI的生成AI部门,拓展生成式人工智能能力 117 0 美国芯片制造商高通(Qualcomm)近日宣布,已成功收购越南公司 VinAI 的生成 AI 部门 MovianAI。这次收购不仅是高通在人工智能(AI)领域的重要布局,也标志着其与越南技术生态系统之间更加紧密的合作关系。VinAI 在生成 AI、机器学习、计算机视觉和自然语言处理等领域拥有卓越的研究和开发(R&D)能力,成为高通进一步推动 AI 创新的强大助力。高通公司表示,此次收购将结合 Vi
智谱(Z.ai) GLM模型 大模型 开源模型 智谱Z基金出资3亿支持全球开源社区 北京追加投资2亿元 117 0 北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2亿元人民币,支持智谱的开源模型研发与开源社区生态建设。智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。智谱在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累,商业化布局完善,拥有超过百万规模的开发者社区和企业用户。此次追加投资旨在进一步推动智谱在开源模型和算法创新方面的能力
初探谷歌 Gemini 视频解析功能,AI 准确识别视频拍摄场所 117 0 IT之家 4 月 22 日消息,科技媒体 Android Authority 今天(4 月 22 日)发布博文,报道称谷歌 Gemini 聊天机器人被发现新增视频分析功能。用户可上传视频并提出相关问题,Gemini 能够基于视频内容进行精准分析。该团队拆解了安卓版 Gemini 最新版(16.15.38.sa.arm64 beta)APK 文件,成功激活了视频上传与分析功能。用户可以上传视频并输
MoonshotAI Kimi-Audio 音频基础模型 多模态AI Moonshot AI发布Kimi-Audio:开源音频基础模型树立新标杆 117 0 近日,Moonshot AI正式宣布推出Kimi-Audio,一款全新的开源音频基础模型,旨在推动音频理解、生成和交互领域的技术进步。这一发布引发了全球AI社区的广泛关注,被认为是多模态AI发展的重要里程碑。以下是对Kimi-Audio核心特性、性能表现及行业影响的全面报道。突破性特性:全能音频处理能力Kimi-Audio-7B-Instruct基于Qwen2.5-7B架构,并结合Whisper技