OpenAI o3 模型基准测试成绩遭质疑,实测分数远不及宣称 178 0 IT之家 4 月 21 日消息,OpenAI 的 o3 人工智能模型的第一方与第三方基准测试结果存在显著差异,引发了外界对其公司透明度和模型测试实践的质疑。去年 12 月,OpenAI 首次发布 o3 模型时宣称,该模型能够在 FrontierMath 这一极具挑战性的数学问题集上正确回答超过四分之一的问题。这一成绩远远超过了竞争对手 —— 排名第二的模型仅能正确回答约 2% 的 Frontie
教育部划清AI使用边界:小学到高中分阶段引导,禁止复制AI答案 178 0 教育部于5月12日正式发布《中小学人工智能通识教育指南(2025年版)》和《中小学生成式人工智能使用指南(2025年版)》(简称《使用指南》),旨在科学规范推进人工智能全学段教育。《使用指南》明确规定,禁止学生直接复制人工智能生成内容作为作业或考试答案,并限制在创造性任务中滥用人工智能。此举意在从源头上杜绝"代劳式"使用行为,防止学生过度依赖AI而弱化独立思考能力。图源备注:图片由AI生成,图片授
法律AI独角兽Harvey拥抱Anthropic与谷歌模型,打破OpenAI独家依赖 178 0 备受瞩目的法律人工智能工具 Harvey 近日宣布战略调整,未来将整合 Anthropic 和谷歌的领先基础模型,结束了此前完全依赖 OpenAI 技术的局面。值得注意的是,Harvey 曾是 OpenAI 初创基金的明星投资项目之一,该基金旨在扶持基于 AI 技术(特别是 OpenAI 自研技术)的公司。尽管 Harvey 强调不会放弃 OpenAI,只是增加了更多模型和云服务选项,但此举无疑对
AIGC作品监管 内容创作限制 人工智能内容标识 社交平台封禁 互联网平台现状:鼓励AI,限制AI 178 0 声明:本文来自于微信公众号新莓daybreak,作者:何聆筝,授权站长之家转载发布。一场针对AIGC作品的限制,正规模化地席卷各个平台。一些AIGC创作者在小红书拉起群组,分享自己被限制的经历。有人发布12星座内容被判定「传播封建迷信」,有人因为生成AI明星而遇到「侵权」提示。「虚构事件」和「假冒真人」是最常被引用的处罚理由。同样的情况也发生在视频号和抖音,大量AIGC作品遭遇下架和封禁。作品
人工智能医疗记录审核 Brellium A轮融资 临床质量管理 初创公司 Brellium 获 1670 万美元融资,助力医疗记录审核的智能化升级 178 0 初创公司 Brellium 近日宣布获得1670万美元的 A 轮融资,资金将用于扩大其基于人工智能的医疗记录审核解决方案。这一技术旨在帮助医疗机构自动化临床质量管理和保险合规,从而提升医疗服务的效率与准确性。Brellium 的联合创始人扎克・罗森(Zach Rosen)在一次个人经历中深刻感受到医疗文档的疏漏可能对患者造成的严重影响。多年前,他因医疗误诊而经历了长达两年的挫折,频繁奔波于各类专家
马斯克 Grok 3.5 AI大模型 全球第一个会原创的AI来了!马斯克:Grok 3.5将提供互联网上根本不存在的答案 178 0 快科技4月30日消息,马斯克把他的第一性原理,也带到了AI大模型上。随着Grok 3的使用和下载量飙升10倍,马斯克宣布,下周,Grok 3.5的早期测试版本将面向SuperGrok订阅者发布。他还透露,这将是第一个可以准确回答有关火箭发动机或电化学技术问题的AI。Grok从第一性原理进行推理,并提出互联网上根本不存在的答案。”马斯克说。换而言之,如果Grok 3.5真的像马斯克所说,那么它将
Gemini2.5 编码模型 I/O版 应用开发 谷歌突发大招刷爆AI编程榜,网友:不用买Cursor了 178 0 声明:本文来自微信公众号“量子位”,作者:白交,授权站长之家转载发布。因为大家太过热情, Gemini2.5提前重磅更新——史上最强编码模型Gemini2.5Pro Preview的I/O版。只需一张手绘的草图,就可以构建一个「绘图变音频」的网页版应用。其他游戏、对象模拟等等也都可以通过一句提示完全搞定。它在所有LMArena排行榜上均超越Claude位列第一,包括所有文本领域、视觉以及Web
大厂混战AI笔记:快手“喵记多”能否复制Notion增长神话? 178 0 快手近日推出了一款名为“喵记多”的全新App,正式进军AI辅助的笔记工具市场。该产品由快手旗下的轻雀科技开发,核心亮点在于集成了一个名为“喵仔”的智能助手,用户可以通过聊天交互的方式完成笔记管理和待办提醒。据悉,“喵记多”的主要功能包括笔记剪藏、内容整理和记忆搜索。用户可以将零散的文字、图片、文件等发送给喵仔,并通过长按消息选择“喵记一下”将其转化为笔记,方便后续编辑和管理。直接向喵仔发送“记笔记
o3 o4-mini 推理模型 多模态处理 OpenAI 推出全新推理模型 o3,实现图像思考能力 178 0 OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。这次发布的 o3和 o4-mini 模型在多模态处理上表现出色,具备了图像处理、网页搜索和代码执行等功能。
YouTube 试水AI生成亮点视频,用户体验能否提升? 179 0 谷歌近日宣布将其 AI 概述功能扩展至 YouTube,推出算法生成的视频亮点和搜索建议。这项实验性工具目前只向美国的少量 YouTube Premium 用户开放,旨在帮助用户快速找到与购物和旅游相关的视频内容,而无需观看整段视频。在视频内容越来越丰富的今天,如何高效地发现所需信息变得尤为重要。谷歌表示,AI 生成的结果会自动识别并呈现最相关的片段,意在简化内容的发现过程。然而,这项新功能的推出
谷歌推出iPad专属Gemini应用,赋能多任务处理新体验 179 0 近日,谷歌正式发布了一款专为iPadOS设计的全新应用 ——Gemini。这款应用的推出旨在提升用户在多任务处理和创作方面的效率,充分利用了 iPad 的大屏幕优势。Gemini 支持分屏功能,让用户能够在同一界面上同时进行多个任务,极大地方便了用户的日常使用。Gemini 应用的功能十分强大,涵盖了多语言对话、快速报告生成、音频概述扩展以及图像和视频创作等多项实用功能。例如,用户可以通过多语言对
OpenAI ChatGPT 搜索优化 网购 刚刚,OpenAI大更新ChatGPT搜索,周搜索量10亿次 179 0 声明:本文来自于微信公众号AIGC开放社区,授权站长之家转载发布。今天凌晨4点,OpenAI对ChatGPT搜索进行了大更新,对网购搜索进行了大幅度优化。现在,搜索的产品可以直接显示详情、价格以及用户评价,并且可以直接跳转到购买链接,例如,你想购买一个新的平板电脑,可以在ChatGPT完成所有参数比对,并跳转到亚马逊购买。值得一提的是,ChatGPT搜索已经成为OpenAI最重要功能之一,仅过
AI搜索引擎 Netflix OpenAI 自然语言搜索 Netflix 推出全新 AI 搜索引擎,由OpenAI提供支持 179 0 Netflix 最近向部分订阅用户推出了一项全新的 AI 搜索引擎工具,这一消息来自于《彭博社》的报道。这项由 OpenAI 支持的 AI 搜索引擎,突破了传统的搜索方式,用户再仅仅通过电影、电视剧的标题、类型或演员来查找内容。现在,用户还可以通过多种其他搜索查询,如心情等,来寻找适合自己的影视作品。由于这一工具是由 OpenAI 提供技术支持,用户可以预计将使用自然语言进行搜索,提升了搜索的灵活
逆天改命!Flow-GRPO 让图像生成模型秒变 “大神” 179 0 家人们,今天必须给你们唠唠科研界的一项超酷新成果 ——Flow-GRPO!这东西可不得了,它就像是给图像生成模型打了一针 “超级进化剂”,直接让它们从 “青铜” 一路飙升到 “王者”。想知道它是怎么做到的吗?快搬好小板凳,听我细细道来!图像生成模型的 “成长烦恼”现在的图像生成模型,比如基于流匹配(Flow matching)的那些,理论基础那叫一个扎实,生成的高质量图像也让人眼前一亮。但它们也有
OpenAI 上线 Flex 处理模式:API 费用减半,但牺牲响应速度及稳定性 179 0 IT之家 4 月 18 日消息,据外媒 TechCrunch 今日报道,为在与谷歌等生成式 AI 竞争对手的较量中进一步加大投入,OpenAI 宣布推出“Flex 处理模式”新的 API 服务 —— 用户以接受响应速度变慢和“资源偶尔无法分配”为代价,换取更优惠的模型使用价格。OpenAI 表示,Flex 处理目前已对新近发布的 o3 和 o4-mini 推理模型开放测试,主要面向模型评估、数据
音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom 179 0 腾讯开源的一致性视频生成工具 “HunyuanCustom”,该模型不仅能生成生动的视频内容,还能实现音频与口型的同步。这一创新技术的发布,标志着在深度伪造视频领域的一次重要进步。 一图生成,深度伪造不再遥远HunyuanCustom 的最大亮点在于用户只需提供一张图像,就能创造出深度伪造风格的视频。这一功能可以简化视频制作流程,用户不再需要多张图片作为参考,极大地提升了视频内容生成的便利性。Hu