UGMathBench动态基准测试数据集发布 可评估语言模型数学推理能力 168 0 近日,魔搭ModelScope社区宣布发布一项名为UGMathBench的动态基准测试数据集,旨在全面评估语言模型在本科数学广泛科目中的数学推理能力。这一数据集的问世,填补了当前在本科数学领域评估语言模型推理能力的空白,并为研究者提供了更为丰富和具有挑战性的测试平台。随着人工智能技术的飞速发展,自然语言模型在自动翻译、智能客服、医疗、金融等多个领域展现出巨大潜力。然而,如何准确评估这些模型的性能,
李开复:零一万物正基于 DeepSeek,打造 AI 2.0 时代的 Windows 168 0 3 月 30 日下午消息,在 2025 中关村论坛年会上,零一万物 CEO、创新工场董事长李开复表示,“大模型的推理成本正在以每年降低十倍的速度快速下降,这为 AI-First 应用爆发提供了非常重要的条件。”“两年前模型性能不够好的模型,现在已经够好了;两年前推理成本太贵的模型,现在已经是‘白菜价’了。”李开复认为,“AI-First 应用很快将井喷,2025 年将会是 AI-First 应用
Grok 3. 5 预计将于下周向SuperGrok订阅用户开放早期测试版 168 0 2025 年 4 月 29 日,AIbase报道——xAI旗下人工智能聊天机器人Grok即将迎来重大更新,其最新版本Grok 3. 5 预计将于下周向SuperGrok订阅用户开放早期测试版。这一消息引发了业界广泛关注,Grok 3. 5 被寄予厚望,有望在推理能力、技术问题解答及多模态功能上实现显著突破,进一步巩固xAI在全球AI竞赛中的领先地位。Grok 3.5:从第一性原理出发的推理突破据x
OpenAI 开源模型 推理模型 AI发展 OpenAI要Open了,奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户 168 0 声明:本文来自微信公众号“新智元”,作者:新智元,编辑:桃子 好困,授权站长之家转载发布。OpenAI终于要Open AI了!一大早,奥特曼郑重官宣,「未来几个月,将开源一款强大的推理模型」。这是自GPT-2以来,OpenAI首个开源的模型。目前,官方已放出模型反馈表,收集社区每位开发者的意见,期待打造出极其出色的开源模型。OpenAI开源模型预估可能会采用MIT、Apache2.0许可证奥特
人工智能医院 AI+医疗 清华大学 清华长庚医院 清华大学成立人工智能医院 迈向智慧医疗新篇章 168 0 清华大学正式成立人工智能医院,标志着该校在 “AI + 医疗” 领域迈出了重要一步。4月26日,清华大学举行了人工智能医院的揭牌仪式,并在医学院全体教职工大会上进行了相关介绍。校长李路明、副校长王宏伟等多位领导出席了此次仪式,共同见证了这一历史性时刻。清华大学人工智能医院(Tsinghua AI Agent Hospital)将分阶段建设,初期将依托北京清华长庚医院及其互联网医院进行试点。这一新医
一年狂发22个模型!阶跃星辰CEO姜大昕:AGI的秘密武器不是算力,而是让AI学会“自己教自己”! 167 0 在近期的媒体沟通会上,阶跃星辰的创始人兼 CEO 姜大昕分享了公司在多模态人工智能领域的最新进展以及未来的发展规划。阶跃星辰成立于2023年,致力于开发通用人工智能(AGI),目前已发布22款自研模型,其中16款为多模态模型,这一成就使其在行业内被称为 “多模态卷王”。姜大昕表示,公司将在未来几个月内推出一款新型推理模型 Step R1,并计划发布更先进的 Step 图片编辑模型。他强调,突破性技
Anthropic推出“Integrations”连接应用,Claude新增“高级研究”深挖信息 167 0 Anthropic周四发布重大更新,为旗下AI聊天机器人Claude引入全新的应用连接方式“Integrations”,并扩展了“深度研究”功能至“Advanced Research”,使Claude能够搜索网络、企业账户等更广泛的数据源。“Integrations”和“Advanced Research”目前面向Claude Max、Team和Enterprise计划用户开放Beta测试,Pro
小米米家智能嵌入式洗碗机 P20(18 套)开售:新升级消存一体,国补价 5119.2 元起 167 0 IT之家 4 月 14 日消息,小米米家智能嵌入式洗碗机 P20(18 套)现已在京东平台开售,新升级消存一体,售价 6499 元,国补价 5119.2 元起。IT之家从商品页面获悉,这款新品支持新一代 UHT 超高温灭菌技术,采用 135℃超高温,搭配专业双风道内循环系统,号称“实现真正免水洗的单消毒、单烘干”。无需进水,少量手洗餐具也能一键速干灭菌,可调节时长,当消毒柜使用。产品内部一次可容
美国版权局首次注册千余件 AI 增强作品,艺术创作新规将成焦点 167 0 随着人工智能技术的迅猛发展,艺术创作领域也悄然发生着变化。美国版权局最近透露,已成功注册超过1000件通过人工智能增强的作品。这一举措标志着版权法律在应对新兴科技方面的重要进展。在一篇最近的采访中,版权局助理总法律顾问贾莉斯・曼金(Jalyce Mangum)表示,艺术家在申请注册时,需按照指导原则披露和放弃 AI 生成的内容。曼金指出,版权局会评估 AI 在作品中是如何增强人类创作表达的,以及
Meta智能眼镜 Hypernova 雷朋Meta AI生成图片 Meta高端智能眼镜"Hypernova"曝光:内置屏幕,售价或达1400美元 167 0 据彭博社报道,Meta正在准备推出一款内置屏幕的雷朋Meta智能眼镜高端版本,最早可能于今年年底面世。这款代号为"Hypernova"的新眼镜将支持运行应用程序和显示照片,用户可通过手势和镜框两侧的电容式触摸进行控制。根据报道,Hypernova的屏幕仅会出现在右侧镜片的右下象限,用户向下看时观看效果最佳。设备启动后,主屏幕将水平排列显示图标,布局类似于Meta Quest虚拟现实设备的界面。图源
人形机器人 宇树科技 优必选 Optimus 人形机器人风口已至?2025年中国市场产值或超45亿元 167 0 根据TrendForce集邦咨询最新数据,中国市场已有11家主流人形机器人本体厂商启动2024年量产计划。其中,宇树科技、优必选、智元机器人、银河通用、众擎机器人、乐聚机器人等6家领先企业更是将2025年的量产规划设定在千台以上。图源备注:图片由AI生成,图片授权服务商MidjourneyTrendForce集邦咨询预测,2025年中国市场人形机器人本体产值有望突破45亿元人民币。与此同时,特斯拉
ChatbotArena AI基准测试 ArenaIntelligenceInc. 大型语言模型 AI 基准测试平台 Chatbot Arena 成立一家新公司 167 0 在 AI 行业快速发展的背景下,Chatbot Arena 这个众包 AI 基准测试项目正在扩展其影响力,正式成立了一家名为 Arena Intelligence Inc. 的新公司。根据彭博社的报道,Chatbot Arena 旨在通过这家新公司获取更多资源,从而显著改善其平台的功能和服务。Chatbot Arena 成立于2023年,主要由加州大学伯克利分校的研究人员主导。该平台为大型 AI
Blender-MCP ClaudeAI 3D建模 自然语言生成 Blender-MCP开源发布!Claude与Blender无缝集成 自然语言控制3D创作 167 0 近日,Blender-MCP(Model Context Protocol)正式开源发布,通过将Anthropic的Claude AI与Blender无缝集成,实现了通过自然语言提示词创建复杂3D场景的突破。据AIbase了解,该工具允许用户仅用文字描述即可生成精美3D模型,例如“低多边形龙守护宝藏”场景,极大地降低了3D建模的技术门槛。Blender-MCP现已在GitHub上线,引发了3D艺术
Meta 发布巨型 AI 化学数据集 OMol25及通用模型 UMA 167 0 Meta 近日重磅发布了其迄今为止规模最大的 AI 驱动化学开放数据集 OMol25,并同步推出了用于预测分子和材料化学性质的通用人工智能模型 UMA(Universal Atom Model)。这两项创新成果旨在加速药物研发、电池材料开发和催化剂研究等关键领域。据 Meta 介绍,OMol25数据集包含了超过1亿次高精度的分子计算数据,其规模远超此前任何公开的同类数据集。为了生成这一庞大的资源,
Freepik 发布“F Lite”:一个为版权安全而构建的开放 AI 图像模型 167 0 西班牙数字图形巨头 Freepik 近日推出了其最新的文本到图像生成模型“F Lite”,旨在成为 Midjourney 等因版权问题而备受争议的生成器的合法且安全的替代品。F Lite 拥有约100亿个参数,其独特之处在于完全基于 Freepik 自身商业授权的图像库进行训练。Freepik 声称,这使其成为首个完全依赖“工作安全”内容进行训练的如此规模的公开模型。这款模型是 Freepik 与
Windsurf 发布 Wave 9:SWE-1 系列模型开启软件工程新篇章 167 0 5月15日,Windsurf 宣布推出 Wave9更新,正式发布其首个人工智能模型系列 SWE-1,专为软件工程全流程优化设计。系列包括 SWE-1、SWE-1-lite 和 SWE-1-mini 三款模型,旨在提升软件开发效率,号称可加速高达99%。据 Windsurf 内部评估,SWE-1系列性能逼近业界领先的 Frontier 模型,与 Claude3.5Sonnet、GPT-4.1等模型