64页论文揭示AI模型排行榜黑幕:Llama4发布前私下测试27个版本,只取最佳成绩 210 0 近日,一篇名为《排行榜幻觉》的论文在学术界引发了广泛关注,尤其是对大型语言模型(LLM)领域中备受推崇的 Chatbot Arena 排行榜提出了严厉质疑。研究指出,排行榜的可信度因数据访问不平等、模型私下测试等问题而受到挑战。论文显示,一些大型科技公司可以在公开发布之前对多个模型版本进行私下测试。例如,Meta 在发布 Llama4之前测试了多达27个版本,然后只对外公布表现最佳的模型。这种 “
石头 P20 扫拖机器人 5 月 13 日上市,支持机械臂自适应调节 210 0 IT之家 5 月 11 日消息,石头科技官宣,P20 自清洁扫拖机器人将于 5 月 13 日上市,支持机械臂自适应调节、98.8% 沿边覆盖率。目前尚不清楚这款新品的具体价格以及参数信息。作为参考,去年 8 月发布的石头 P20 Pro 扫拖机器人,售价 3999 元起,可选水箱版和上下水版。IT之家注意到,石头 P20 Pro 具备 18500Pa 吸力,配备“无界智能底盘”,底盘支持升降功能
微信AI助手 腾讯元宝 聊天机器人 智能互动 微信首个AI助手元宝上线:支持分析公众号文章、文件、图片 210 0 快科技4月17日消息,日前,微信首个AI助手元宝上线,用户可在微信搜索元宝”,添加好友后可进行对话。与元宝AI助手对话无需下载或跳转其他App、小程序,而是以好友的形式出现在通讯录,聊天时甚至还会显示对方正在输入...”,就像与真实好友对话一样。据介绍,元宝AI是腾讯元宝App入驻微信的AI助手,搭载混元和DeepSeek双模引擎,无缝衔接微信生态。元宝AI可一键解析公众账号介绍号文章和任何图
o3 o4-mini AI图像理解 OpenAI OpenAI 发布全新人工智能模型,实现 “图像思考” 能力 210 0 OpenAI 最近推出了其最新的人工智能模型,名为 o3。这款模型标志着 AI 在理解和分析图像方面的一次重大进步,尤其是在处理低质量草图和图表方面。与此同时,OpenAI 还发布了一个较小的版本 o4-mini,进一步丰富了其产品线。o3模型的核心功能在于能够 “用图像思考”,这意味着用户可以上传各种图像,如白板草图和复杂的图表,让 AI 进行深入分析和讨论。这一进展使得 AI 不仅仅停留在文本
苹果 Apple Watch 健康与安全功能深度解析:它能够守护生命的每一刻 211 0 4 月 30 日,苹果中国官方发布了两条视频广告,视频中两位真实的用户作为主角,亲自讲述了打动人心的真实故事,向大众呈现 Apple Watch 能够守护安全的功能和拯救生命的能力。两位主角分别是刚刚退休的白红和即将上大学的李浩铭。年龄和背景截然不同的他们有一个共同点:都曾被 Apple Watch 在关键时刻帮了一把,得以继续享受他们精彩的人生。2023 年 1 月 3 日,家住成都的白红妈妈
软件供应链安全 JFrog 机器学习(ML)模型 AI安全 AI 时代软件供应链面临重大安全危机:机密泄露激增64% 211 0 近日,JFrog 公司发布了《2025年软件供应链现状报告》,揭示了在人工智能(AI)迅速发展的背景下,软件供应链所面临的严峻安全挑战。根据该报告,研究团队通过对1400多名专业人士的调研,以及来自7000多家客户的数据分析,勾勒出了一幅令人为之担忧的安全图景。报告指出,过去一年中,软件供应链的安全漏洞急剧增加,其中 “秘密” 或机密信息的曝光案例同比增长了64%,总计达到了惊人的25,229例。
NovaSonic AI语音模型 亚马逊Bedrock 双向流式API 亚马逊推出革命性 AI 语音模型 Nova Sonic,价格更具竞争力! 211 0 亚马逊近日发布了其最新的 AI 语音模型 ——Nova Sonic,这一新技术标志着该公司在人工智能语音领域的重要进展。Nova Sonic 能够快速处理语音输入并生成自然流畅的语音输出,其在速度、识别准确性以及对话质量等方面已达到了与 OpenAI 和谷歌等行业领军企业的顶尖水平。与其他 AI 语音模型相比,Nova Sonic 在性价比方面表现突出,价格竟然比 OpenAI 的 GPT-4o
Google将Gemini智能助手引入Android Auto,提升驾车体验 211 0 在最近的 AndroidShow 活动上,Google 宣布将在未来几个月内将其生成式人工智能助手 Gemini 整合进所有支持 Android Auto 的汽车中。公司高层表示,这一创新将显著提升驾驶的效率与乐趣。Android for Cars 的副总裁帕特里克・布雷迪在与媒体的虚拟会议中指出,Gemini 的引入将是车载体验历史上最重大的变革之一。Gemini 的功能将体现在两个主要方面:首
AI投资 人形机器人 朱啸虎 中关村论坛 朱啸虎:AI创业公司要勇于承认自己没有壁垒 211 0 声明:本文来自于微信公众号 凤凰网科技,作者:董雨晴,授权站长之家转载发布。3月31日,在中关村论坛现场,朱啸虎一身休闲装现身,谈了谈他对当下AI投资的理解。尽管是在给人形机器人泼冷水的风波之后,朱啸虎本人依旧表现的很淡定,在参加论坛之前,他还去了趟颐和园。在本次发言中,他没有正式回应近两日“批量退出人形机器人”的争议。而是重点谈及当下正是投资AI应用的好时机,“我们可以看到很多做 AI 应用
高效预训练长度缩放技术 PHD-Transformer 大语言模型(LLM) 字节跳动 字节跳动发布高效预训练长度缩放技术,突破长序列训练瓶颈 211 0 字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解,该技术在保持推理效率的同时,支持高达2048K(2M)的上下文长度训练,解决了传统框
MCP会成为Agentic AI的标准吗? 211 0 代理会自动执行一系列以前由人类处理的任务。但是,我们将如何把所有这些代理与数据连接起来,并与人工智能工具协调呢?这就是 Anthropic 几个月前发布的名为 “模型上下文协议”(MCP)的新协议的作用。Anthropic 于去年秋天推出了 MCP,目标是提供一个开放标准,用于将大型语言模型(LLM)驱动的人工智能代理与执行任务所需的数据和工具连接起来。这家人工智能公司在11月25日发布的一
Llama4 Llama4Maverick Llama4Scout Meta Meta高管回应Llama 4训练作弊传言:坚决否认不实指控 211 0 在近日的社交媒体上,Meta 公司的高层对关于其新 AI 模型 Llama4的 “不当训练” 指控进行了澄清,称这些说法完全不属实。指控声称 Meta 在其新推出的 Llama4Maverick 和 Llama4Scout 模型上,通过在特定基准测试的 “测试集” 上进行训练,以此来人为提高模型的性能表现。Meta 的生成式人工智能副总裁艾哈迈德・阿尔・达赫勒(Ahmad Al-Dahle)在社交
AI日报 音频技术 开源模型 语音识别 AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源图像编辑模型Step1X-Edit;夸克AI超级框上线 “拍照问夸克” 212 0 欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Moonshot AI发布Kimi-Audio:开源音频基础模型树立新标杆Moonshot AI最近推出的Kimi-Audio是一款开源音频基础模型,旨在推动音频理解、生成和
AI个人设备 OpenAI JonyIve ioProducts OpenAI 考虑收购 Jony Ive 设计的 AI 设备初创公司io Products 212 0 最近,有消息称 OpenAI 正在讨论收购一家名为 io Products 的初创公司,该公司由前苹果设计师 Jony Ive 的工作室与 OpenAI 首席执行官 Sam Altman 合作开发。io Products 专注于研发一款基于人工智能的个人设备,这款设备将可能改变用户与技术的互动方式。据《theinformation》报道,这项收购讨论是在 OpenAI 内部高层之间进行的,如果交易
京东 母亲节 AI写诗 定制化服务 京东Ai给妈妈写诗 京东推出AI写诗功能 212 0 站长之家(ChinaZ.com)5月7日 消息:随着5月11日母亲节临近,电商平台京东近日推出AI写诗功能,为用户提供定制化藏头诗服务。用户可通过京东APP搜索“AI写诗”,输入母亲姓名后生成专属诗句,将祝福融入传统诗词形式,为节日增添仪式感。据平台介绍,该功能依托自然语言处理技术,可根据用户输入的姓名自动匹配押韵词汇,生成四句藏头诗。例如,输入“李芳”可生成“李花香溢满庭芳,芳华岁月伴儿长”
广东:人工智能和机器人单个外资项目最高奖励 1.5 亿元 212 0 IT之家 4 月 1 日消息,广东省有关部门于 3 月 9 日印发《广东省推动人工智能与机器人产业创新发展若干政策措施》,并于今天(4 月 1 日)举办相应《措施》新闻发布会,主要提出一系列政策,激励广东省内人工智能与机器人公司发展。IT之家从新闻发布会中获悉,广东省有关部门将设立标杆激励机制。计划进一步加大对标杆应用的扶持力度,例如在工业领域每年遴选 10 个人工智能赋能新型工业化标杆案例,对