Agent-as-a-Judge:用AI智能体来评估AI智能体的工作 节省97% 的时间 164 0 在当前人工智能的迅猛发展中,评估智能代理的能力成为了一个重要课题。为此,Agent-as-a-Judge(代理法官)项目应运而生,它不仅是一个技术库,更是一种全新的评估理念。该项目旨在通过智能代理对其他代理的工作进行评判,以生成高质量的数据集,并推动跨领域的研究。Agent-as-a-Judge 的核心优势在于自动评估和提供奖励信号。通过智能代理对任务的实时评估,系统能够节省高达97.72% 的时
华为FlashComm技术助力大模型推理提速80% 164 0 在全球人工智能发展的浪潮中,模型推理的速度和效率愈发成为焦点。近期,华为的数学团队在 DeepSeek 开源周期间推出了名为 FlashComm 的新技术,旨在通过三项创新措施,大幅提升大模型推理的性能,最高可达80% 的速度提升。首先,FlashComm 技术重点优化了 AllReduce 通信操作。传统的 AllReduce 方法就像一辆装满货物的集装箱车,不够灵活。华为团队通过智能化手段,将
o3模型 OpenAI Django AI图像识别 AI新功能震惊网友:轻松破解照片拍摄位置 164 0 近日,OpenAI 推出的 o3模型因其能够精准猜测照片拍摄位置而引发广泛关注。这一功能由 Django Web 框架的创始人 Simon Wilson 首次测试,他在自己的博客中详细记录了 o3的推理过程,称这一体验既超现实又令人不安。Wilson 随意拍了一张看似平常的照片,包含了些许道路和房屋,却没有明显的标志性建筑。在将这张照片上传至 o3后,模型开始进行复杂的分析。o3的分析过程令人叹为
微软推出 Microsoft 365 Copilot Tuning,企业可用自己的数据训练 AI 模型 164 0 IT之家 5 月 20 日消息,在 2025 年微软 Build 大会上,微软宣布推出 Microsoft 365 Copilot Tuning,这是一种让企业能够利用其公司数据来训练模型的新方式,通过 Microsoft 365 Copilot Tuning,企业可以利用自身的公司数据对模型进行微调,使其在特定领域的任务表现更加出色。使用 Microsoft 365 Copilot Tunin
KEEP颠覆视频人脸超分辨率!全新SOTA模型融合卡尔曼滤波,细节与时序一致性完美突破! 164 0 Hugging Face社区发布了一项突破性技术——KEEP(Kalman-inspired Feature Propagation),一款专为视频人脸超分辨率设计的新模型,被誉为该领域的全新SOTA(State-of-the-Art)。通过创新的卡尔曼滤波灵感架构和跨帧注意力机制,KEEP在恢复人脸细节和保持时序一致性方面实现了显著突破,超越传统方法。AIbase综合最新动态,深入解析KEEP的
人工智能天气模型 AI预测 洪水预测 风力发电机 AI 天气模型助力社区级精准预测,保险行业积极参与 164 0 近年来,天气预报行业在准确性方面取得了显著进展,但在局部天气预测方面依然面临挑战。随着人工智能天气模型的迅速发展,许多小型商业公司开始具备快速进行专业化天气预测的能力。这些预测不仅可以告诉你某个邻里何时会下雨,还能准确预报风速,以便更好地调整风力发电机的运行。传统上,公共气象机构依赖大型超级计算机来处理复杂的物理方程,从而提供全球天气预报。然而,随着气候变化使得极端天气事件的发生频率增加,对更加细
Trae ModelContextProtocol(MCP) AI集成开发环境 AI开发平台 Trae v1.3.0重磅更新,新增MCP与.rules支持引领AI开发新体验 164 0 字节跳动旗下AI驱动的集成开发环境(IDE)Trae正式发布v1.3.0版本,新增Model Context Protocol(MCP)支持、.rules规则设置、联网搜索等多项功能,显著提升了开发者的生产力与灵活性。据AIbase了解,此次更新标志着Trae从一款智能代码编辑器向全面AI开发平台的转型,受到全球开发者社区的热烈关注。项目详情已在GitHub与Trae官网同步公开,为开源生态注入了
Colossus2 xAI 埃隆・马斯克 超级计算机 马斯克的 x 计划筹 250 亿美元开发 Colossus 2 超级计算机 164 0 近日,埃隆・马斯克创办的人工智能公司 xAI 在扩大其现有 Colossus 超级计算机的基础上,宣布将启动一个雄心勃勃的新项目。据报道,xAI 计划在即将进行的融资中筹集高达250亿美元,以支持其下一个超级计算机 Colossus2的开发。图源备注:图片由AI生成,图片授权服务商Midjourney在与现有投资者的电话会议中,马斯克表示,公司将进行合理的估值,这一表态被市场解读为即将进行新一轮融
AI自动化 社交媒体营销 推特增长 内容生产策略 用AI半年涨粉50万,Make工作流这样批量出爆款! 164 0 声明:本文来自于微信公众号 见实,作者:见实,授权站长之家转载发布。半年涨粉50万,难吗?某种程度上,几乎是不可能完成的任务。但AI可以。“这是我们行业内众所周知的典型案例,它是一个专门用于自动发推验证的推特账号。从去年11月创建到现在,仅用了快半年时间就拥有了50万关注者。”也就是说,通过搭建make工作流(一种AI自动化工作流软件),可以实现自动化更新:从最开始的信息采集,文件格式化,到入
我国首个公共采购知识体系模型“水母模型”发布 164 0 IT之家 3 月 31 日消息,2025 年 3 月 29 日,中国物流与采购联合会在京发布了中国首个公共采购知识体系模型 ——“水母模型”。据介绍,该模型以“PROCURE”为框架,系统、全面地阐述了公共采购的理论、方法、工具、实践和发展趋势,将服务于政府部门、事业单位、公共组织、中央企业、国有企业的人才培养,可帮助采购机构建立专业化、规范化、高效化和智能化的采购管理体系。PROCURE 体系
AI反欺诈 抖音 AI风控 黑产治理 AI治理能力提升!抖音一季度封禁黑产账号260万个 164 0 抖音发布《2025第一季度黑产治理数据报告》,显示其在打击黑色产业链方面取得显著成效。报告显示,抖音在第一季度封禁了260万个涉及水军、欺诈和违规导流的黑产账号,并将涉嫌违法犯罪的线索上报给有关部门。抖音通过构建以 AI 为核心的治理体系,显著提升了在黑产违规场景的巡检、预警、研判等环节的效率。在水军治理方面,抖音利用 AI 能力搭建智能机器人工具,实现了风险发现、预警、巡检、研判和回扫等环节的自
AI导航智能体 NaviAgent TrafficVLM AmapVoice 高德发布全球首个地图领域AI导航智能体 已陆续向用户推送 164 0 高德地图宣布推出全球首个基于地图的 AI 导航智能体(NaviAgent),这一创新成果标志着导航服务从传统的出行工具向具有思考、预判和温度的智能出行伙伴转变。该智能体采用“思考 - 预判 - 行动”的全链路智能模式,通过感知、规划、执行和表达四大模块构建智能闭环,集成 TrafficVLM 交通感知模型和 AmapVoice 情感语音技术等多项核心技术,实现了从“工具思维”到“伙伴思维”的转换。
谷歌DeepMind:大模型明知到最优解,但还是故意绕了一圈 164 0 现在的大模型(LLMs)已经非常智能。写文章、编代码、当医生、当老师,样样精通。于是乎,有人就想了:既然它们这么聪明,能不能让它们自己做决定,当个“智能体”呢?比如,在复杂的环境里自己探索、自己解决问题。毕竟,大家觉得LLMs肚子里有“世界知识”,不需要手把手教也能猜到怎么干。而且,它们还有“思维链”(Chain-of-Thought,CoT)这种“聪明脑回路”,能一步一步推理,更好地理解环境和自
傅利叶发布首款开源人形机器人 Fourier N1:高 1.3m + 重 38kg + 续航 2 小时 164 0 感谢IT之家网友 西窗旧事 的线索投递!IT之家 4 月 11 日消息,通用机器人公司傅利叶今日正式发布首款开源人形机器人 Fourier N1,并同步开放涵盖物料清单、设计图纸、装配指南、基础操作软件在内的完整本体资源包。官方表示,作为傅利叶“Nexus 开源生态矩阵”的首个落地项目(“N1”即“Nexus-01”),N1 将为全球机器人和具身智能开发者提供一个开放创新的技术基座,加速高泛用
GPT-4o Reve Image 图像生成 比GPT-4o更强?三位Adobe老将出走,做出了超强文生图模型丨AI新榜评测 164 0 声明:本文来自于微信公众号 AI新榜,作者:王萌,授权站长之家转载发布。GPT-4o,被击败了?最近大伙都被GPT-4o生成的各种“整活”图像刷屏了吧,各种动漫油画风格改图、经典影视复现、漫画设计改图……新的玩法每天都在涌现,大有“AI一日,人间一年”之势。甚至OpenAI CEO Sam Altman都累了:“收手吧,我们需要休息!”但就在GPT-4o火遍全球之际,一个来自初创团队的新模型R
# AI工具 # AI项目和框架 文心大模型4.5 Turbo – 百度推出的最新多模态大模型 164 0 文心大模型4.5 Turbo是什么文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型。基于文心大模型4.5的基础上进行优化,具备多模态、强推理能力,能处理文本、图像等多种输入形式。相比文心大模型4.5,文心大模型4.5 Turbo的速度更快,成本大幅降低,价格下降80%,让开发者用更低的成本使用高性能AI模型,推动更多AI应用的开发和落地,适用于内容创作、智能客服、多模态交互等