教育部等九部门:加快建设 AI 教育大模型,完善教育领域多模态语料库

IT之家 4 月 16 日消息,教育部等九部门今日发布《关于加快推进教育数字化的意见》。其中提到,加强人工智能等前瞻布局、加快建设人工智能教育大模型、完善教育领域多模态语料库,构建高质量自主可控数据集。强化算法安全评估,确保正确价值导向。布局一批前瞻性研究课题,有序开展人工智能应用试点,探索“人工智能 + 教育”应用场景新范式,推动大模型与教育教学深度融合。推动思政、科学教育、美育、心理健康等领

国内首个:上海虹口上线区域级教育智能体平台,老师半小时就能制作智能体

IT之家 5 月 21 日消息,IT之家从火山引擎公众号获悉,上海虹口教育携手火山引擎,依托 HiAgent 智能体开发平台,打造了国内首个区域级教育智能体应用生态系统 ——“虹口区教育智能体导航系统”(HEADS)。官方表示,该系统具备零基础低代码开发能力、多模型融合技术、完善的安全体系,全区教师已自主构建 177 个教育智能体,超 90% 智能体由一线教师通过低代码平台独立完成设计,100

谷歌DeepMind Genie 2亮相《60 Minutes》,革新3D交互环境生成技术

CBS著名栏目《60Minutes》深入报道了谷歌DeepMind人工智能研究实验室的最新突破,重点聚焦其全新AI模型——Genie2。据AIbase了解,Genie2能够从单一图像或简单文本描述生成高度逼真的3D交互式环境,为机器人训练、虚拟世界构建及通用人工智能(AGI)发展开辟了新路径。社交平台上的热烈讨论凸显了其技术革新性,相关细节已通过DeepMind官网(deepmind.google

密码管理公司1Password 推出新功能,助力 AI 代理安全管理企业凭证

随着人工智能(AI)逐渐接管传统上由人类负责的商业流程,许多 AI 代理将需要安全地登录多个系统,以完成它们的任务。为了解决企业在现代凭证管理中面临的挑战,知名密码管理公司1Password 宣布,已在其扩展访问管理平台(XAM)上新增了 AI 代理安全功能。图源备注:图片由AI生成,图片授权服务商Midjourney近年来,AI 技术的迅猛发展引发了人们对于未来就业市场的讨论。比尔・盖茨最近预测

谷歌Gemini推出新功能 “Circle Screen”,精准搜索更便捷

最新消息显示,谷歌正在开发一项名为 “Circle Screen” 的新功能,旨在提升用户在 Gemini AI 平台上的搜索体验。根据科技媒体 Android Authority 的报道,谷歌在 Instagram 上意外发布了一段视频,展示了 Gemini 的屏幕共享功能,并透露了这个尚未公开的新选项。“Circle Screen” 功能的最大亮点在于用户可以通过圈选屏幕的特定区域,来进行更为

英伟达发布Llama 3.1 Nemotron Ultra 253B:性能超群的技术新标杆

2025年4月8日,英伟达推出Llama3.1Nemotron Ultra253B,这一基于Llama-3.1-405B优化的开源模型以253亿参数超越Meta的Llama4Behemoth和Maverick,成为AI领域焦点。该模型在GPQA-Diamond、AIME2024/25及LiveCodeBench等测试中表现卓越,推理吞吐量达DeepSeek R1的四倍。通过优化训练和算法,英伟达证

Voila – 开源端到端语音大模型,实现低延迟语音对话

Voila是什么Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自然的交互体验。Voila 集成了语音和语言建模能力,支持数百万种预构建和自定义声音,用户可以通过文本指令或音频样本轻松定制说话者的特征和声音。 包含两个主要模型:Voila-e2e 用于端到端语音对话,Voila-autonom

昆仑万维开源Skywork-R1V 2.0版本 视觉与文本推理能力提升

4月24日,昆仑万维宣布正式开源其多模态推理模型Skywork-R1V2.0(以下简称R1V2.0)。这一升级版本在视觉与文本推理能力上均实现了显著提升,特别是在高考理科难题的深度推理和通用任务场景中表现出色,堪称当前最均衡兼顾视觉与文本推理能力的开源多模态模型。R1V2.0的开源,不仅是昆仑万维在多模态领域技术实力的体现,也为全球开发者和研究者提供了强大的工具,推动多模态生态建设。该模型在多个权

微软 Copilot 已支持 GPT-4o 图像生成技术,能力大提升

IT之家 5 月 19 日消息,微软近日为 Copilot AI 推送了最新更新,其中最重要的功能是加入了对 OpenAI 的 GPT-4o 图像生成技术的支持。IT之家曾报道,今年早些时候,OpenAI 推出了 GPT-4o 图像生成器,其强大的功能引发热议,尤其是生成的吉卜力风格(Ghibli)表情包在网上火爆一时。微软表示:“我们已将 Copilot 的图像生成功能升级至 4o 图像生成,

EasyControl_Ghibli模型上线:免费解锁吉卜力风格图像生成

近日,一款名为EasyControl_Ghibli的AI模型在Hugging Face平台悄然上线,为广大用户带来了一个令人振奋的消息:无需付费,即可轻松生成带有吉卜力风格的图像。这一模型的发布,不仅为动漫爱好者和创意人士提供了一个简单易用的工具,也让更多普通人有机会将自己的想象力融入经典的吉卜力美学之中,点亮日常生活的温暖一角。据介绍,EasyControl_Ghibli模型的设计初衷是为了打破

谷歌推出 Gemini 本地图像编辑功能:动动手就能让 AI 帮你改图

IT之家 5 月 1 日消息,谷歌在当地时间周三发布的博客中宣布,Gemini 聊天机器人应用目前支持修改由 AI 生成的图像以及用户从手机或计算机上传的图像。据IT之家了解,Gemini 的本地图像编辑功能将从今天起逐步推向全球,预计在未来几周内,服务将扩展至大多数国家,并支持超过 45 种语言。此次推出紧接着谷歌 3 月在 AI Studio 平台上测试的 AI 图像编辑模型,该模型因能删除

三星进军 AI 机器人领域,Ballie 本周公开亮相

IT之家 4 月 9 日消息,三星公司昨日(4 月 8 日)通过官方 Instagram 平台,预告将于本周在某个舞台上,展示 Ballie 机器人,可能会公布该机器人的发售细节。Ballie 是一款深度集成 SmartThings 平台的 AI 伴侣机器人,配备摄像头和迷你投影仪,能够在家中跟随用户,它不仅能够提供天气预报、播放电影、展示三星健康数据,还能协助管理购物清单、控制智能家居设备等。

DataBahn.ai推出“数据礁”智能化安全情报的新时代

在网络安全领域,如何快速而准确地处理海量数据是企业面临的一大挑战。最近,数据科技公司 DataBahn.ai 推出了一款名为 “数据礁”(Reef)的创新产品,旨在将高流量、高速度的安全监测信息转化为及时、可操作的情报,帮助企业做出更明智的决策。如今,企业收集的日志、警报和监测数据多达数 PB,但实际上仅分析不到5%。这意味着绝大多数数据未被充分利用,关键的信息往往被淹没在海量的噪音中。“数据礁”

AI介入私域运营,不仅提效,还省90%的token!

声明:本文来自于微信公众号 见实,作者:见实,授权站长之家转载发布。AI并不能完全取代现有的私域业务流程,更重要的是“精准介入”。例如,向百万用户发送促销邀请时,我们并不需要AI的全量轰炸(现有的企微群发功能已够用),而是潜伏在关键节点:仅对10%的真实回复者启动服务——用户确认参与的瞬间,AI自动标记“意向参与用户”,为后续精准推送铺路。这样的做法既融入了原有的工作流,又将AI的token消

​Anthropic 全新 AI 模型 Claude Neptune 即将亮相,竞逐市场巨头

科技媒体 testingcatalog 发透露了 AI 公司 Anthropic 正在研发的新模型 Claude Neptune 的相关信息。目前,这一新 AI 模型已进入内部安全测试阶段,预计将与 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展开竞争。根据博文的介绍,Claude Neptune 的安全测试正在使用 Anthropic Workbench 平台进行。这一阶段主

字节 Seed 开源 UI-TARS-1.5:基于视觉-语言模型构建的多模态智能体

IT之家 4 月 18 日消息,IT之家从豆包大模型团队获悉,UI-TARS-1.5 昨日正式发布并开源。这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。有关的链接如下:GitHub:https://github.com/bytedance/UI-TARSWebsite:https://seed-tars.com/Arxiv:https://arxiv.org