OpenAI 最强推理模型 o3 / o4-mini 发布后,“照片查位置”成最新热门玩法 175 0 IT之家 4 月 18 日消息,据外媒 TechCrunch 今日报道,如今越来越多用户开始用 ChatGPT 来破解照片拍摄的具体地点,成为一种迅速在网络上扩散且令人担忧的新现象。本周,OpenAI 推出两款新模型 ——o3 和 o4-mini,均具备图像推理功能,能够通过上传的照片分析画面细节,甚至还能对模糊或变形的图片进行裁剪、旋转和放大,完成更深入的识别。借助这种分析能力,再结合模型的网
IBM 将三大 AI 项目移交给 Linux 基金会,推动开源 AI 发展 175 0 IBM 宣布将三项关键的人工智能(AI)项目移交给 Linux 基金会的 LF AI & Data 基金会,进一步推动开源 AI 的发展。这三项新项目分别是 Docling、BeeAI 和数据准备工具包(Data Prep Kit),反映了业界对开放和协作式 AI 开发的日益重视。与传统的封闭式解决方案不同,这些开源工具为开发者提供了更大的灵活性,使他们能够根据不同的需求进行修改和适配。这些工具致
谷歌 AI 编程助手 Gemini Code Assist 新增“代理”功能,可多步骤完成复杂任务 175 0 IT之家 4 月 10 日消息,在本周三的谷歌 Cloud Next 大会上,谷歌宣布其 AI 编程助手 Gemini Code Assist 新增“代理”功能。谷歌表示,Code Assist 如今能够部署新的 AI“代理”,这些代理能够通过多步骤完成复杂的编程任务。例如,它们可以根据 Google Docs 中的产品规格创建应用程序,或者将代码从一种语言转换为另一种语言。此外,Code As
Gemini API推出隐式缓存功能,开发者成本降低75% 175 0 Gemini API推出隐式缓存(Implicit Caching)功能,为开发者带来显著的成本优化体验。新功能无需开发者手动创建缓存,当请求与先前请求共享共同前缀时,系统将自动触发缓存命中,提供高达75%的Token折扣。此更新已覆盖Gemini2.5Pro和2.5Flash模型,进一步提升了AI开发的成本效益。官方详情可参考:https://developers.googleblog.com核
全国首张人工智能工程技术人员专业技术等级证书在天津诞生 175 0 IT之家 5 月 9 日消息,IT之家从天津人社公众号获悉,天津 35 名数字人才获得全国首批人工智能工程技术人员专业技术等级证书,其中全国首张证书即“001 号证书”在天津颁发。天津成为全国首批颁发智能制造、区块链、数字化管理师、人工智能 4 个数字技术职业专业技术等级证书的省市,在加快推进数字人才培育支撑数字经济发展行动中取得标志性进展。目前,天津共组织 26 期数字技术工程师培育项目,累计
ChatGPT“生成吉卜力风格 AI 图”海外潮流引发版权争议,CEO 奥尔特曼回应将施以限制 175 0 IT之家 3 月 30 日消息,OpenAI 于 3 月 25 日将 ChatGPT 的文生图功能升级为 GPT-4o 模型,号称能够更精准地根据用户文字指令生成图片,还能迅速把用户上传的图像转换成漫画、动画等风格。相应功能引发海外社交媒体“AI 生成吉卜力工作室风格图片”潮流,许多人试图将自己的自拍转为相应风格,就连 OpenAI CEO 奥尔特曼也一度将自己的 X 平台头像改为“吉卜力版本”
具身智能 无人驾驶 ChatGPT时刻 Waymo 张亚勤院士预言:无人驾驶将迎来 “ChatGPT 时刻” 175 0 在最近举行的2025中国电动汽车百人会论坛上,中国工程院院士、清华大学智能产业研究院院长张亚勤提出了一个激动人心的预测:无人驾驶技术将在2025年迎来其发展的 “ChatGPT 时刻”。这一论断让业界对未来的自动驾驶充满期待。张亚勤表示,无人驾驶将成为未来五年内最大的具身智能应用,而这一技术将首次通过 “新图灵测试”。他进一步阐述,尽管2025年是无人驾驶的关键节点,但要实现这一技术的广泛应用和普
石头扫拖机器人 618 国补再降价:P20 Pro 水箱版 2792 元、上下水版 3131 元 175 0 石头 P20 Pro 自清洁扫拖机器人于 2024 年 9 月 15 日开售,该机器人吸力 18500Pa,可选水箱版以及自动上下水版本,上市售价:P20 Pro 水箱版:3999 元P20 Pro 上下水版:4599 元今年 618 将于 5 月 13 日 20:00 开始,这两款直降至:水箱版直降 3299 元,国补后 2792 元。上下水版直降至 3699 元,国补后 3131 元。京东石
人形机器人 FourierN1 开源机器人 傅利叶 傅利叶推出首款开源人形机器人 Fourier N1,推动机器人技术创新 175 0 通用机器人公司傅利叶正式发布了其首款开源人形机器人 ——Fourier N1。此次发布标志着傅利叶 “Nexus 开源生态矩阵” 项目的落地,Fourier N1不仅在硬件设计上采用了创新的构造,还同步开放了涵盖物料清单、设计图纸、装配指南和基础操作软件在内的完整资源包,以便于全球的开发者进行研究和开发。Fourier N1的身高为1.3米,重量为38公斤,拥有23个自由度的关节设计,使其在运动灵
Dia AI语音模型 谷歌NotebookLM TPU 两名本科生打造 AI 语音模型,挑战谷歌 NotebookLM 175 0 在 AI 语音生成领域,竞争正变得愈发激烈。近日,来自韩国的两名本科生合伙创建了一款名为 Dia 的 AI 语音模型,声称其功能可与谷歌的 NotebookLM 相媲美。尽管这两位创始人在 AI 领域的经验尚浅,但他们在短短三个月内,成功开发出一款开放获取的语音生成工具。Dia 的训练依赖于谷歌的 TPU Research Cloud 项目,该项目为研究人员提供免费的 TPU AI 芯片使用权限。
F-Lite登陆Hugging Face,10亿参数扩散变换器革新文本到图像生成 175 0 Hugging Face平台正式上线F-Lite,一款拥有10亿参数的文本到图像扩散变换器(Diffusion Transformer)。据AIbase了解,F-Lite以其高效的生成能力和轻量化设计,迅速成为AI图像生成领域的焦点,社交平台上的讨论凸显其对开发者与创作者的吸引力。相关细节已通过Hugging Face官网(huggingface.co)与社区公开。核心功能:高效生成与轻量化架构F
MCP 与创新悖论:开放标准为何能拯救 AI 175 0 模型上下文协议(MCP)的出现,预示着人工智能应用生态系统即将发生根本性变革。 由 Anthropic 于2024年11月推出的 MCP,旨在规范 AI 应用程序与其训练数据之外的世界进行交互的方式。正如 HTTP 和 REST 为 Web 应用和服务间的连接奠定了基础,MCP 正在为 AI 模型与各种工具的连接建立统一的标准。虽然关于 MCP 的技术解读已屡见不鲜,但其作为一项“标准”的真正力量
消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类 176 0 IT之家 4 月 24 日消息,今年 3 月底,OpenAI 宣布计划在今年某个时候发布自 GPT-2 以来的首个“开源”语言模型,目前该模型的细节正逐渐浮出水面。据 TechCrunch 报道,消息人士透露,OpenAI 研究副总裁 Aidan Clark 正在领导这一开源模型的开发工作,该模型目前仍处于早期阶段。公司计划在今夏初发布该模型,并希望其在推理能力上超越其他同类开源推理模型。该模型
ChatGPT客户端界面更新,工具选项整合为滑块式设计 176 0 ChatGPT客户端于2025年5月6日迎来了一次细微但实用的界面更新。此次更新将图像生成、搜索、深度研究等多种工具选项整合为一个全新的滑块式图标,旨在提升用户操作效率与界面简洁性。社交媒体反馈显示,这一变化已逐步在iOS和Android平台的ChatGPT应用中上线,受到用户广泛关注。滑块式图标:一键展开多功能工具新版ChatGPT客户端的最大亮点在于将原本分散的工具选项(如图像生成、网页搜索、
AI生成内容 虚假信息 数字欺诈 深度伪造 别玩吉卜力了,来看GPT-4o隐藏的8种高能玩法 176 0 声明:本文来自于微信公众号AI新榜,作者:Kino,授权站长之家转载发布。有图有真相的时代恐怕要彻底过去了,我们离“AI生成现实”越来越近了。注意看:这是一张印着伦敦某高档融合餐厅名的小票,菜单里有龙虾、牛排、Barolo酒,总金额£1500,还有服务员名字、小费、日期时间。排版真实、金额对齐、票据结构合理,纸张甚至有褶皱和阴影。来源:X@the_Lawrenz如果不是最后诈骗级别的£355.
测试时训练(TTT) Transformer模型 AI视频生成 猫和老鼠 AI视频生成技术TTT:可直出一分钟完整猫和老鼠动画 无需编辑、拼接 176 0 近日,一项名为《One-Minute Video Generation with Test-Time Training》(一分钟视频生成与测试时训练)的全新研究论文正式发布,标志着人工智能视频生成技术迈入了一个崭新阶段。该研究通过在预训练Transformer模型中引入创新的测试时训练(TTT)层,成功实现了生成一分钟《猫和老鼠》(Tom and Jerry)动画视频的壮举。这一技术不仅在时间跨度