最新

教豆包唱歌
别让爱调落
大幅提升 AI 推理速度:UCLA 与 Meta AI 联合推出 d1 框架
在人工智能领域,UCLA 和 Meta AI 的研究人员联合推出了一种名为 d1的新框架,该框架通过强化学习技术显著提升了扩散式大语言模型(dLLMs)的推理能力。虽然传统的自回归模型如 GPT 受到了广泛关注,但 dLLMs 凭借其独特的优势,若能加强推理能力,将为企业带来新的效率和应用前景。扩散式语言模型与自回归模型的生成方式截然不同。自回归模型如 GPT-4o 是通过逐个预测后续词元生成文本
吉卜力在ChatGPT找到了“数字归宿”?或许,这是一场赤裸裸的掠夺
2025 年,吉卜力的魅力因 ChatGPT 找到了新的数字归宿。可是,事实真的如此吗?站长之家(ChinaZ.com) 4月3日 消息:2025 年 3 月,OpenAI 发布了 GPT-4o 模型的更新,推出强大的图像生成功能 —— 用户可将普通照片一键转化为吉卜力风格的梦幻艺术品,柔和的色调与魔法般的氛围,仿佛出自吉卜力画师之手。一时之间,各大 SNS 、网络社区等平台上掀起了“换头像”
业界首个,阿里通义万相“首尾帧生视频模型”开源
IT之家 4 月 17 日消息,阿里通义万相「首尾帧生视频模型」今日宣布开源,该模型参数量为 14B,号称是业界首个百亿参数规模的开源首尾帧视频模型。它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。用户可在通义万相官网直接免费体验该模型,或在 Github、Hugging Face、魔搭社区下载模型本地部署后进行
特斯拉招聘 80 个岗位推进 Optimus 项目,今年欲生产 5000 台人形机器人
IT之家 4 月 10 日消息,在 2025 年第一季度的全员大会上,特斯拉首席执行官埃隆・马斯克表示,该公司将在今年生产首批 Optimus 人形机器人。这一计划的推进,从特斯拉的招聘页面上也可见一斑,其对人形机器人团队的大力扩充正稳步推进。截至当前,特斯拉的官网招聘页面上列出了大约 80 个与 Optimus 相关的职位。这些职位分布在特斯拉位于美国的多个生产基地,包括加利福尼亚州的帕洛阿尔
Meta想要用AI搞定广告制作流程的“每一步自动化”
目前,AI生成视频广告仍是一个“风险重重”的领域,不过即便如此, Meta 似乎仍旧想将这项技术推进到极致。根据《华尔街日报》报道,Meta 首席执行官马克·扎克伯格的最新愿景是:在 2025 年底之前,为品牌提供可以“从头到尾自动生成广告”的 AI 工具 —— 即从创意构思、视觉素材,到音效剪辑,全都由 AI 完成。广告一直是 Meta 的主要收入来源,称之为“命脉”也丝毫不过分。近年来,他
OpenAI 突破传统微调,RFT 技术可精准定制 o4-mini 模型
IT之家 5 月 9 日消息,科技媒体 marktechpost 今天(5 月 9 日)发布博文,报道称 OpenAI 公司在其 o4-mini 推理模型上,推出了强化微调技术(Reinforcement Fine-Tuning, 简称 RFT),为定制基础模型以适应特定任务带来了突破性工具。OpenAI 的强化微调技术(RFT)将强化学习原理融入语言模型的微调过程。开发者不再仅依赖标注数据,而
“资助”社媒竞对,xAI 预计将为向 Telegram 集成一年 Grok 支付 3 亿美元
感谢IT之家网友 对的时间点、Jenny太美、咩咩洋、Coje_He 的线索投递!IT之家 5 月 29 日消息,社交媒体 Telegram 创始人兼首席执行官 Pavel Durov 宣布,其已与马斯克就一份一年期的合作关系达成原则性同意。马斯克旗下的 xAI 预计将向 Telegram 支付 3 亿美元的现金和股份换取 Telegram 对 xAI Grok 的一年集成,Telegram
DeepEyes – 小红书联合西安交大推出的多模态深度思考模型
DeepEyes是什么DeepEyes 是小红书团队和西安交通大学联合推出的多模态深度思考模型。基于端到端强化学习,实现类似 OpenAI o3 的“用图思考”能力,无需依赖监督微调(SFT)。DeepEyes 在推理过程中动态调用图像工具,如裁剪和缩放,增强对细节的感知与理解。模型在视觉推理基准测试 V* Bench 上准确率高达 90.1%,展现出强大的视觉搜索和多模态推理能力。DeepE
阿里妈妈在TongAI大会推出全新URM通用召回大模型,重塑购物体验
在首届国际通用人工智能大会 TongAI 上,阿里妈妈隆重推出了其 LMA2广告大模型系列中的 URM 通用召回大模型。这一新模型在生成式推荐(AIGR)领域的首次亮相,标志着阿里妈妈在智能广告技术上的又一次重大突破。URM 通用召回大模型的设计理念是为了更精准地预测消费者的购物需求。通过深度学习和大数据分析,该模型能够有效识别用户潜在的消费意图,从而帮助商家制定更为合理的投放策略。这不仅有助于提
微博治理“AI起号”行为:已清理560余条违规内容 11个用户被禁言
快科技5月12日消息,微博管理员公布AI起号”违规行为的治理情况,已清理违规内容560余条,对11个违规用户予以阶段性禁言处置。据悉,微博管理员今日发文称,微博积极响应中央网信办清朗?整治AI技术滥用”专项行动要求,切实履行平台主体责任。对利用AI批量生产虚假内容涨粉、利用AI起号引流带货、售卖AI起号课程、售卖AI账号等AI起号”违规行为开展专项整治工作。据公布数据显示:微博针对利用AI生成
高德地图推出全球首个基于地图的 AI 导航智能体
高德地图宣布推出全球首个基于地图的 AI 导航智能体,并在全国范围内正式上线。这一创新举措标志着导航服务从传统的出行工具向“会思考、能预判、有温度”的智能出行伙伴转变。此次上线的红绿灯 AI 领航功能,是高德地图在智能导航领域的一次重大突破。该功能通过强大的数字化和 AI 超视距感知领航技术体系,推演出红绿灯场景下的最优驾驶决策,为驾驶员提供全方位的过灯决策支持。红绿灯 AI 领航功能的上线,不仅
苹果AI战略受挫:升级版Siri或将错过WWDC,内部分歧导致发展滞后
彭博社记者Mark Gurman今日凌晨发布报道,详细揭示了苹果在AI领域的战略失误及内部冲突,同时披露了公司今年在AI方面的部分进展计划。根据Gurman的报道,升级版Siri将继续"难产",发布时间可能晚于下月的全球开发者大会(WWDC)。虽然新版Siri可能会与iOS19一同在WWDC亮相,但预计不会被重点提及,且实际发布仍需几个月的等待时间。报道指出,苹果较早意识到"AI是未来趋势"。早在
Reddit 起诉 Anthropic,称其未支付AI训练数据费用
“我们不会容忍像 Anthropic 这样以盈利为目的的公司,利用 Reddit 内容牟利数十亿美元,却不给予 Reddit 用户任何回报或尊重他们的隐私。”Reddit方面如是表态……Reddit 于本周三在加州北区法院提起诉讼,指控 AI 初创公司 Anthropic 在未签署正式授权协议的情况下,擅自使用 Reddit 网站的数据训练 AI 模型。Reddit 在诉状中称,Anthrop
电台用AI DJ当主持人:6个月无人识破!
快科技4月30日消息,澳大利亚知名电台CADA使用AI语音生成器ElevenLabs打造了一位AI DJ Thy。Thy自2024年11月开始主持节目《Workdays with Thy》,其表现如此逼真,以至于在长达六个月的时间里,竟然没有听众发现他并非人类。ElevenLabs的基本原理是,用户只需上传一段录音,ElevenLabs就能生成对应的语音模型,随后输入文字,AI就能用该声音将文
清华大学成立人工智能医院,培育新一代“AI 协同型医生”
感谢IT之家网友 独爱依兰 的线索投递!IT之家 4 月 28 日消息,据“清华大学”微信公众号消息,4 月 26 日上午,清华大学在主楼接待厅举行人工智能医院成立仪式暨 2025 年医学院全体教职工大会。清华大学人工智能医院揭牌清华大学人工智能医院(IT之家注:Tsinghua AI Agent Hospital)建设将分阶段进行,初期将在学校 AI 全面布局和多学科医工交叉的基础上建设 A
哪些人最易被AI淘汰
办公室没有警报响起,也没有大规模裁员通知,但你却隐隐觉得不对劲:报表忽然不再需要你来跑,主管开始自己写方案,团队里那个“懂AI”的年轻人被提拔成项目牵头人,而你被分配去做些“不太重要但也不能不做”的收尾工作。你没有犯错,也没有偷懒,却从“骨干”变成了“边角料”。这一切变化,没有人通知你,更没有人告诉你——AI已经在悄悄替代你,只是方式不再粗暴直接,而是系统性边缘化、温水煮青蛙式淘汰。真正让人恐惧