业界首个,阿里通义万相“首尾帧生视频模型”开源 71 0 IT之家 4 月 17 日消息,阿里通义万相「首尾帧生视频模型」今日宣布开源,该模型参数量为 14B,号称是业界首个百亿参数规模的开源首尾帧视频模型。它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。用户可在通义万相官网直接免费体验该模型,或在 Github、Hugging Face、魔搭社区下载模型本地部署后进行
Anthropic模型上下文协议(MCP) Gemini OpenAI 谷歌DeepMind 效仿 OpenAI,谷歌 Gemini 加入 MCP 阵营,加速 AI 代理互联互通 71 0 就在 OpenAI 宣布采纳竞争对手 Anthropic 的标准,以实现人工智能模型与数据所在系统连接的几周后,谷歌也采取了类似举措。谷歌 DeepMind 首席执行官 Demis Hassabis 周三在社交平台 X 上发文宣布,谷歌将在其 Gemini 模型和软件开发工具包 (SDK) 中增加对 Anthropic 模型上下文协议 (MCP) 的支持。但他并未透露具体的时间表。Hassabis
特斯拉招聘 80 个岗位推进 Optimus 项目,今年欲生产 5000 台人形机器人 71 0 IT之家 4 月 10 日消息,在 2025 年第一季度的全员大会上,特斯拉首席执行官埃隆・马斯克表示,该公司将在今年生产首批 Optimus 人形机器人。这一计划的推进,从特斯拉的招聘页面上也可见一斑,其对人形机器人团队的大力扩充正稳步推进。截至当前,特斯拉的官网招聘页面上列出了大约 80 个与 Optimus 相关的职位。这些职位分布在特斯拉位于美国的多个生产基地,包括加利福尼亚州的帕洛阿尔
AI赋能 财报分析 2024市场预期 企业增长 在这5份财报里,AI被提及近百次 71 0 声明:本文来自于微信公众号见实,作者:见实,授权站长之家转载发布。截至今天,阿里、腾讯、有赞、微盟、快手相继发布2024全年财报(阿里最新为2025年度中期报告)。据不完全统计,在这几份财报里,AI及相关表述被提及近百次。从这些表述里,似乎透露出了一个默认的事实:AI在降本增效、提升营收方面的赋能程度已经有了具体的衡量数据。未来,各公司会继续加大AI投入。甚至可以说,AI将是他们对2025抱有
Anthropic 推出 AI for Science 计划,助力科研人员加速科学发现 71 0 AI 技术公司 Anthropic 于5月6日宣布推出一项名为 “AI for Science” 的新计划,旨在为生命科学等领域的研究人员提供免费 API 积分,以帮助他们加速科学研究和发现。该计划希望借助先进的人工智能技术,提升科研效率,减少科学发现所需的时间和资源。图源备注:图片由AI生成,图片授权服务商MidjourneyAnthropic 相信,AI 的推理和语言处理能力可以极大地推动科学
OpenAI 突破传统微调,RFT 技术可精准定制 o4-mini 模型 71 0 IT之家 5 月 9 日消息,科技媒体 marktechpost 今天(5 月 9 日)发布博文,报道称 OpenAI 公司在其 o4-mini 推理模型上,推出了强化微调技术(Reinforcement Fine-Tuning, 简称 RFT),为定制基础模型以适应特定任务带来了突破性工具。OpenAI 的强化微调技术(RFT)将强化学习原理融入语言模型的微调过程。开发者不再仅依赖标注数据,而
得助大模型 昇腾云 得助智能陪练2.0 得助智能质检2.0 中关村科金携手华为云推出新解决方案,助力行业大模型应用落地 71 0 在2025大模型技术与应用创新城市论坛的深圳站上,中关村科金与华为云共同发布了昇腾云与得助大模型平台的联合解决方案,标志着二者在垂直行业大模型应用方面的深度合作。此次论坛由中关村科金与深圳市人工智能产业协会联合主办,旨在推动大模型技术的广泛应用和创新发展。该解决方案的推出,意在加速各行业对大模型技术的实际应用。随着人工智能技术的不断发展,行业需求日益增强,特别是在智能客服和质检等领域。中关村科金在
苹果AI战略受挫:升级版Siri或将错过WWDC,内部分歧导致发展滞后 71 0 彭博社记者Mark Gurman今日凌晨发布报道,详细揭示了苹果在AI领域的战略失误及内部冲突,同时披露了公司今年在AI方面的部分进展计划。根据Gurman的报道,升级版Siri将继续"难产",发布时间可能晚于下月的全球开发者大会(WWDC)。虽然新版Siri可能会与iOS19一同在WWDC亮相,但预计不会被重点提及,且实际发布仍需几个月的等待时间。报道指出,苹果较早意识到"AI是未来趋势"。早在
减肥人士的AI搭子来了!支付宝AI健康管家推出“减重专区” 71 0 减重人士有了专属的“AI搭子”!5月7日,支付宝AI健康管家正式上线“减重专区”,推出系列智能体指导用户科学饮食、健康锻炼,此外,还有7位三甲医院多科室减重医生在专区内开设了AI分身,助力全民体重管理。目前,用户上支付宝搜“AI健康管家”,点击“服务”即可体验。支付宝AI健康管家-减重专区在专区内,用户可以通过“饮食健康小助手“拍下日常饮食照片,交由AI识别热量并记录,智能体还能根据用户个人情况生
AI DJ ElevenLabs 语音生成 电台用AI DJ当主持人:6个月无人识破! 72 0 快科技4月30日消息,澳大利亚知名电台CADA使用AI语音生成器ElevenLabs打造了一位AI DJ Thy。Thy自2024年11月开始主持节目《Workdays with Thy》,其表现如此逼真,以至于在长达六个月的时间里,竟然没有听众发现他并非人类。ElevenLabs的基本原理是,用户只需上传一段录音,ElevenLabs就能生成对应的语音模型,随后输入文字,AI就能用该声音将文
QuaDMix 大型语言模型(LLM) 数据选择框架 字节跳动 字节跳动推出 QuaDMix:大型语言模型预训练数据质量与多样性的统一框架 72 0 近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。然而,传统的数据筛选方法往往将质量和多样性视为两个独立的目标,先进行质量过滤,再进行领域平衡。这种逐步优化的方式忽略了质量与多样性之间的复杂相互关系。优质数据集往往存在领域偏差,而多样化的数据集可能会降低质量。因此,在固定的训
Anthropic呼吁加强 GPU 出口管制,Nvidia CEO请求特朗普 “共享 AI 红利” 72 0 工智能公司Anthropic向白宫发出呼吁,要求进一步加强针对人工智能扩散的出口管制。这些出口管制自今年五月中旬起,将限制或禁止将高端 GPU 及加速器出售给中国及部分国家。Anthropic表示,现有的出口管制措施仍不足以遏制走私芯片流入中国,从而推动其人工智能的持续进步。Anthropic在一份简报中指出,中国在一月份发布的免费大型语言模型(LLM)已经在某些基准测试中超越了美国公司的模型,这
谷歌向 Pixel 9 /三星 Galaxy S25 推出 Gemini Live AI“实时拍摄”及识图导购助手功能 72 0 IT之家 4 月 8 日消息,谷歌宣布旗下 Gemini Live AI“Live Camera(实时拍摄)”及“Screenshare(识图导购)”功能现已支持 Pixel 9 系列手机和三星 Galaxy S25。之后还将支持更多安卓设备,不过只有付费的 Gemini Advanced 用户才能使用这些新功能。在启用“Live Camera”功能后,用户只需按下一个按钮即可激活“实时拍摄”功
MarkItDownMCP 大型语言模型(LLM) 文档处理 Markdown 微软MarkItDown MCP,可把Word、Excel等转换成markdown格式 72 0 在数字化时代,如何有效地处理文档信息已经成为了许多行业中的一个热门话题。而今,微软推出的 MarkItDown MCP(Model Context Protocol)将文档处理提升到了一个新的高度!想象一下,您只需简单几步,就能将各种格式的文件(如 PDF、Word、PowerPoint 等)轻松转换为 Markdown 格式,为您的文本分析和大型语言模型(LLM)应用提供无缝支持。更为惊艳的是,
Grok3Mini xAI 高效AI 语言模型 xAI发布Grok3Mini:为开发者提供高性价比AI模型 72 0 xAI近日推出了其全新的语言模型——Grok3Mini,进一步推动了高效AI技术的发展。Grok3Mini专为速度和经济性设计,尽管体积较小,但在多个领域的表现优于许多更昂贵的AI模型,尤其在数学、编程和科学基准测试中表现突出。Grok3Mini:高性能与低成本的完美平衡Grok3Mini是Grok3系列的一部分,该系列包含六种变体,其中包括标准的Grok3、Grok3Fast,以及四种版本的Gr
苹果加速智能眼镜芯片研发,瞄准人工智能和未来 Mac 设备 72 0 苹果公司正积极推动其晶硅设计团队开发新一代芯片,这些芯片将为未来的设备提供核心处理能力。其中包括苹果首款智能眼镜、性能更强的 Mac 电脑以及专门针对人工智能(AI)应用的服务器。这一举措显示出苹果在智能眼镜领域的雄心,意在与 Meta Platforms Inc. 的 Ray-Ban 智能眼镜展开竞争。图源备注:图片由AI生成,图片授权服务商Midjourney近年来,苹果的晶硅设计团队已成为推