标准会员
过期时间
会员积分 0
还没有账号? 立即注册
已有账号? 立即登录
发疯文学的“疯”,终于是让AI给呐喊出来了。例如电视剧《180天重启计划》中的这段发疯名场面:然后啊,我们让AI用于谦+郭德纲的腔调打开这段对话,画风是这样的: 这要放以前,那些平平淡淡的AI语音,这癫感、这呐喊,大概率是发不出来的。那为什么现在AI就可以做到了呢?因为就在刚刚,火山引擎把豆包语音大模型升级了——语音学会了思考,更能理解台词,情感表达更有张力。具体来说,火山引擎这次主要升级了2
近期,来自斯坦福大学和西弗吉尼亚大学等研究团队提出了一种名为 “语言化采样”(Verbalized Sampling,VS)的方法,旨在提升生成式 AI 模型的创作多样性。研究显示,通过在提示中加入一句简单的话:“生成5个响应及其对应的概率,从完整分布中采样”,可以让大型语言模型(LLMs)和图像生成模型在输出上表现出更丰富的创造力。生成式 AI 模型在生成内容时,通常会依据预测的下一个信息单元(
由李飞飞团队最新推出的 RTFM(Read The Field Model) 成为当前最具突破性的3D 世界生成模型之一。该模型可在单个 NVIDIA H100GPU 上实现 交互式帧率的实时推理,成功将“3D 世界生成”从概念推向可用阶段。RTFM 最大亮点在于其具备 持久性与3D一致性 的实时运行能力。模型不仅能生成完整的3D 场景,还能在交互过程中保持几何结构、物体位置与外观的稳定一致,支持
近日,OpenAI 宣布暂停其 AI 视频生成模型 Sora 对马丁・路德・金(Martin Luther King Jr.)的肖像生成。这一决定是应马丁・路德・金遗产管理处的请求而做出的,原因在于用户在 Sora 上生成了一些 “失礼” 的视频内容。OpenAI 在其社交媒体平台 X 上发布声明称:“虽然描绘历史人物的言论自由是重要的,但我们认为公众人物及其家属应该最终控制他们肖像的使用。” 此
2025年,AI音乐创作工具的普及正在改变音乐行业的创作格局。今年1月,一位《原神》玩家使用游戏台词结合AI作曲工具Suno创作的歌曲《奥奇坎竟是我自己》在B站获得近640万播放量,引发了关于AI创作能力的广泛讨论。程序员群体成为AI音乐创作的活跃参与者。今年3月,程序员Yapie利用DeepSeek和Make Best Music等工具,以"暗恋到分手"为主题,在数小时内完成了歌曲《七天爱人》的
北京清华长庚医院与北京电子数智科技有限责任公司(北电数智)于10月16日宣布达成战略合作,双方将联合研发国内首个药学领域专用大模型。该项目旨在通过AI技术优化药学工作流程,提升针对老年人、儿童和孕产妇等特殊人群的用药安全评估效率和精准度。从行业背景来看,当前药品信息更新速度快,新药持续上市,而特殊人群的用药评估因个体差异和药物相互作用的复杂性,需要药师投入大量时间进行风险判断。传统依赖人工经验的药
小米与北京大学联合发布了一篇新的学术论文,论文已上传至 arXiv 平台。该论文的通讯作者之一是备受瞩目的年轻学者罗福莉,她曾因被小米集团创始人兼 CEO 雷军以千万年薪招募而成为热点人物。然而,值得注意的是,论文的作者名单中并未显示罗福莉属于小米大模型团队。罗福莉是1995年出生的年轻才女,本科毕业于北京师范大学计算机专业,并在北京大学计算语言学研究所获得硕士学位。在加入小米之前,她曾在阿里巴巴
当我们谈论 AI 安全的问题时,我们到底在谈论什么?是暴力,偏见还是伦理问题?这些固然重要,但是对于将 AI 投入实际业务的企业而言,一个更致命但却长期被忽视的一条安全红线正在被频繁触碰:你精心打造的「法律咨询」聊天机器人,正在热情地为用户提供医疗建议。这仅仅是模型跑题了而已吗?不,这就是一种不安全。在这篇文章中,来自南洋理工大学等机构的研究者们首先提出了一个开创性的概念 --- 运行安全
给 AGI 画一条「及格线」,GPT-4 和 GPT-5 竟都是「差等生」?通用人工智能(Artificial General Intelligence,AGI)是目前 AI 领域内各个顶尖实验室努力的大方向,但是有关 AGI 的定义可谓众说纷纭。也就是说,在追逐 AGI 这一圣杯时,我们究竟在追逐什么?近日,图灵奖得主 Yoshua Bengio、前谷歌 CEO 埃里克・施密特、纽约大学教
今天早上,Anthropic 发布了 Claude Skills,这是一种助其模型获取新功能的全新模式:Claude 现可使用 Skills 改进模型执行特定任务的方式。Skills 的实质是包含指令、脚本与资源的文件夹,Claude 模型可在需要时加载这些资源。Claude 只会在 Skill 与当前任务相关时才会加以调用。在使用 Skill 之后,Claude 将可更好地完成特定任务,
当 OpenAI 的奥特曼还在到处买显卡 、买算力,来支撑他的 Sora 2 视频生成模型。 李飞飞的实验室 The World Labs,用一张显卡就能运行一个世界。他们今天发布了一项名为 RTFM (Real-Time Frame Model) 的新技术,一个全新的实时世界生成模型。 和九月中旬发布的图生世界 Marble 不同,RTFM 不仅是用一张照片,生成一个我们可以自由漫步、探索
IT之家 10 月 17 日消息,据 404 Media 今日报道,AI 正导致维基百科的人类访问量“危险地”下降。维基百科的运营方维基媒体基金会表示,维基百科的人类访问量显著下降,因为越来越多的人通过在其文章上训练的生成式 AI 聊天机器人、在不实际点击网站的情况下总结文章的搜索引擎等方式,来获取维基百科的信息。维基媒体基金会指出,这样的状况对维基百科的长期可持续发展构成威胁。维基媒体基金会产
插件workflow(GIF)我最近在小红书上持续分享 AI 设计相关内容,看着点赞、收藏、评论数不断上涨,感觉内容还是有价值的。但,回复评论,却成了我的负担。i 人社交焦虑作为 i 人,我每次回复前都要反复斟酌:这句话会不会太生硬?这个词用得对吗?遇到涉及知识盲区的评论,更是要立刻去查资料、补知识。通常,我的解决办法是把笔记内容和评论一起复制给 ChatGPT,让它生成几条回复建议作为参考,我
国内首个少样本通用具身操作基础模型发布,跨越视觉语言与机器人操作的鸿沟。具身智能领域终于要突破 “数据桎梏” 了吗?相较于自然语言、视觉领域,具身智能的数据天然稀缺。真实世界的机器人操作往往涉及复杂的物理交互、实时反馈与环境变化,导致数据采集不仅成本高、效率低,并且还难以规模化。因此,现实中能达到数十万以及百万物理交互的数据集并不多见。另外,当前的视觉 - 语言 - 动作(VLA)模型虽然已经具
从蒸汽机到AI,自动化进程已持续两百年。在2017年,新晋诺奖得主Philippe Aghion就剖析AI对就业与增长的影响,强调它并非奇点催化剂,而是受「鲍莫尔成本病」制约的工具。今年诺奖和AI「绝缘」?2024年,「AI教父」Geoffrey Hinton获物理学奖,谷歌DeepMind的Demis Hassabis和John Jumper因AlphaFold2获化学奖,堪称诺贝尔奖的AI元
OpenAI近日宣布,与马丁·路德·金遗产公司(King Estate, Inc.)达成合作,针对其视频生成工具Sora中马丁·路德·金博士肖像的使用问题作出调整。此举旨在回应部分用户的不当生成行为,并强化对历史人物肖像的保护机制。 据声明,一些用户在Sora平台上对金博士的形象进行了不尊重描述,引发遗产公司关注。为此,应遗产公司的要求,OpenAI已暂停在Sora中生成金博士的肖像内容。这一决定
11569 文章 95.03万 关注
1489 文章 0 关注
1221 文章 5.64K 关注
1210 文章 5.87万 关注
1093 文章 9.63万 关注
1024 文章 5.63K 关注