Member standard
Member expire
Member points 0
还没有账号? 立即注册
已有账号? 立即登录
95.03万
粉丝
11569
文章
214.41万
总浏览
5
平均评分
AI领域资深专家
IT之家 10 月 7 日消息,据杭州当贝网络科技有限公司官方消息,当贝秋季新品发布会定档 10 月 9 日下午 2 点举行,届时将带来当贝 X7 系列投影仪。据介绍,当贝 X7 系列投影定位“高端投影新标杆”,宣称画面体验全面进阶。当贝官方预热海报显示,该投影仪将支持 4K ULTRA HD。另据IT之家昨日报道,当贝 D7X 系列投影仪也将在 10 月 9 日发布,官方将其称为“4K 小旗舰
Ming-UniAudio是什么Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Transformer 架构的连续语音分词器,能有效整合语义和声学特征。基于此,Ming-UniAudio 开发了一个端到端的语音语言模型,平衡了生成和理解能力,并通过扩散头确保高质量的语音合成。Ming-U
Agent Kit是什么Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder可视化画布工具,支持拖拽节点设计复杂工作流,无需从零编写代码、ChatKit可定制聊天界面工具包,支持嵌入自有品牌并降低交互开发成本, Connector Registry集中管理数据与工具连接的中心。工具
Code2Video是什么Code2Video是新加坡国立大学Show Lab团队开发的AI教学视频生成框架,通过Python代码自动生成高质量教育视频。核心创新在于采用三智能体协作模式:Planner负责将知识点转化为结构化故事板,Coder将故事板转为可执行Manim代码,Critic优化视觉布局。相比传统视频生成工具,在知识传递效率(MMMC基准测试中提升40%)、画面稳定性方面表现更优
IT之家 10 月 7 日消息,谷歌宣布旗下代号为 Nano Banana 的图像生成模型 Gemini 2.5 Flash Image 正式进入生产环境阶段,开始提供商业授权,官方同步更新模型新增支持创建 10 种长宽比效果,并新增图片批量处理功能。据谷歌统计,今年 8 月底 Nano Banana 开放预览后迅速走红,仅在 Gemini AI 中,Nano Banana 就被用于创作超过 5
感谢IT之家网友 刺客、Nuc_F、会弹琴的九号 的线索投递!IT之家 10 月 7 日消息,科技媒体 The Decoder 昨日(10 月 6 日)发布博文,报道称在 OpenAI 2025 开发者日上,该公司首席执行官山姆・奥尔特曼(Sam Altman)宣布多项重大更新,推动 ChatGPT 从一个聊天工具向集应用与 AI 智能体于一体的综合性平台转型。IT之家援引博文介绍,本次活动时
IT之家 10 月 7 日消息,Cell Press 旗下期刊《Patterns》近日刊登斯坦福大学研究团队报告,相应研究团队对 Newswire、PRWeb 和 PRNewswire 等各大平台英语文稿进行分析,发现其中有大量文稿带有 AI 痕迹,认为大模型已被广泛应用于各类正式书面沟通场景。据介绍,相应团队采用了一套名为“分布式 LLM 量化框架”(Distributional LLM Qu
OpenAI 2025开发者日,奥特曼的精彩演讲引爆全场!现场,50分钟发布会,奥特曼重磅官宣了四项重大更新:Apps SDK:与外部应用无缝集成,OpenAI最大野心——把ChatGPT打造成未来的操作系统;AgentKit:无需编码,拖放搭建智能体。人人都可快速开发智能体,还能评估智能体能力;Codex全面可用:不写一行代码,打造爆款APP;API更新:三大API更新,Sora 2 API同
感谢IT之家网友 刺客、会弹琴的九号 的线索投递!IT之家 10 月 7 日消息,科技媒体 The Decoder 昨日(10 月 6 日)发布博文,报道称在 OpenAI 2025 开发者日上,该公司首席执行官山姆・奥尔特曼(Sam Altman)宣布多项重大更新,推动 ChatGPT 从一个聊天工具向集应用与 AI 智能体于一体的综合性平台转型。IT之家援引博文介绍,本次活动时长约 50
IT之家 10 月 7 日消息,据《金融时报》报道,OpenAI 与前苹果首席设计师 Jony Ive 合作开发的全新硬件产品目前面临多项技术挑战。报道称,这款设备由 Jony Ive 旗下设计公司 LoveFrom 主导设计,由 OpenAI 提供技术,定位为一款无屏幕、可掌上携带的智能装置,能够通过音频与视觉输入感知外界,并以语音形式回应用户请求。不过,由于 OpenAI 的算力规模远不及亚