# AI工具 # AI项目和框架 Skywork-R1V 2.0 – 昆仑万维开源的新版多模态推理模型 81 0 Skywork-R1V 2.0是什么Skywork-R1V 2.0 是昆仑万维最新开源的多模态推理模型,专为复杂推理任务设计,具备强大的视觉与文本推理能力。模型基于混合强化学习和多模态奖励模型(Skywork-VL Reward)实现推理能力与泛化能力的平衡,引入选择性样本缓冲区(SSB)机制解决“优势消失”问题。在 AIME2024、OlympiadBench 等权威基准测试中表现出色,性能
AI旅游规划 飞猪问一问 AI交互式预订 个性化旅行方案 飞猪AI横空出世!旅行规划不再难,轻松搞定机酒预订 81 0 随着五一假期的临近,旅游话题再次引起关注。而飞猪推出的 AI 产品 “问一问” 近期在小红书上引起热议,甚至出现了黄牛倒卖邀请码的现象。这款看似普通的聊天助手,实际上具备强大的功能,让用户能够快速完成机票和酒店的预订,从而实现 “所见即所得” 的理想旅行规划体验。不同于以往的旅行 AI,飞猪的 “问一问” 不仅能够提供交互式的交流,还能在短时间内完成从交流到交易的闭环。用户只需输入一段话,AI 就
文本转语音(TTS)模型 Dia NariLabs 16亿参数 颠覆性开源 TTS 模型 Dia 发布:情绪、非语言提示全支持,媲美真人对话 81 0 一家名为 Nari Labs 的两人创业公司发布了 Dia,这是一个拥有16亿参数的文本转语音 (TTS) 模型,旨在直接从文本提示生成自然对话。其联合创始人 Toby Kim 声称,Dia 的性能超越了 ElevenLabs 等竞争对手的专有产品以及谷歌的 NotebookLM AI 播客生成功能,并可能对 OpenAI 近期发布的 gpt-4o-mini-tts 构成威胁。Kim 在社交媒体
微软openai 微软openai合作 微软openai复合 openai 微软与 OpenAI 正在“复合”?或重新商讨合作关系 81 0 据英国《金融时报》报道, OpenAI 目前正在与其最 大投资者和合作伙伴之一的微软进行“艰难的谈判” 。这家人工智能初创公司最近宣布了公司重组计划的重大变革 —— 虽然他们仍计划将其业务部门转变为营利性公益公司,但其非营利董事会仍将继续控制。英国《金融时报》称他们与多位消息人士进行了交谈,这些消息人士称微软是批准重组所需的关键阻力,迄今为止微软已向 OpenAI 投资了 130 亿美元。虽然
豆包大模型 深度思考模型 AI创新巡展 火山引擎 推理能力飞跃?豆包1.5深度思考模型即将正式服务企业 81 0 火山引擎今日发布活动预热,正式宣布其新款豆包大模型将于明日(4月17日)在FORCE LINK AI创新巡展杭州站上隆重发布。官方信息显示,此次发布会将带来豆包大模型家族的全新升级,并特别推出备受瞩目的豆包1.5深度思考模型。此前已有消息透露,豆包APP和桌面端已针对“深度思考模式”进行了多轮实验性测试。此次发布后,该模型将正式面向企业客户提供服务。据悉,豆包公众号此前已公开宣布测试新版深度思考功
HailuoImage CharacterReference AI图像生成 MiniMax 海螺推出图像人物参考功能 允许用户基于单张图像生成多角度、动态姿势的角色图像 81 0 MiniMax旗下的Hailuo AI正式推出Hailuo Image全新功能——Character Reference,为AI图像生成领域带来突破性创新。据AIbase了解,该功能允许用户基于单张参考图像生成具有多角度、动态姿势、丰富表情的角色图像,支持电影化光影与构图,并提供全面的提示词控制。社区对这一功能的发布反响热烈,项目详情已通过Hailuo官网与GitHub公开,标志着Hailuo在角
AIGC短剧 短视频创作 新媒体文化 网络娱乐 可灵vs即梦,决战AI短剧 81 0 声明:本文来自于微信公众号壹娱观察,作者:大娱乐家,授权站长之家转载发布。“阴曹地府外卖员”、“怀孕生子男人鱼”、“猫哥捡个田螺姑娘”……这些看着前言不搭后语的视频,可以说是现在抖音、快手上个人创作者对AIGC短剧最常见的创作类型。抛开技术表现不谈,看到这类“创作”,也不难理解为何如今的AI短剧,即便是专业人士下场,也几乎清一色都是各种玄幻、科幻甚至尺度较大的高概念类型。或许不是平台本身的本意
AI教育 AI私人导师 eSelf 个性化学习 以色列拥抱 AI 辅导 eSelf 为学生打造一对一虚拟导师 81 0 以色列有望成为全球首个在全国范围内实施人工智能辅导的国家。初创公司 eSelf 与以色列最大的 K-12教科书出版商教育技术中心 (CET) 合作,为全国学生提供个性化的 AI 私人导师。哈佛大学将担任该试点项目的学术顾问,评估其教育框架和影响。首阶段试点将于5月启动,预计将有1万名学生参与。这项合作旨在解决当前教育面临的两大挑战:学生成绩下滑和全球教师短缺。研究表明,一对一辅导能显著提高学生成绩
天工 CEO 熊友军:能在本届机器人半马夺冠具有里程碑意义,今天只展示了一小部分 81 0 感谢IT之家网友 西窗旧事 的线索投递!IT之家 4 月 19 日消息,在今日的人形机器人半程马拉松赛事中,“天工 Ultra”以 2 小时 40 分 42 秒的成绩冲线,勇夺全球首个人形机器人半马赛事冠军。综合红星新闻、深圳《第一现场》等报道,天工团队负责人、北京人形机器人创新中心 CEO 熊友军在赛后接受采访表示,这次比赛非常有意义,“这是里程碑意义的工作,非常高兴。”熊友军表示,这一赛事
AI驱动欺诈 网络诈骗 微软 Midjourney AI 诈骗猛增,微软揭示阻止 40 亿美元欺诈的秘密 81 0 近日,微软发布的最新《网络信号》报告显示,人工智能技术正在推动一波新型诈骗的迅猛发展。报告指出,在过去一年中,微软成功阻止了高达40亿美元的欺诈企图,每小时拦截约160万个机器人的注册尝试。这一数据凸显了网络诈骗的威胁之大。图源备注:图片由AI生成,图片授权服务商Midjourney该报告的第九期名为 “AI 驱动的欺骗:新兴的诈骗威胁与对策”,阐述了人工智能如何降低了网络犯罪的门槛,使得即使是缺
MegaTTS3 字节跳动 文本转语音(TTS) AI语音合成 字节跳动在Hugging Face发布MegaTTS3:轻量化语音合成新突破 82 0 北京——字节跳动(ByteDance)近日在人工智能开源社区Hugging Face上正式发布了其最新的文本转语音(TTS)模型MegaTTS3。这一发布迅速引起了全球AI研究者和开发者的关注,因其在轻量化设计和多语言支持方面的突破性表现。根据技术社区反馈和官方信息,MegaTTS3 被誉为语音合成领域的一次重要进步。MegaTTS3 的核心亮点MegaTTS3 是一款由字节跳动与浙江大学合作开发
代码世界风云突变:Anthropic 报告揭秘 AI 正从“助手”变“主导”,初创公司抢占先机! 82 0 人工智能在软件开发领域的渗透,正以前所未有的速度和深度演进。AI 巨头 Anthropic 最新发布的第二份经济指数报告,犹如一颗投入平静湖面的石子,激起了层层涟漪。这份基于其 Claude AI 及专业编码工具 Claude Code 上高达50万次交互数据的深度研究,清晰地描绘出一幅惊人图景:人工智能正迅速脱离仅仅辅助编码的角色,朝着自动化编码大步迈进,尤其在 Claude Code 这类“专
绿联 DXP4800 私有云白色款上市:英特尔 N100、双 2.5G 网口,空盘版 2199 元 82 0 感谢IT之家网友 华南吴彦祖 的线索投递!IT之家 4 月 9 日消息,绿联 DXP4800 私有云白色款现已上架京东并开售,新品搭载英特尔 N100 处理器、拥有 8GB 内存、配备双 2.5G 网口,空盘版 2199 元。京东绿联 DXP4800 私有云白色款英特尔 N100 | 双 2.5G 网口 2199 元直达链接据介绍,绿联 DXP4800 私有云白色款搭载英特尔 N100 处理器
Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率 82 0 IT之家 4 月 6 日消息,Meta 现已发布旗下最新 Llama 4 系列 AI 模型,包含 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth,Meta 透露相应模型都经过了“大量未标注的文本、图像和视频数据”的训练,以使它们具备“广泛的视觉理解能力”。目前,Meta 已将系列模型中的 Scout 和 Maverick 上架到 Hugging
谷歌安卓将推新 ML Kit GenAI API,扩展端侧 Gemini Nano AI 模型访问 82 0 IT之家 5 月 17 日消息,科技媒体 Android Authority 昨日(5 月 16 日)发布博文,报道称谷歌将引入全新的 ML Kit GenAI API,扩展端侧 AI 模型 Gemini Nano 的访问权限。谷歌有望在 2025 年 I/O 开发者大会上,详细介绍这些 API。开发者利用这些 API,可以在应用中集成文本摘要、校对、改写及生成图像描述等功能。IT之家援引博文介
MCP Function Calling AI MCP协议和Function Calling 、 AI Agents的区别是什么?MCP优势有哪些 82 0 MCP(模型上下文协议)、Function Calling 和 AI Agents 是三种重要的技术手段,它们在实现 AI 模型与外部系统交互方面各有特点。本文将详细对比这三种技术,并深入探讨 MCP 的多项显著优势。MCP、Function Calling 和 AI Agents 的区别Function Calling:平台依赖的函数调用机制Function Calling 是一种 AI 模