最新

教豆包唱歌
别让爱调落
Adobe的AI图像生成工具Firefly将发布iOS和安卓版
在最新的动态中,Adobe 公司宣布将推出其 AI 图像生成工具 Firefly 的移动版本,旨在与 OpenAI 进行更为激烈的竞争。这一消息在伦敦的 MAX 创意大会上得到正式发布,Adobe 表示 Firefly 的移动应用程序将很快上线,支持 iOS 和安卓平台,但具体的发布日期尚未确定。Adobe Firefly 的副总裁 Alexandru Costin 在接受 CNBC 采访时指出,
谷歌 AI 概览被指无法正确回答“今年是哪一年”,官方紧急修复
IT之家 5 月 30 日消息,AI 工具被广泛宣传为强大助手,能够帮用户完成调研、编程、写作、总结等各类任务,提供各种知识。然而,AI 有时也会在最简单的问题上“翻车”。据外媒 TechCrunch 今日报道,谷歌的“AI 概览”就闹了笑话 —— 竟然不知道今年是哪一年。过去几天,不少用户发现,当他们向谷歌询问现在是哪一年时,AI 概览的回答竟然是“2024 年”。这一问题今日晚些时候得以修复
百度发布高说服力数字人,可在电商直播领域带来超越真人体验
IT之家 4 月 25 日消息,今日在百度 Create 大会现场,百度创始人李彦宏发布了高说服力数字人,即声形超拟真、内容更专业、互动更灵活的数字人,能在电商直播、游戏、消费等领域带来超越真人的体验。李彦宏指出,高说服力数字人超越真人主要归功于百度慧播星背后的“剧本生成”能力,实现口播脚本与数字人表情、语气、动作的高度融合,以及顺畅的情绪转折和动作切换,表现“超拟真”。另外,高说服力数字人还具
通义推出CoGenAV多模态语音表征模型 可实现音画同步感知
近日,通义大模型发布CoGenAV,以音画同步理念创新语音识别技术,有效解决语音识别中噪声干扰的难题。传统语音识别在噪声环境下表现欠佳,CoGenAV则另辟蹊径,通过学习audio-visual-text之间的时序对齐关系,构建出更鲁棒、更通用的语音表征框架,系统性提升语音识别任务(VSR/AVSR)、语音重建任务(AVSS/AVSE)以及语音同步任务(ASD)等多个Speech-Centric任
智谱Z基金出资3亿支持全球开源社区 北京追加投资2亿元
北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2亿元人民币,支持智谱的开源模型研发与开源社区生态建设。智谱是基金成立以来投资的第一家 AI 大模型企业,也是目前成长最快的企业。智谱在包括文本、推理、语音、图像、视频、代码等在内的模型能力上有全面积累,商业化布局完善,拥有超过百万规模的开发者社区和企业用户。此次追加投资旨在进一步推动智谱在开源模型和算法创新方面的能力
AI日报:ChatGPT重磅上线图像库功能;白嫖!Veo2登陆谷歌AI Studio;蚂蚁百宝箱推“MCP专区”
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称字节跳动整合 AI 研发团队,AI Lab 即将并入 Seed字节跳动正在进行AI研发团队的整合,将独立的字节AI Lab并入Seed团队。这一举措体现了字节在AI领域
QwenChat上线网页开发Web Dev功能 可一句话生成精美网页
近日,人工智能领域迎来创新突破,QwenChat 正式上线其网页开发(Web Dev)功能。这一功能的推出,让不具备编程技能或设计经验的用户也能轻松创建网站页面,真正实现了“AI写网页”的愿景。据介绍,用户仅需在 QwenChat 中输入一句自然语言指令,例如“创建一个水果电商网站”,系统便能自动解析指令并生成结构清晰、风格美观的网页代码。生成的网页不仅支持直接预览,还能根据用户需求进行进一步调整
Synaptics 推出首批两款 Veros 系列 IoT Wi-Fi 7 SoC,集成蓝牙、Zigbee 支持
IT之家 4 月 28 日消息,Synaptics 新突思宣布,其 IoT 无线连接芯片家族 Veros 迎来首批两款支持 Wi-Fi 7 (802.11be) 规范的 SoC,分别是 SYN4390 和 SYN4384。这两颗芯片均支持三频 Wi-Fi 7 连接并同时集成了蓝牙 6.0 和 802.15.4 (Zigbee / Thread) 功能,且符合 Matter 协议,降低了 IoT
RWKV7-G1 1.5B全球语言推理模型发布 支持100多种自然语言
4月29日,RWKV基金会宣布开源发布了RWKV7-G11.5B推理模型,这是一款具备强大推理能力和多语言支持的模型,特别适合在端侧设备(如手机)上运行。该模型基于World v3.5数据集训练,包含小说、网页、数学、代码和推理数据,总数据量达到5.16T tokens。RWKV7-G11.5B模型在推理逻辑性方面表现出色,能够完成多语言、数学和代码任务。其英语和多语言能力显著强于同规模的开源模型
Youware重磅更新:MCP加持一键生成复杂网页,AI建站进入新时代!
人工智能驱动的网页开发工具Youware近日迎来重大更新,通过深度集成Model Context Protocol(MCP),显著提升了网页生成的能力与效率。用户仅需简单提示,即可从Figma读取设计稿、从Hugeicons获取图标,并结合FLUX生成高质量图片,轻松打造复杂网页。这一更新不仅解决了AI建站中的素材挑选与上传难题,还推出了积分系统和社区功能,为用户带来更便捷的创作体验。AIbase
Aether – 上海 AI Lab 开源的生成式世界模型
Aether是什么Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建、动作条件视频预测和目标导向视觉规划三大核心能力。Aether 能感知环境、理解物体位置和运动关系,做出智能决策。Aether 在真实世界中展现出强大的零样本泛化能力,使用虚拟数据训练完成高效完成复杂任务,为具身智能系统提供强大
如何减轻AGI 代理带来的风险
AGI 因其无需人类监督就能独立应对外部环境的能力而构成威胁。然而,人们不愿放弃将相关任务外包给 AI 代理所带来的好处。怎样才能解决这个矛盾呢?长话短说:虽然人工智能代理可以安全地达到 AGI 级别,但它们应该在明确定义的环境中进行训练——理想情况下仅限于单个团队,或者最多一个组织。它们的行动也必须严格限制在这个狭窄的范围内。当涉及到个人的狭隘情境时,AGI 代理会对其自身构成风险
联想Lecoo战者G1智能体AI眼镜首发1999元:搭载天禧个人智能体
快科技5月11日消息,联想Lecoo斗战者G1智能体AI眼镜目前已经上市,预约价1999元。据悉,这款产品搭载天禧个人超级智能体,天禧的突破在于,它首次将感知、认知、决策与自主演进能力深度融合,形成了一套完整的人工智能双胞胎”逻辑。支持AI翻译/AI对话/AI识图,通过Hi小天”启动多模态AI助手。同时,这款眼镜还有第一代骁龙AR1平台加持,该平台能够支持直接从眼镜侧进行拍摄、分享或者直播,从
AI漫剧卷起来了:单帧低至1毛钱,15人3天可产出一部
一站式AI漫剧生成被各方押宝 1人,1天,1-2分钟产出 进一步降本增效‘数字横店’兴起“这样的画面只抽了一次就可以(得到想要的画面)。“巨日禄科技的CEO斯宇告诉短剧自习室。哪怕抽卡次数稍多一些,如果按照一分钟视频由20个分镜组成,成本也可以压到200元,那么部分镜头单帧几乎能低至1毛钱。(《阈界锁妖局》相关动图)上述画面是在巨日禄AI动漫创作平台上生成的,集合了多个角色、有流畅互动、在特定的
用户提问方式影响AI模型准确性,简洁回答易导致错误信息
近期,法国人工智能研究机构 Giskard 进行了一项关于语言模型的研究,结果表明,当用户要求简短回答时,许多语言模型更可能生成错误或误导性的信息。该研究使用了多语言的 Phare 基准测试,专注于模型在现实使用环境中的表现,尤其是它们所产生的 “幻想” 现象。幻想指的是模型产生虚假或误导性内容的情况,而先前的研究显示,这一问题占据了大型语言模型所有记录事件的三分之一以上。图源备注:图片由AI生成
终于有个不瞎编的旅游AI了。
声明:本文来自于微信公众号数字,授权站长之家转载发布。马上五一了,我也在准备着出去旅游的事,本来在用GPT做着蹩脚的旅游攻略。结果,昨天,好多人跑来找我,要一个神奇产品的邀请码。飞猪问一问。给我整不会了。我打开飞猪,才看到,他们偷摸更新了,在左上角放了一个问一问的入口,但是点进去要邀请码,于是我又拜托阿里的朋友,帮我搞了一个邀请码,才顺利进去。这个功能,大概就是提出行要求,飞猪的问一问,直接根