超强AI电商购物助手!Add To Cart AI:可理解文本、语音、图像,帮用户找到产品

在当今快速发展的电商行业中,AI电商购物助手发展也备受关注。Add To Cart AI 是一款专为电商平台设计的 AI 驱动购物助手,旨在帮助消费者更快找到心仪产品,同时提升商家的转化率和销售额。它可以理解文本、语音、图像甚至实时视频的代理。Add To Cart AI 的最大亮点在于它能够瞬间将购物清单、聊天记录和图片转化为完整的购物车。这意味着消费者在寻找心仪商品时,无需繁琐的操作,只需提供

苹果研究破解 AI“英语口音”难题,提升多语言自然性

IT之家 5 月 17 日消息,苹果与多国高校及研究院联合发布最新成果,揭示了大语言模型存在的“英语思维定式”问题,并提出创新解决方案。IT之家注意到,科研人员中不乏中国学者的存在。研究人员针对非英语语种输出中普遍存在的语法与词汇偏差问题展开了深度剖析,测试覆盖中文、法语、英语(基于维基百科)语料。测试发现,即使专为中文优化的 Qwen 模型,其母语表现仍落后人类水平;Meta 的 Llama

百度智能云千帆大模型平台、文小言接入DeepSeek-R1-0528模型

百度智能云千帆大模型平台正式上架了 DeepSeek 最新的 R1-0528大模型。这一重要更新于5月29日上线,旨在为企业和用户提供更强大的 AI 能力和支持。千帆模型开发平台不仅上架了这一全新大模型,还同步推出了一系列实用功能,包括批量推理、模型评估、推理日志挖掘分析以及模型蒸馏。这些功能为企业用户提供了全面的工具链,帮助他们构建专属的大模型,满足不同场景下的需求。图源备注:图片由AI生成,图

Moonshot AI发布Kimi-Audio:开源音频基础模型树立新标杆

近日,Moonshot AI正式宣布推出Kimi-Audio,一款全新的开源音频基础模型,旨在推动音频理解、生成和交互领域的技术进步。这一发布引发了全球AI社区的广泛关注,被认为是多模态AI发展的重要里程碑。以下是对Kimi-Audio核心特性、性能表现及行业影响的全面报道。突破性特性:全能音频处理能力Kimi-Audio-7B-Instruct基于Qwen2.5-7B架构,并结合Whisper技

面壁智能推出MiniCPM 4.0端侧大模型 可实现220倍速度提升

6月6日,面壁智能正式推出其最新力作——MiniCPM4.0系列模型,这一系列被誉为“有史以来最具想象力的小钢炮”,不仅在端侧性能上实现了飞跃,更在技术创新上树立了新的标杆。MiniCPM4.0系列包含两款重量级产品:一款是8B闪电稀疏版,以其创新稀疏架构掀起高效风暴;另一款则是仅0.5B的轻巧灵动版,被誉为“最强小小钢炮”。这两款模型在速度、效能、性能及落地应用上均展现出卓越表现。在速度方面,M

​亚马逊 AI 视频模型 Nova Reel 升级:可生成长达两分钟的视频片段

亚马逊近日对其 AI 视频生成模型 Nova Reel 进行了升级,推出了 Nova Reel1.1版本。这个新版本不仅能够生成长达两分钟的视频片段,还可以制作多镜头视频,使得各个镜头之间的风格保持一致。Nova Reel 于2024年12月首次发布,是亚马逊在生成视频领域的重要尝试。据 AWS 开发倡导者 Elizabeth Fuentes 在一篇博文中透露,用户可以通过提供最长4,000个字符

​Nest 音响现蓝紫渐变灯光,Google Gemini 助手正在测试中

近期,许多用户在 Reddit 上分享了他们的 Nest Audio 扬声器显示出蓝色和紫色渐变灯光的体验,这与平时的白色 LED 灯光形成了鲜明的对比。这一新变化引起了广泛的关注,许多用户纷纷表示也看到了这种色彩变化。根据9to5Google 的报道,谷歌正在逐步推出其新一代 AI 助手 ——Gemini,并计划逐步取代现有的 Google Assistant。谷歌自去年12月开始在 Nest

AI数字人助力PPT展示,SlidesOrator在BEYOND Expo崭露头角

在近日举行的 BEYOND Expo 展会上,SlidesOrator 项目引起了与会者的广泛关注。这一新颖的工具不需要高端的机械设备或虚拟现实眼镜,展台简约却不失亮点,直接聚焦于每一位职场人士都能感同身受的一个核心问题:如何更好地展示 PPT。SlidesOrator 的理念与其功能紧密相连,它的目标不仅是帮助用户快速制作 PPT,更在于通过 AI 技术将演讲变得 “自动而可信”。与传统的 PP

Console获得 620 万美元融资,利用 AI 解放 IT 团队的重复任务

在现代职场中,IT 支持的重要性不言而喻。每当员工遇到电脑被锁或无法访问应用程序的情况时,他们总是急切希望能联系到 IT 支持。然而,帮助台工作人员常常忙于处理其他请求,这可能导致员工无法及时获得所需的支持。图源备注:图片由AI生成,图片授权服务商MidjourneyAndrei Serban 曾是 Rippling 应用程序和集成团队的产品负责人,他在2023年被 Rippling 收购之前曾创

Gemini 2.5 Pro (I/O 版) – 谷歌推出的升级版多模态AI模型

Gemini 2.5 Pro (I/O 版)是什么Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型,具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破,擅长构建交互式 Web 应用、游戏和模拟程序。用户仅需提供提示词或手绘草图加功能描述,能快速生成功能完备的应用。Gemi

【高考季】用数据和AI重新定义高考志愿推荐

近几年的高考季,城市数据团都会推出一些相关的研究。三年前,我们在《今年报考的热门专业,四年后会变成“天坑”吗?》一文中,计算了不同专业的溢价,以及各个专业在市场上的工资溢价和专业本身考分热门程度之间的关系,发现热门专业在就业市场上确实会带来更高溢价,不过这个溢价率会随时间变化——刚毕业时,热门专业毕业生的工资确实更高;毕业几年后,大家在一定程度会到同一条起跑线附近;而毕业多年后,热门专业毕业生的

AI搜索初创公司Perplexity 即将完成5亿美元融资,估值达140亿美元

人工智能搜索初创公司 Perplexity 正在接近其六个月内的第二次融资,估值达到140亿美元。这一轮融资将由风险投资公司 Accel 领投,预计金额将达到5亿美元。Perplexity 以其先进的人工智能搜索技术受到市场的广泛关注,正逐渐成为行业内的一匹黑马。图源备注:图片由AI生成,图片授权服务商MidjourneyPerplexity 成立于不久前,但凭借其创新的技术和市场定位,吸引了大量

这届机器人太会了!百事蓝宝出道,人形机器人也开始卷情绪价值了

百事可乐首个人形机器人「百事蓝宝」正式C位出道!现场与大卫·贝克汉姆、智元机器人联合创始人兼首席技术官彭志辉同框互动,进行传统文化太极表演,这一出场,瞬间刷屏社交媒体,让人切实感受到:机器人不仅能说会道,更能成为品牌传递情绪价值的新出口。2025年,人形机器人强势霸屏,一跃成为圈内「顶流」选手。春晚走一遭,半马当个「领跑员」,还要拳击擂台来一场「人机对决」——科技圈全线高能,网友一边吃瓜一边感叹

英伟达等巨头联手打造欧洲最大AI园区,计划 2028 年投入运营

近日,阿布扎比的 AI 投资基金 MGX、法国国家投资银行、AI 初创公司 Mistral AI 与科技巨头英伟达宣布了一项重磅合作计划,目标是在巴黎地区建立欧洲最大的人工智能园区。该项目的初步规划显示,园区的最终装机容量预计将达到1.4吉瓦,规模之大让人期待。这个新 AI 园区的建设预计将于2024年下半年正式启动,并计划于2028年投入运营。项目的合作伙伴不仅包括 MGX、Mistral AI

微软Power Apps引入AI助手,简化表单填写流程

在数据录入日益繁重的今天,微软 Power Apps 和 Dynamics365的最新更新为用户提供了一种全新的填表体验。借助 AI 助手,数据录入变得更加迅速和高效。据一项针对信息工作者的研究显示,使用 AI 辅助后,表单填写速度提升了29%,并且95% 的参与者更倾向于使用这种自动化方法而非传统的手动录入。微软此次推出的四项强大新功能,将进一步增强用户的灵活性、可视性和输入选项。首先,新推出的

马斯克 AI 超算细节曝光:已投资 4 亿美元,百万 GPU 电力缺口大

北京时间 4 月 2 日,埃隆・马斯 (Elon Musk) 曾表示,他的人工智能创业公司 xAI 将在美国田纳西州孟菲斯市建造世界上最大的超级计算机。《商业内幕》看到的文件显示,该公司正为此投入数亿美元,但面临较大的电力缺口。马斯克自 2024 年 6 月该项目首次宣布以来,xAI 已经向孟菲斯规划与发展机构提交了 14 份建筑许可证申请,总预估成本为 4.059 亿美元 (约合 29 亿元人