国内首个光子芯片专用大模型问世,南智光电引领智能研发新潮流 172 0 在光子芯片技术领域,中国又迎来了一个重要的里程碑。5月12日,南智光电正式发布了国内首个光子芯片专用大模型 ——OptoChat AI。这一创新成果将显著推动我国光子芯片的研发进程,标志着研发方式的重大转变。光子芯片作为现代光电与微电子技术交汇的前沿技术,一直以来都面临着研发效率低下的难题。南智光电的副总经理潘涛指出,传统的研发模式往往依赖工程师查阅大量文献或咨询专家,费时又费力。而 OptoCh
输入一句话,输出一套乐高设计!CMU 开源 LegoGPT AI 项目 203 0 卡内基梅隆大学研究团队发布一项创新性人工智能项目——LegoGPT,该模型可根据自然语言文本自动生成可拼搭的乐高积木设计。项目已在 GitHub 开源,用户可自由下载模型与数据集进行尝试和拓展。LegoGPT 由自回归大型语言模型驱动,训练数据包括超过47,000块乐高积木组成的28,000多个独特3D 对象。用户只需输入如“一个吉他造型”这样的文本提示,模型便能生成结构合理、可稳定搭建的乐高拼搭
苹果发布FastVLM模型,可在iPhone上运行的极速视觉语言模型 144 0 苹果正式发布FastVLM,一款专为高分辨率图像处理优化的视觉语言模型(VLM),以其在iPhone等移动设备上的高效运行能力和卓越性能引发行业热议。FastVLM通过创新的FastViTHD视觉编码器,实现了高达85倍的编码速度提升,为实时多模态AI应用铺平了道路。技术核心:FastViTHD编码器与高效设计FastVLM的核心在于其全新设计的FastViTHD混合视觉编码器,针对高分辨率图像处
Kimi入驻小红书,AI大模型从“投流大战”转向内容深耕 72 0 近日,月之暗面旗下大模型产品 Kimi 宣布与小红书达成最新合作,在“小红书·Kimi智能助手”账号中上线对话入口,用户可通过跳转进入对话界面,并一键生成笔记。然而,“硅基研究室”实测发现,该入口目前仅作为轻量化的访问渠道存在,与小红书平台其他入口尚未形成深入整合。早在2024年,小红书就已参与Kimi母公司10亿美元A轮融资,双方曾联合推出“AI新手村”活动。此次上线入口,被视为Kimi在流量焦
亚马逊展示机器人时代下人类新角色的前景 137 0 在当今科技行业,关于人类在日益自动化的世界中所扮演的角色,出现了两种截然不同的观点:一种认为除了他们自己,其他所有工作都将被机器人取代;另一种则认为机器人会承担那些乏味和重复的工作,而人类将负责新的工作类型。根据世界经济论坛的预测,虽然当前的技术趋势将导致9200万个职位消失,但也将创造1.7亿个新工作岗位。图源备注:图片由AI生成,图片授权服务商Midjourney然而,对于那些没有经济实力或对
苹果放大招!FastVLM 让视觉语言模型在 iPhone 上飞速 “狂飙” 119 0 苹果最近又搞了个大新闻,偷偷摸摸地发布了一个叫 FastVLM 的模型。听名字可能有点懵,但简单来说,这玩意儿就是让你的 iPhone 瞬间拥有了“火眼金睛”,不仅能看懂图片里的各种复杂信息,还能像个段子手一样跟你“贫嘴”!而且最厉害的是,它速度快到飞起,苹果官方宣称,首次给你“贫嘴”的速度比之前的一些模型快了足足85倍!这简直是要逆天啊!视觉语言模型的 “成长烦恼”现在的视觉语言模型,就像个不断
Reddit因AI实验受挫,强化用户身份验证 200 0 近日,Reddit 因一项未经授权的 AI 实验而采取了强硬措施,决定对相关研究团队实施禁令。该实验由苏黎世大学的研究人员进行,持续了四个月,目的是在热门的 r/changemyview 论坛上部署 AI 代理。这些 AI 代理假装成创伤幸存者、政治人物等,试图通过个性化、具说服力的评论来影响用户的观点,而这一切都是在没有透露其非人类身份的情况下进行的。事件的曝光在 Reddit 社区内引起了强烈
小红书整治AI技术滥用,聚焦用AI起号引流带货、售卖AI账号 140 0 小红书发布了关于整治AI技术滥用的治理公告,公告称,为维护清朗网络空间,营造积极健康、文明和谐的社区环境,小红书积极响应中央网信办、上海市委网信办关于“清朗·整治AI技术滥用”专项行动的要求,重点聚焦利用AI批量生产虚假内容涨粉、利用AI起号引流带货、售卖AI起号课程、售卖AI账号等违规行为开展专项整治工作,切实履行平台责任,深入清理违规问题。本阶段具体治理情况如下:针对“利用AI生成低俗猎奇视
火屋潜水艇:Momos AI平台助力北美1350家餐厅转型升级 199 0 Momos 公司近日宣布,其人工智能(AI)客户助理平台已在北美超过1350家火屋潜水艇(Firehouse Subs)餐厅上线。这一创新技术旨在为多地点品牌提供全面的客户管理解决方案,涵盖声誉管理、客户体验、客户服务和市场营销等多个方面,帮助餐厅实现全面数字化转型。火屋潜水艇是一家总部位于佛罗里达州杰克逊维尔的快餐连锁店,以其独特的潜艇三明治而闻名。该品牌由消防员兄弟克里斯和罗宾・索伦森于199
突破性技术MCA-Ctrl:中科院团队引领AI图像定制化新范式 172 0 中国科学院计算技术研究所研究团队近日推出的MCA-Ctrl技术在生成式AI领域引发广泛关注,这一文本到图像(T2I)新方法正为图像定制化市场带来革命性变革。在个性化需求日益增长的当下,该技术通过独特的多方协同注意力控制机制,让用户无需繁琐的模型微调,即可根据文本或图像条件生成高度个性化的图像内容。MCA-Ctrl最大的技术亮点在于其三大核心应用能力:主题替换、主题生成和主题添加。这意味着用户可以在
ChatGPT推出全新PDF导出功能,优化深度研究报告体验 133 0 ChatGPT 最近推出了一项备受期待的新功能 —— 用户现在可以将深度研究(Deep Research)报告直接导出为 PDF 格式。这一功能的推出,旨在解决用户在复制报告内容时格式丢失的问题,让研究成果的分享变得更加简便。ChatGPT 的深度研究功能利用先进的自动化技术,用户只需输入相应的提示词,系统就能够独立进行复杂的多步骤研究。它可以快速扫描互联网,整合来自数百个网站的信息,并生成一份详
腾讯混元T1-Vision上线元宝 可深度理解图片内容 72 0 近日,腾讯混元T1-Vision上线元宝,“元宝”通过其独特的Hunyuan T1-Vision模型,能够深度理解图片内容,精确捕捉信息背后的关键点。用户只需拍摄一张图片并上传,无论是不常见的花草品种、复杂的外文游戏界面,还是需要深度分析的决策场景,“元宝”都能在短时间内给出详细的解答和分析。这一功能不仅极大地简化了用户获取信息的流程,还提升了信息获取的准确性和效率。在实际应用中,“元宝”展现了其
谷歌Gemini 谷歌AI聊天机器人 谷歌AI 安卓生态系统 谷歌扩展Gemini的“AI帝国”,涵盖汽车、手表和电视 117 0 谷歌将其人工智能(AI)Gemini 广泛应用于采用安卓操作系统(OS)的各类设备。如今,在 Galaxy 手表或汽车中也能唤醒 Gemini 并下达详细指令。当地时间 13 日,谷歌通过YouTube发布了展示节目《Android Show:I/O Edition》,在年度开发者大会I/O前夕单独发布了 Android 相关更新。主要是展示在现有的安卓设备上搭载 Gemini。首先,计划在年
Epoch AI 预言:最快 1 年内,推理模型步伐将放缓 79 0 IT之家 5 月 14 日消息,非营利 AI 研究机构 Epoch AI 最新发布报告,指出 AI 企业难以从推理模型中,持续榨取巨大性能收益,最快在一年内,推理模型的进步将放缓。报告基于公开数据和假设,强调了计算资源的限制和研究开销的增加。AI 行业长期依赖这些模型来提升基准表现,但这种依赖性正面临挑战。该机构分析师 Josh You 指出推理模型的兴起,源于其在特定任务上的出色表现。例如,O
软银认可OpenAI重组计划,微软态度成关键 91 0 OpenAI 最近宣布将进行一项重要重组,以确保其非营利实体能够保留最终控制权。这一消息在上周引发了广泛关注,而日本科技巨头软银作为 OpenAI 的主要投资者之一,近日也公开表示支持这一计划。软银的认可显得尤为重要,因为他们此前曾表示,投资 OpenAI 的300亿美元必须以其结构调整为前提。回顾今年3月,OpenAI 成功完成了一轮400亿美元的融资,其中300亿美元来自软银。然而,软银曾警告
谷歌Android Auto迎来Gemini AI,打造更智能车载体验 147 0 在2025年 I/O 开发者大会前夕的 Android Show 上,谷歌宣布将在未来几个月内把其强大的生成式人工智能模型 Gemini 整合到所有支持 Android Auto 的汽车中。该功能稍后也将扩展到运行谷歌内置操作系统的汽车。谷歌表示,此举旨在让驾驶体验“更高效、更有趣”,预示着车载交互方式的重大变革。Android for Cars 副总裁帕特里克·布雷迪 (Patrick Brad