Docker化PDF布局分析服务发布,OCR、分段、分类与排序一站式解决
近日,一项名为“PDF Document Layout Analysis”的全新Docker化服务正式上线,标志着PDF文档解析技术迈向更高效、可扩展的新阶段。这一服务旨在通过智能算法和容器化部署,帮助用户快速分离和分类PDF文档中的文本、表格和图像等元素,为企业、开发者及研究人员提供便捷的解决方案。技术亮点:精准解析与高效部署该服务基于先进的机器学习模型开发,利用DocLayNet等专业数据集进
Meta推AI系统MoCha:文字秒变生动动画角色,口型动作自然流畅
Meta联合滑铁卢大学的研究人员近日共同发布了一款名为 MoCha 的全新 AI 系统,能够通过简单的文本描述生成带有同步语音和自然动作的完整动画角色。这一创新技术有望极大地提升内容创作的效率和表现力,并在多个领域展现出巨大的应用潜力。打破传统,全身动画与精准口型同步与以往侧重于面部表情的 AI 模型不同,MoCha 的独特之处在于能够渲染全身的自然运动。无论是从近距离还是半近距离拍摄,系统都能根
Krea整合Gemini文字生图与图像编辑功能:Chat界面迎来实用性飞跃
近日,人工智能创意平台Krea宣布成功接入Google Gemini的文字生成图像(Text-to-Image)及图像编辑功能,进一步提升了其平台的生成能力和用户交互体验。据悉,这一更新显著增强了Krea Chat界面的实用性,使其从单一的对话工具转变为一个集图像生成与编辑于一体的综合性创作平台。这一进展被视为Krea在AI驱动的创意设计领域迈出的重要一步,引发了业界和用户的广泛关注。Krea此前
GPT-4.5功臣遭驱逐,奥特曼盛赞工作出色,美国深陷AI人才危机
声明:本文来自于微信公众号新智元,授权站长之家转载发布。近日,GPT-4.5核心开发者之一的Kai Chen因绿卡申请被拒,面临被迫离开美国的困境。与此同时,1700多名国际学生和研究人员因签证审查受阻,Nature调查显示75%的美国科学家正考虑逃离。这种人才流失或将影响美国在全球AI领域的领先地位。GPT-4.5的核心研发成员,竟然要被驱逐出美国?!OpenAI著名研究科学家Noam Br
Fox展示精简策略,借助AI工具提升广告价值
在最近的广告发布会上,Fox 媒体公司以其精简的业务结构引起了业界的关注。与许多其他公司,如 NBCUniversal,正在努力削减因收视率下降而带来的线性资产不同,Fox 则明确表示,自己并不需要依赖传统的优质节目库存来吸引广告商。根据 Fox 广告销售、市场营销与品牌合作总裁杰夫・柯林斯(Jeff Collins)的说法,Fox 已经主动剔除了那些不必要的内容,因此能够为广告商提供更高效的选择
RobotLAB 正式推出其首款人形机器人 BroBot™
全球领先的机器人集成与人工智能自动化公司 RobotLAB 正式推出其首款人形机器人 BroBot™。这一第一代机器人旨在为教育、物流和酒店等多个行业提供可扩展的现实世界部署,标志着人形机器人功能的一次重大进步。BroBot™被设计成能够在动态和不可预测的环境中运行,采用了混合模拟 - 数字接口、自动任务协议和情境感知系统,使其能够在最少监督的情况下执行重要任务。它友好、适应性强的设计使得 Bro
三星进军 AI 机器人领域,Ballie 本周公开亮相
IT之家 4 月 9 日消息,三星公司昨日(4 月 8 日)通过官方 Instagram 平台,预告将于本周在某个舞台上,展示 Ballie 机器人,可能会公布该机器人的发售细节。Ballie 是一款深度集成 SmartThings 平台的 AI 伴侣机器人,配备摄像头和迷你投影仪,能够在家中跟随用户,它不仅能够提供天气预报、播放电影、展示三星健康数据,还能协助管理购物清单、控制智能家居设备等。
Anthropic拒绝为Windsurf提供Claude Sonnet 4与Opus 4支持,商战大戏开演!
Anthropic在Code with Claude开发者大会上宣布,其最新模型Claude Sonnet4和Claude Opus4已全面上线,但明确拒绝为编码工具Windsurf提供直接支持,导致Windsurf成为唯一无法使用Claude4系列模型的AI编码平台。此举引发了开发者社区的广泛热议,并被认为是AI市场竞争加剧的信号。AIbase综合最新社交媒体动态,深入解析这一事件的技术背景及其
谷歌AI大显身手:诈骗行为减少 80%,保障网络安全新举措来袭
谷歌公司近日在其官方博客上公布了最新成果,强调通过 AI 技术在打击网络诈骗方面取得的显著成效。根据谷歌发布的《Fighting Scams in Search》报告,诈骗行为,尤其是冒充航空公司客服的骗局,在谷歌搜索引擎中的出现频率减少了超过80%。这一成就标志着谷歌在保护用户安全和维护网络环境方面迈出了重要一步。为进一步加强用户的安全防护,谷歌在其 Chrome 浏览器中推出了 “Enhanc
Anthropic 全新 AI 模型 Claude Neptune 即将亮相,竞逐市场巨头
科技媒体 testingcatalog 发透露了 AI 公司 Anthropic 正在研发的新模型 Claude Neptune 的相关信息。目前,这一新 AI 模型已进入内部安全测试阶段,预计将与 OpenAI 的 GPT-5及谷歌的 Gemini Ultra 展开竞争。根据博文的介绍,Claude Neptune 的安全测试正在使用 Anthropic Workbench 平台进行。这一阶段主
Infosys 携手 Formula E 推出 AI 驱动的数据中心,提升车迷互动体验
Infosys与国际汽联 Formula E 世界电动汽车锦标赛合作推出了一款名为 “Formula E Stats Centre” 的 AI 分析平台。这一创新平台旨在为车迷提供实时的赛事分析,帮助他们更好地了解自己喜欢的车队和车手的表现。“Formula E Stats Centre” 采用Infosys的 AI 解决方案,通过实时赛事信息、互动统计数据和 AI 生成的摘要,极大地提升了车迷的
OpenAI重组计划被迫改变:继续由非营利组织控制
人工智能研究机构OpenAI于本周一做出重大治理调整,终止其营利性实体控制机制,重新确立由创始非营利董事会主导的管理架构。此举被外界视为对埃隆·马斯克等长期批评者的直接回应,这些批评者认为OpenAI近年来逐渐偏离了安全开发AGI(通用人工智能)以造福人类的初心。根据新的架构方案,OpenAI将把2019年设立的营利性业务部门改组为公益公司(Public Benefit Corporation
OpenAI 视频生成工具 Sora 遭曝光:种族与性别偏见问题凸显
近年来,生成式人工智能(AI)技术的迅猛发展改变了数字内容创作的面貌,但偏见问题始终伴随其中。最近,《连线》杂志对 OpenAI 旗下的视频生成工具 Sora 进行了深入调查,结果发现该工具在生成视频时常常会强化种族、性别和能力方面的刻板印象,甚至有时忽视了对某些群体的表现。图源备注:图片由AI生成,图片授权服务商Midjourney在调查中,研究人员给 Sora 提供了25个基本的提示,例如 “
苏州发布12条强农措施,百万元补贴“农业大模型”
近日,苏州市正式发布了一系列针对农业科技发展的新政策,《关于促进苏州市科技强农的若干措施》包含12条具体措施,旨在通过技术创新提升农业生产力和农民收入。这些政策不仅涵盖了种源保护和耕地质量的提升,还积极推动人工智能与农业的深度结合。在种源保护方面,苏州将每年拨出专项资金支持农业种质资源的保护与利用,并对经过国家和省级审定的新作物品种,给予最高30万元的奖励。此外,对于新培育的畜禽和水产品种,奖励金
AI与自动驾驶融合:蘑菇车联在海口打造智能交通新体验
近日,第五届中国国际消费品博览会在海口市隆重开幕。在这一盛会上,蘑菇车联(Mogo AI)携手海南省工业和信息化厅、海口市人民政府及海南省高速公路有限公司,共同推出了一项引人注目的示范项目。这一项目的核心是将 AI 大模型应用于智能交通,展示一个 “全场景、多功能” 的车路云一体化解决方案。图源备注:图片由AI生成,图片授权服务商Midjourney在海口的环岛旅游公路上,蘑菇车联特意设立了两个
知名开源大模型平台Hugging Face进军机器人领域,收购Pollen Robotics
近日,人工智能开发平台 Hugging Face 正式宣布收购法国人形机器人初创公司 Pollen Robotics,标志着其进军机器人领域的战略布局。这笔交易的具体尚未透露,但引发了广泛关注。Pollen Robotics 成立于2016年,由马修・拉皮埃尔和皮埃尔・鲁安奈两位工程师创立。该公司的核心产品 Reachy2是一款先进的人形机器人,已经在康奈尔大学、卡内基梅隆大学等多个顶尖实验室中应