LocAgent OpenHands 大语言模型 ACL会议 新神器LocAgent发布,代码定位准确率高达92.7%,程序员的福音! ⭐0 👥0 程序员们又有新工具可以欢呼了!由 OpenHands、耶鲁大学、南加州大学和斯坦福大学的研究团队联手推出的 LocAgent,正是一个专门为代码定位而设计的图索引大语言模型(LLM)代理框架。令人振奋的是,LocAgent 的代码定位准确率达到了92.7%,这一新高度将在2025年 ACL 会议上正式亮相。程序员在工作中常常会遇到难以定位代码问题的困扰。例如,在处理一个 bug 报告时,可能会陷入
Llama3.1NemotronUltra253B 英伟达 大语言模型 AI 英伟达震撼发布Llama 3.1 Nemotron Ultra 253B:AI性能王者再定义行业新标杆 ⭐0 👥0 近日,全球芯片与AI技术巨头英伟达(NVIDIA)推出了一款全新开源大语言模型——Llama3.1Nemotron Ultra253B,引发了人工智能领域的强烈反响。这一模型基于Meta的Llama-3.1-405B打造,通过创新技术优化,不仅在性能上超越了Llama4Behemoth和Maverick等强劲对手,还以高效的资源利用率和卓越的多任务能力,为AI应用的广泛落地提供了新的可能。Llam
大语言模型 Anthropic 电路追踪 AIbase Anthropic重磅开源!“电路追踪”工具解锁AI大脑,揭秘大模型决策全过程 ⭐0 👥0 近年来,大语言模型(LLM)的快速发展为人工智能领域带来了前所未有的突破,但其内部决策过程却常常被视为“黑盒子”,难以捉摸。5月29日,AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具,为破解大模型的内部工作机制提供了全新视角。这一工具不仅能帮助研究人员深入探索AI的“思考”过程,还为推动更透明、可控的AI发展迈出了重要一步。以下
SYMPLEX mRNA加帽酶 功能基因挖掘 大语言模型 北大研发全球首个基因挖掘大模型 SYMPLEX,助力生物制造新时代 ⭐0 👥0 近日,北京大学定量生物学中心的钱珑团队成功研发出全球首个专门用于功能基因挖掘的大语言模型 SYMPLEX。这一创新的模型能够从海量的生物文献中高效筛选出具有特定功能的关键基因,推动生物科技的发展。SYMPLEX 的问世,标志着基因挖掘技术进入了一个全新的阶段。团队利用这一模型,进行 mRNA 加帽酶基因的挖掘,并取得了显著的成果:新发现的加帽酶活性远超目前用于 mRNA 疫苗生产的商业化酶。这一成
DeepSeek-R1-0528 DeepSeek 大语言模型 LiveCodeBench 正式开源!DeepSeek-R1-0528震撼发布,性能直逼OpenAI o3,免费API已上线 ⭐0 👥0 近日,AI领域迎来重磅消息!中国AI初创公司DeepSeek正式发布了其开源大语言模型 DeepSeek-R1-0528的最新版本。这一更新不仅在性能上实现了重大突破,还通过免费API的提供进一步推动了AI技术的普及与应用。以下,AIbase将为您详细解析此次更新的亮点与意义。性能飞跃:LiveCodeBench表现媲美o3高级版根据最新消息,DeepSeek-R1-0528在LiveCodeBe
Qwen3 阿里云 大语言模型 vLLM Qwen3即将来袭:阿里云新模型相关支持已正式合并至vLLM代码库 ⭐0 👥0 近日,阿里云旗下人工智能大模型系列Qwen迎来重要进展,其下一代模型Qwen3的相关支持已正式合并至vLLM(高效大语言模型推理框架)的代码库中。这一消息迅速引发了科技圈的热烈讨论,标志着Qwen3的发布已进入倒计时阶段。据悉,Qwen3将包含至少两个版本:Qwen3-8B和Qwen3-MoE-15B-A2B,分别代表不同规模和架构的创新尝试,为开发者与企业用户带来了更多期待。Qwen3-8B作为
豆包1.5·深度思考模型 边缘大模型网关 火山引擎 大语言模型 豆包 1.5 · 深度思考模型上线边缘大模型网关 可免费领百万Tokens ⭐0 👥0 4月25日,字节跳动旗下的火山引擎宣布,其最新发布的豆包1.5·深度思考模型已全面上线边缘大模型网关,并为用户提供高达500万tokens的免费使用额度,这一举措在AI领域引起了广泛关注。豆包1.5·深度思考模型是火山引擎推出的高性能AI模型,它在数学、代码和科学等专业领域的推理任务中表现卓越,已达到或接近全球顶尖水平。该模型不仅在推理任务中表现出色,在创意写作等非推理任务中也展现出强大的泛化能力