程序员们又有新工具可以欢呼了!由 OpenHands、耶鲁大学、南加州大学和斯坦福大学的研究团队联手推出的 LocAgent,正是一个专门为代码定位而设计的图索引大语言模型(LLM)代理框架。令人振奋的是,LocAgent 的代码定位准确率达到了92.7%,这一新高度将在2025年 ACL 会议上正式亮相。
程序员在工作中常常会遇到难以定位代码问题的困扰。例如,在处理一个 bug 报告时,可能会陷入「这到底要改哪里?」的迷茫。而传统的代码定位方法,通常要么是粗糙的关键词匹配,要么是低效地将整个代码库交给 LLM 处理,甚至还有让 Agent 盲目遍历目录的情况。实际上,自然语言中的问题描述与真实的代码位置之间往往隔着多层复杂的调用关系。这种情况下,准确定位问题代码显得至关重要。
LocAgent 的创新之处在于其将整个代码库解析成一个包含文件、类和函数之间关系的图。这一图结构不仅能显著提高代码的检索效率,还让 LLM 能够更好地在复杂的代码库中进行推理与搜索。该系统采用了分层稀疏索引,使得 LLM 在定位代码时如同使用地图般便捷,能够快速接近目标。
LocAgent 还提供了一套简单易用的工具接口,供 LLM Agent 查询代码图结构,包括关键字搜索、信息提取和图遍历等功能。这些工具让 Agent 能够逐步推理,深入理解问题并锁定需要修改的代码位置。根据最新的实验证明,LocAgent 在 SWE-Bench Lite 等数据集上表现出色,准确率远超传统方法。
LocAgent 以其卓越的性能和简便的操作,为程序员们解决了长久以来的代码定位难题,极大地提升了开发效率。
发表评论 取消回复