项目太大,AI无法理解?试试这3种思路

上周六的活动中交流了一个问题:如何解决 AI 在大项目理解中的瓶颈

活动结束后,我一直在思考,这个场景确实是个非常普遍的痛点,很可能会造成原本很好的工具无法使用。

于是,我决定好好的研究下,今天,就把目前的思考内容和大家分享下,抛砖引玉。

处理大项目的思路

首先,有一个背景,我们需要达成一致。

在超级模型出现前,将整个项目代码一次性塞入 AI 中是不现实,现有思路的关键都在于如何更加精确、动态地找到回答问题所需的代码片段

整理了如下几个思路:

  • 人工划分降低理解难度
  • 借助工具实现代码图谱
  • Claude Skills按需加载上下文

这几个思路并不是完全并列,而是可以同时使用,相互结合的。

人工划分降低理解难度

最难的,也是最简单的思路。

" "在于这个过程需要人工处理,工作量比较大;"简单"在于不需要额外的知识辅助,也不需要引入新的工具。

  • 可以通过分层的方式,比如:服务层、业务层、数据层等。
  • 可以通过分模块的方式,比如:合同模块、支付模块、日志模块等。

所有的措施都是为了缩小检索空间,只要划分后的上下文,AI 可以"吃"下,那就可以了。

借助工具实现代码图谱

上面的思路估计很多人会望而却步,毕竟,大项目最难着手的就是分析。

这时候,还有另一种思路,借助专门的"代码图谱"工具进行分析。

"代码图谱"可以理解为一种专门的"知识图谱",通过解析 AST调用关系数据依赖,构建项目级的语义索引,支持基于结构的精准检索

相比纯向量检索,代码图谱更能捕捉函数调用、继承等结构化关系,适合深度理解。

我找到了一个比较不错的落地工具:Sourcegraph Cody,支持 VS Code 系列插件安装。

目前尚未来得及实测,大家感兴趣可以先行尝试。

按需加载上下文

"代码图谱"已经提供了一个比较智能的上下文自动划分思路,但这个思路更多的解决重点其实是在单次 AI 对话的上下文上。

如果某个任务特别复杂,单次 AI 对话无法解决,需要多次交互,那上下文依然会出现无法满足的情况。

这时候就需要"按需加载上下文"这种思路去进一步优化了。

这一思路主要是引入一个动态决策 的智能体,它先将复杂任务拆解为的多个步骤,并针对每一步的请求内容 ,动态分析所需的上下文(在代码图谱基础上,再次按需索取),然后循环迭代,直至计划执行完毕。

其实就是 Claude Skills 的设计思路,可以在 Plan 阶段生成的文档计划 中,支持自动/手动配置相关上下文

但是,目前尚未找到完美的落地方案。如果你有合适推荐,欢迎留言指导。

结语

以上就是这两天了解到的AI 理解大项目的几个思路,可以结合起来,逐步应用。

你遇到大项目理解难题时,是怎么破局的?欢迎留言交流!

相关推荐
小小工匠10 小时前
LLM - AI Agent 学习路线图:从 RAG 到多智能体实战
人工智能·多智能体·rag
roman_日积跬步-终至千里10 小时前
【计算机视觉(1)】图像形成基础篇:从光线到图像的完整过程
人工智能·计算机视觉
moonquakeTT10 小时前
雷达调试5大核心思路:从理论到实战
人工智能·matlab·目标跟踪·雷达
雍凉明月夜10 小时前
Ⅳ人工智能机器学习之监督学习的概述
人工智能·深度学习·学习
三块可乐两块冰10 小时前
【第二十二周】机器学习笔记二十一
人工智能·笔记·机器学习
人工小情绪10 小时前
pytorch nn.CrossEntropyLoss
人工智能·pytorch
持续学习的程序员+110 小时前
强化学习阶段性总结
人工智能·算法
永远都不秃头的程序员(互关)10 小时前
昇腾CANN算子开发实践:从入门到性能优化
人工智能·python·机器学习
ConardLi10 小时前
分析了 100 万亿 Token 后,得出的几个关于 AI 的真相
前端·人工智能·后端
明月照山海-10 小时前
机器学习周报二十五
人工智能·机器学习