Codebase-Memory-MCP:毫秒级代码库知识图谱,AI 编程助手的终极代码索引引擎

在 AI 编程助手遍地开花的 2026 年,你有没有发现一个尴尬的问题:AI 对大型代码库的理解能力,严重受限于上下文窗口和工具调用效率。每次都要 grep、逐文件读取,token 消耗巨大不说,AI 还经常搞错函数调用关系。

今天要介绍的 Codebase-Memory-MCP 就是来解决这个痛点的。今天 GitHub Trending 日增 1,300+ stars,已累计近 13K stars,可以说是目前最火热的代码智能引擎。

项目概况

Codebase-Memory-MCP 是一个高性能的代码智能 MCP(Model Context Protocol)服务器。它的核心理念是:把整个代码库索引成一个持久化的知识图谱,让 AI 编程助手可以像查询数据库一样理解代码结构。

它由 DeusData 团队开发,基于 tree-sitter 进行 AST 解析,支持 158 种编程语言,10 种语言还额外享受 Hybrid LSP 语义类型解析。所有处理 100% 本地完成,代码绝不会离开你的机器。

学术研究背书:该项目的设计思路和基准测试已发表在 arXiv 预印本 Codebase-Memory: Tree-Sitter-Based Knowledge Graphs for LLM Code Exploration via MCP。在 31 个真实仓库上的评测显示:83% 的答案质量、10× 更少 token、2.1× 更少工具调用(对比逐个文件探索方式)。

核心特性

  • ⚡ 极限索引速度:Linux 内核(28M 行代码、75K 文件)仅需 3 分钟完成索引。采用 LZ4 压缩、内存 SQLite、融合 Aho-Corasick 模式匹配等 RAM-first 管道技术。
  • 📦 即插即用:单个静态二进制文件,支持 macOS (arm64/amd64)、Linux (arm64/amd64)、Windows (amd64)。无需 Docker、无需运行时依赖、无需 API Key。
  • 🔍 120 倍 Token 节省:5 次结构化查询仅消耗 3,400 tokens,而传统的文件逐一搜索方式需约 412,000 tokens。
  • 🤖 11 种编程助手开箱支持:Claude Code、Codex CLI、Gemini CLI、Zed、OpenCode、Antigravity、Aider、KiloCode、VS Code、OpenClaw、Kiro 均自动检测并配置。
  • 🧭 14 个 MCP 工具:架构总览、调用链追踪、影响分析、死代码检测、Cypher 图查询、HTTP 跨服务链接、ADR(架构决策记录)管理等。
  • 📊 3D 知识图谱可视化:内置 3D 交互界面,访问 localhost:9749 即可直观探索你的代码关系图。
  • 🔄 自动同步:后台文件监听器检测变更后自动增量重新索引。
  • 🌐 丰富的边关系:CALLS、IMPLEMENTS、INHERITS、HTTP_CALLS、ASYNC_CALLS、EMITS/LISTENS_ON(消息通道)、DATA_FLOWS 等。
  • 🏗️ 基础设施即代码支持:Dockerfiles、Kubernetes manifests、Kustomize overlays 均能被索引为图谱节点。
  • 🤝 团队共享:可将压缩后的知识图谱提交到仓库,团队成员 clone 后直接解压导入,跳过全量索引。

安装步骤

macOS / Linux 一键安装

# 标准版本
curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | bash

# 带 3D 图谱可视化 UI 的版本
curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | bash -s -- --ui

Windows 安装

# 1. 下载安装脚本
Invoke-WebRequest -Uri https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.ps1 -OutFile install.ps1

# 2. 查看脚本内容(建议)
notepad install.ps1

# 3. 运行安装
.\install.ps1

# 可选参数: --ui(图表可视化), --skip-config(仅安装二进制), --dir=<path>(自定义路径)

手动安装

GitHub Releases 下载对应平台的压缩包,解压后运行 install.shinstall.ps1

其他包管理器安装

# npm
npm install -g codebase-memory-mcp

# Homebrew
brew install codebase-memory-mcp

# pip
pip install codebase-memory-mcp

# Scoop (Windows)
scoop install codebase-memory-mcp

# Winget (Windows)
winget install codebase-memory-mcp

安装完成后,重启你的 AI 编程助手,安装脚本会自动检测并配置所有支持的编程助手的 MCP 连接。

使用示例

1. 索引项目

在 AI 编程助手中直接说:“Index this project”,或者使用 MCP 工具调用:

index_repository(path="/home/user/my-project")

平均仓库在毫秒级完成索引。你想索引 Linux 内核?只需要大概 3 分钟。

2. 架构总览

get_architecture(depth=3)

返回项目的:语言分布、包结构、入口点、HTTP 路由、热点模块、架构边界、分层结构、社区检测(Louvain 算法)聚类。

3. 调用链追踪

trace_calls(start_symbol="main", direction="downstream", max_depth=5)

从 main 函数出发,追踪所有被调用函数,跨文件、跨包解析。

4. 死代码检测

find_dead_code(min_lines=5)

找出没有任何调用者的函数(排除入口点),帮你清理冗余代码。

5. Git 变更影响分析

detect_changes()

映射未提交的变更到受影响符号,附带风险分类(高/中/低)。

6. Cypher 风格图查询

graph_query(query="MATCH (f:Function)-[:CALLS]->(g) WHERE f.name = 'handleRequest' RETURN g.name")

像查询 Neo4j 一样查询你的代码知识图谱。

7. 启用自动索引

codebase-memory-mcp config set auto_index true

首次连接时自动索引新项目,已索引项目注册后台文件监听器进行增量更新。

8. 查看 3D 知识图谱

codebase-memory-mcp --ui=true --port=9749

浏览器打开 http://localhost:9749,直观地探索函数调用关系、模块依赖、HTTP 路由等。

9. 团队共享知识图谱

.codebase-memory/graph.db.zst 提交到 Git 仓库,队友 clone 后运行索引命令即可自动导入并增量更新,无需重新全量索引。

性能数据

场景 代码规模 索引耗时 查询速度
平均仓库 ~ 毫秒级 <1ms
Linux 内核 28M LOC / 75K 文件 3 分钟 亚毫秒
Token 节省 结构化查询 vs 文件搜索 120× 更少

安全性

所有处理 100% 本地完成,代码绝不离开你的机器。每个发布版本都经过签名、校验和以及 70+ 杀毒引擎扫描。项目通过了 OpenSSF Scorecard 评估。

总结

Codebase-Memory-MCP 重新定义了 AI 编程助手理解代码的方式。从”逐个文件翻找”到”一键查询知识图谱”,不仅是体验的飞跃,更是 token 成本的断崖式下降。对于日常需要和大型代码库打交道的开发者来说,它是一个不可多得的效率神器

如果你在用 Claude Code、Codex、Gemini CLI 或其他主流 AI 编程助手,强烈建议装上试试。真的,用完就回不去了。


项目地址:https://github.com/DeusData/codebase-memory-mcp

论文:arXiv:2603.27277

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享