你有没有经历过这样的事——AI 编程助手问你”这个 function 是在哪定义的”,然后你眼睁睁看着它 grep 了一遍、读文件、再 grep……几十次来回后 token 烧了上万,它才真正开始干活?
Codebase Memory MCP 就是为了终结这种循环而生的。它是一个高性能代码智能 MCP 服务器,把整个代码库索引成一个持久的知识图谱——平均仓库只需要几毫秒就能完成索引,Linux 内核(28M 行代码、75,000 个文件)也只要 3 分钟。查询响应在 1ms 以内,支持 158 种语言,比传统的逐文件探索节省 99% 的 token。
项目地址:https://github.com/DeusData/codebase-memory-mcp
什么是 Codebase Memory MCP?
简单说,它给你的 AI 编码助手装上了一个代码知识库的”脑图”。传统上,AI 理解代码库的方式是逐文件读——读到某个 import 再去读新文件,像一个人在迷宫里边走边画地图。而 Codebase Memory MCP 直接把整张地图画好了:谁调用了谁、哪个类继承了什么接口、HTTP 路由通向哪段代码——全部以知识图谱的形式存下来,AI 只需要问一句话就能得到答案。
核心特性
⚡ 极速索引
- 平均仓库只需几毫秒完成索引
- Linux 内核(28M LOC, 75K 文件)——完全索引 3 分钟,快速索引 1 分 12 秒
- Django 全量索引只需 ~6 秒(49K 节点, 196K 边)
- 纯内存管道:LZ4 压缩读取 + 内存 SQLite,索引完成后释放内存
🗄️ 14 个 MCP 工具
- search_graph — 按标签、名称、文件模式结构化搜索
- trace_path — BFS 遍历调用链,谁调用了谁一目了然
- query_graph — 类 Cypher 查询,关系遍历
- detect_changes — Git diff 映射到受影响符号并做风险分类
- get_architecture — 代码结构概览:语言、包、入口、路由、热点、分层
- search_code — 图增强的 grep 搜索
- manage_adr — 架构决策记录 CRUD
- dead_code — 零调用者函数检测
- semantic_query — 向量语义搜索(内置 nomic-embed-code 模型)
- 另有 index_repository、list_projects、delete_project、index_status、get_code_snippet、ingest_traces
🌐 158 种语言全覆盖
内置 158 个 vendored tree-sitter 语法,编译进单一二进制——无需额外安装。
🔬 Hybrid LSP 语义类型解析
在 tree-sitter AST 基础上,额外支持 Python、TypeScript/JavaScript/JSX/TSX、PHP、C#、Go、C、C++、Java、Kotlin、Rust 的深度语义解析——包括泛型替换、JSX 组件分发、扩展方法解析等。
🔗 一站式 Agent 集成
install 命令自动检测并配置 11 种编码 Agent:Claude Code、Codex CLI、Gemini CLI、Zed、OpenCode、Antigravity、Aider、KiloCode、VS Code、OpenClaw、Kiro。一行命令搞定。
安装与使用
macOS / Linux(一行搞定)
curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | bash
带图形可视化界面
curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | bash -s -- --ui
Windows(PowerShell)
# 下载安装脚本
Invoke-WebRequest -Uri https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.ps1 -OutFile install.ps1
# 检查后执行
.\install.ps1
手动安装
从 Releases 页面下载对应平台的压缩包,解压后执行 install.sh 或 install.ps1。
安装后做什么
重启你的编码 Agent,然后说:“Index this project”——即可。
实际性能
| 操作 | 耗时 | 说明 |
|---|---|---|
| Linux 内核全索引 | 3 分钟 | 28M LOC, 75K 文件 → 481 万节点, 772 万边 |
| Linux 内核快速索引 | 1 分 12 秒 | 188 万节点 |
| Django 全索引 | ~6 秒 | 49K 节点, 196K 边 |
| Cypher 查询 | <1ms | 关系遍历 |
| 名称搜索(正则) | <10ms | SQL LIKE 预过滤 |
| 调用链追踪(深度 5) | <10ms | BFS 遍历 |
Token 效率:5 个结构化查询平均只需 ~3,400 token,而传统逐文件探索需要 ~412,000 token——节省了 99.2%。
与同类工具对比
| 特性 | Codebase Memory MCP | 其他代码图谱工具 |
|---|---|---|
| 安装方式 | 单一静态二进制,零依赖 | 通常需要 Docker/Python 运行时 |
| 语言支持 | 158 种(内置语法) | 通常 10-30 种 |
| 内置 LLM? | 否(复用你已有的 Agent) | 通常自建,需要额外 API Key |
| 可移植知识图谱 | ✅ 可 commit 到仓库 | ❌ 通常只存本地 |
| Agent 集成 | 11 种 Agent 一键配置 | 通常只适配 1-2 种 |
| 3D 可视化 | ✅ 可选 UI 变体 | 少数支持 |
结语
Codebase Memory MCP 是目前最完善的代码智能 MCP 服务之一。一个静态二进制、零依赖、覆盖 158 种语言、支持 11 种 Agent 一键集成——对于需要和大型代码库打交道的开发者来说,这是真正的生产力提升。尤其对于 OpenClaw 用户,官方支持直配,装上就能用。















暂无评论内容