Codebase Memory MCP：给你的 AI 编码助手装上代码知识图谱，省 99% 的 Token-无双技术网

你有没有经历过这样的事——AI 编程助手问你”这个 function 是在哪定义的”，然后你眼睁睁看着它 grep 了一遍、读文件、再 grep……几十次来回后 token 烧了上万，它才真正开始干活？

Codebase Memory MCP 就是为了终结这种循环而生的。它是一个高性能代码智能 MCP 服务器，把整个代码库索引成一个持久的知识图谱——平均仓库只需要几毫秒就能完成索引，Linux 内核（28M 行代码、75,000 个文件）也只要 3 分钟。查询响应在 1ms 以内，支持 158 种语言，比传统的逐文件探索节省 99% 的 token。

项目地址：https://github.com/DeusData/codebase-memory-mcp

什么是 Codebase Memory MCP？

简单说，它给你的 AI 编码助手装上了一个代码知识库的”脑图”。传统上，AI 理解代码库的方式是逐文件读——读到某个 import 再去读新文件，像一个人在迷宫里边走边画地图。而 Codebase Memory MCP 直接把整张地图画好了：谁调用了谁、哪个类继承了什么接口、HTTP 路由通向哪段代码——全部以知识图谱的形式存下来，AI 只需要问一句话就能得到答案。

核心特性

⚡ 极速索引

平均仓库只需几毫秒完成索引
Linux 内核（28M LOC, 75K 文件）——完全索引 3 分钟，快速索引 1 分 12 秒
Django 全量索引只需 ~6 秒（49K 节点, 196K 边）
纯内存管道：LZ4 压缩读取 + 内存 SQLite，索引完成后释放内存

🗄️ 14 个 MCP 工具

search_graph — 按标签、名称、文件模式结构化搜索
trace_path — BFS 遍历调用链，谁调用了谁一目了然
query_graph — 类 Cypher 查询，关系遍历
detect_changes — Git diff 映射到受影响符号并做风险分类
get_architecture — 代码结构概览：语言、包、入口、路由、热点、分层
search_code — 图增强的 grep 搜索
manage_adr — 架构决策记录 CRUD
dead_code — 零调用者函数检测
semantic_query — 向量语义搜索（内置 nomic-embed-code 模型）
另有 index_repository、list_projects、delete_project、index_status、get_code_snippet、ingest_traces

🌐 158 种语言全覆盖

内置 158 个 vendored tree-sitter 语法，编译进单一二进制——无需额外安装。

🔬 Hybrid LSP 语义类型解析

在 tree-sitter AST 基础上，额外支持 Python、TypeScript/JavaScript/JSX/TSX、PHP、C#、Go、C、C++、Java、Kotlin、Rust 的深度语义解析——包括泛型替换、JSX 组件分发、扩展方法解析等。

🔗 一站式 Agent 集成

install 命令自动检测并配置 11 种编码 Agent：Claude Code、Codex CLI、Gemini CLI、Zed、OpenCode、Antigravity、Aider、KiloCode、VS Code、OpenClaw、Kiro。一行命令搞定。

安装与使用

macOS / Linux（一行搞定）

curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | bash

带图形可视化界面

curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | bash -s -- --ui

Windows（PowerShell）

# 下载安装脚本
Invoke-WebRequest -Uri https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.ps1 -OutFile install.ps1

# 检查后执行
.\install.ps1

手动安装

从 Releases 页面下载对应平台的压缩包，解压后执行 install.sh 或 install.ps1。

安装后做什么

重启你的编码 Agent，然后说：“Index this project”——即可。

实际性能

操作	耗时	说明
Linux 内核全索引	3 分钟	28M LOC, 75K 文件 → 481 万节点, 772 万边
Linux 内核快速索引	1 分 12 秒	188 万节点
Django 全索引	~6 秒	49K 节点, 196K 边
Cypher 查询	<1ms	关系遍历
名称搜索（正则）	<10ms	SQL LIKE 预过滤
调用链追踪（深度 5）	<10ms	BFS 遍历

Token 效率：5 个结构化查询平均只需 ~3,400 token，而传统逐文件探索需要 ~412,000 token——节省了 99.2%。

与同类工具对比

特性	Codebase Memory MCP	其他代码图谱工具
安装方式	单一静态二进制，零依赖	通常需要 Docker/Python 运行时
语言支持	158 种（内置语法）	通常 10-30 种
内置 LLM？	否（复用你已有的 Agent）	通常自建，需要额外 API Key
可移植知识图谱	✅ 可 commit 到仓库	❌ 通常只存本地
Agent 集成	11 种 Agent 一键配置	通常只适配 1-2 种
3D 可视化	✅ 可选 UI 变体	少数支持