Codebase Memory MCP:给你的 AI 编码助手装上代码知识图谱,省 99% 的 Token

你有没有经历过这样的事——AI 编程助手问你”这个 function 是在哪定义的”,然后你眼睁睁看着它 grep 了一遍、读文件、再 grep……几十次来回后 token 烧了上万,它才真正开始干活?

Codebase Memory MCP 就是为了终结这种循环而生的。它是一个高性能代码智能 MCP 服务器,把整个代码库索引成一个持久的知识图谱——平均仓库只需要几毫秒就能完成索引,Linux 内核(28M 行代码、75,000 个文件)也只要 3 分钟。查询响应在 1ms 以内,支持 158 种语言,比传统的逐文件探索节省 99% 的 token

项目地址:https://github.com/DeusData/codebase-memory-mcp

什么是 Codebase Memory MCP?

简单说,它给你的 AI 编码助手装上了一个代码知识库的”脑图”。传统上,AI 理解代码库的方式是逐文件读——读到某个 import 再去读新文件,像一个人在迷宫里边走边画地图。而 Codebase Memory MCP 直接把整张地图画好了:谁调用了谁、哪个类继承了什么接口、HTTP 路由通向哪段代码——全部以知识图谱的形式存下来,AI 只需要问一句话就能得到答案。

核心特性

⚡ 极速索引

  • 平均仓库只需几毫秒完成索引
  • Linux 内核(28M LOC, 75K 文件)——完全索引 3 分钟,快速索引 1 分 12 秒
  • Django 全量索引只需 ~6 秒(49K 节点, 196K 边)
  • 纯内存管道:LZ4 压缩读取 + 内存 SQLite,索引完成后释放内存

🗄️ 14 个 MCP 工具

  • search_graph — 按标签、名称、文件模式结构化搜索
  • trace_path — BFS 遍历调用链,谁调用了谁一目了然
  • query_graph — 类 Cypher 查询,关系遍历
  • detect_changes — Git diff 映射到受影响符号并做风险分类
  • get_architecture — 代码结构概览:语言、包、入口、路由、热点、分层
  • search_code — 图增强的 grep 搜索
  • manage_adr — 架构决策记录 CRUD
  • dead_code — 零调用者函数检测
  • semantic_query — 向量语义搜索(内置 nomic-embed-code 模型)
  • 另有 index_repository、list_projects、delete_project、index_status、get_code_snippet、ingest_traces

🌐 158 种语言全覆盖

内置 158 个 vendored tree-sitter 语法,编译进单一二进制——无需额外安装。

🔬 Hybrid LSP 语义类型解析

在 tree-sitter AST 基础上,额外支持 Python、TypeScript/JavaScript/JSX/TSX、PHP、C#、Go、C、C++、Java、Kotlin、Rust 的深度语义解析——包括泛型替换、JSX 组件分发、扩展方法解析等。

🔗 一站式 Agent 集成

install 命令自动检测并配置 11 种编码 Agent:Claude Code、Codex CLI、Gemini CLI、Zed、OpenCode、Antigravity、Aider、KiloCode、VS Code、OpenClaw、Kiro。一行命令搞定。

安装与使用

macOS / Linux(一行搞定)

curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | bash

带图形可视化界面

curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | bash -s -- --ui

Windows(PowerShell)

# 下载安装脚本
Invoke-WebRequest -Uri https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.ps1 -OutFile install.ps1

# 检查后执行
.\install.ps1

手动安装

Releases 页面下载对应平台的压缩包,解压后执行 install.sh 或 install.ps1。

安装后做什么

重启你的编码 Agent,然后说:“Index this project”——即可。

实际性能

操作 耗时 说明
Linux 内核全索引 3 分钟 28M LOC, 75K 文件 → 481 万节点, 772 万边
Linux 内核快速索引 1 分 12 秒 188 万节点
Django 全索引 ~6 秒 49K 节点, 196K 边
Cypher 查询 <1ms 关系遍历
名称搜索(正则) <10ms SQL LIKE 预过滤
调用链追踪(深度 5) <10ms BFS 遍历

Token 效率:5 个结构化查询平均只需 ~3,400 token,而传统逐文件探索需要 ~412,000 token——节省了 99.2%

与同类工具对比

特性 Codebase Memory MCP 其他代码图谱工具
安装方式 单一静态二进制,零依赖 通常需要 Docker/Python 运行时
语言支持 158 种(内置语法) 通常 10-30 种
内置 LLM? 否(复用你已有的 Agent) 通常自建,需要额外 API Key
可移植知识图谱 ✅ 可 commit 到仓库 ❌ 通常只存本地
Agent 集成 11 种 Agent 一键配置 通常只适配 1-2 种
3D 可视化 ✅ 可选 UI 变体 少数支持

结语

Codebase Memory MCP 是目前最完善的代码智能 MCP 服务之一。一个静态二进制、零依赖、覆盖 158 种语言、支持 11 种 Agent 一键集成——对于需要和大型代码库打交道的开发者来说,这是真正的生产力提升。尤其对于 OpenClaw 用户,官方支持直配,装上就能用。

© 版权声明
THE END
喜欢就支持一下吧
点赞5 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容