一、系统要求
| 项目 | 要求 |
|---|---|
| 系统 | Ubuntu 20.04 或更新版本 |
| CPU | x64 架构,支持 AVX2 指令集 |
| 内存 | 推荐 ≥16GB |
| 显卡 | 推荐 ≥4GB 显存(NVIDIA CUDA) |
| 发行包 | AppImage / 官方脚本安装 |
LM Studio 是一款可以在本地运行大语言模型的桌面应用,支持 Llama、DeepSeek、Qwen、Phi 等主流模型。它底层使用 llama.cpp,支持 CPU 和 GPU 推理,并提供 OpenAI 兼容的 API 接口。本文介绍在 Ubuntu 上安装 LM Studio 的完整流程。
二、安装方式(二选一)
方式 A:安装桌面版(推荐,带 GUI)
桌面版以 AppImage 格式分发,适合有桌面环境的 Ubuntu 系统。
# 1. 下载最新版 AppImage(以 x64 为例)
wget https://installers.lmstudio.ai/linux/x64/0.4.16-2/LM-Studio-0.4.16-2-x64.AppImage
# 2. 赋予执行权限
chmod +x LM-Studio-0.4.16-2-x64.AppImage
# 3. 运行
./LM-Studio-0.4.16-2-x64.AppImage
第一次运行时可能需要安装 fuse:
sudo apt install fuse libfuse2
打开后即可在图形界面中搜索模型、下载、聊天、开启 API。
方式 B:安装 headless 版(llmster,无 GUI)
适合服务器或无显示器环境。
# 一键安装
curl -fsSL https://lmstudio.ai/install.sh | bash
# 验证安装
lms --help
# 启动守护进程
lms daemon up
三、模型下载
桌面版下载
在 LM Studio 界面内:点击搜索框,输入模型名称(如 Qwen2.5-7B、DeepSeek-R1-Distill),选择 GGUF 量化版本,点击下载按钮即可。
命令行版下载(llmster)
# 直接从 Hugging Face 拉取 GGUF 模型
lms get qwen/Qwen2.5-7B-Instruct-GGUF
# 下载 DeepSeek
lms get deepseek-ai/DeepSeek-R1-Distill-Qwen-7B-GGUF
推荐模型
| 模型 | 建议量化 | 运行配置 |
|---|---|---|
| Qwen2.5-7B-Instruct | Q4_K_M | 8GB 以上显存/内存 |
| DeepSeek-R1-Distill-Qwen-7B | Q4_K_M | 8GB 以上 |
| Llama-3.2-3B-Instruct | Q8_0 | 4GB 即可流畅运行 |
| Phi-3-mini-4k-instruct | Q4_K_M | 6GB 以上 |
模型文件默认下载到 ~/.cache/lm-studio/models/ 目录。
四、加载模型并开启 API 服务
桌面版操作
- 左侧导航栏切换到 Developer 或 Server 标签
- 选择要加载的模型
- 点击 Start Server,默认端口 1234
- 开启局域网访问:在服务器设置中勾选 Enable Network Access,或修改绑定地址为
0.0.0.0
命令行版(llmster)
# 1. 加载模型
lms load qwen/Qwen2.5-7B-Instruct-GGUF --identifier mymodel
# 2. 启动 HTTP 服务器
lms server start
# 3. 绑定到局域网(让同一局域网的其他设备也能访问)
lms server start --host 0.0.0.0 --port 1234
# 4. 验证服务器
curl http://localhost:1234/v1/models
# 5. 在局域网另一台机器验证
curl http://<你的UbuntuIP>:1234/v1/models
配置系统自启(可选)
创建 systemd 服务:
sudo vim /etc/systemd/system/lmstudio.service
写入以下内容(替换 YOUR_USERNAME 为你的用户名):
[Unit]
Description=LM Studio Server
[Service]
Type=oneshot
RemainAfterExit=yes
User=YOUR_USERNAME
Environment="HOME=/home/YOUR_USERNAME"
ExecStartPre=/home/YOUR_USERNAME/.lmstudio/bin/lms daemon up
ExecStartPre=/home/YOUR_USERNAME/.lmstudio/bin/lms load qwen/Qwen2.5-7B-Instruct-GGUF --yes
ExecStart=/home/YOUR_USERNAME/.lmstudio/bin/lms server start --host 0.0.0.0 --port 1234
ExecStop=/home/YOUR_USERNAME/.lmstudio/bin/lms daemon down
[Install]
WantedBy=multi-user.target
sudo systemctl daemon-reload
sudo systemctl enable lmstudio.service
sudo systemctl start lmstudio.service
systemctl status lmstudio
五、开启局域网 API 地址
最关键的一步——让局域网其他设备(同一网段的手机、笔记本、其他服务器)能访问你的 LM Studio 服务。
检查防火墙
sudo ufw allow 1234/tcp
查看本机 IP
hostname -I
# 或 ip addr show
调用方式(兼容 OpenAI API 格式)
LM Studio 提供完全兼容 OpenAI 的 API 接口,只需将 base_url 改为你的服务器地址即可。
Python 调用示例:
from openai import OpenAI
client = OpenAI(
base_url="http://<你的UbuntuIP>:1234/v1",
api_key="***" # LM Studio 不验证 key
)
response = client.chat.completions.create(
model="qwen2.5-7b-instruct",
messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)
cURL 测试:
curl http://192.168.1.100:1234/v1/chat/completions -H "Content-Type: application/json" -d '{
"model": "qwen2.5-7b-instruct",
"messages": [{"role": "user", "content": "你好"}],
"temperature": 0.7
}'
六、支持的 API 端点
| 端点 | 方法 | 说明 |
|---|---|---|
/v1/models |
GET | 列出所有模型 |
/v1/chat/completions |
POST | 对话补全 |
/v1/completions |
POST | 文本补全 |
/v1/embeddings |
POST | 向量嵌入 |
/v1/responses |
POST | OpenAI Responses API |
七、常见问题
Q:AppImage 打不开?
安装 fuse:sudo apt install fuse libfuse2,然后重新运行。
Q:局域网其他机器连不上?
1. 确认服务器启动参数包含 --host 0.0.0.0
2. 检查防火墙:sudo ufw status
3. 确认两台机器在同一网段并能互相 ping 通
Q:加载模型后内存不够?
选择更小的量化版本(如 Q4_K_M 改为 Q4_0,或选择 3B/7B 模型而非 14B/72B),或减少上下文长度。
Q:没有 NVIDIA 显卡能用吗?
可以。LM Studio 默认使用 CPU 推理(llama.cpp),只是在 CPU 上 7B 模型推理速度较慢,但可以正常使用。
















cqlbgzs@163.com 1年前0
d好879445037@qq.com 2年前0
购买了 无法下载Alexcc 3年前0
强大Alexcc 3年前0
看不了教程Alexcc 3年前0
雷刺下载Alexcc 3年前0
下载Alexcc 3年前0
下载dsa456159 3年前0
下载