LM Studio 在 Ubuntu 上安装教程:模型下载与局域网 API 开启

一、系统要求

项目 要求
系统 Ubuntu 20.04 或更新版本
CPU x64 架构,支持 AVX2 指令集
内存 推荐 ≥16GB
显卡 推荐 ≥4GB 显存(NVIDIA CUDA)
发行包 AppImage / 官方脚本安装

LM Studio 是一款可以在本地运行大语言模型的桌面应用,支持 Llama、DeepSeek、Qwen、Phi 等主流模型。它底层使用 llama.cpp,支持 CPU 和 GPU 推理,并提供 OpenAI 兼容的 API 接口。本文介绍在 Ubuntu 上安装 LM Studio 的完整流程。

二、安装方式(二选一)

方式 A:安装桌面版(推荐,带 GUI)

桌面版以 AppImage 格式分发,适合有桌面环境的 Ubuntu 系统。

# 1. 下载最新版 AppImage(以 x64 为例)
wget https://installers.lmstudio.ai/linux/x64/0.4.16-2/LM-Studio-0.4.16-2-x64.AppImage

# 2. 赋予执行权限
chmod +x LM-Studio-0.4.16-2-x64.AppImage

# 3. 运行
./LM-Studio-0.4.16-2-x64.AppImage

第一次运行时可能需要安装 fuse:

sudo apt install fuse libfuse2

打开后即可在图形界面中搜索模型、下载、聊天、开启 API。

方式 B:安装 headless 版(llmster,无 GUI)

适合服务器或无显示器环境。

# 一键安装
curl -fsSL https://lmstudio.ai/install.sh | bash

# 验证安装
lms --help

# 启动守护进程
lms daemon up

三、模型下载

桌面版下载

在 LM Studio 界面内:点击搜索框,输入模型名称(如 Qwen2.5-7BDeepSeek-R1-Distill),选择 GGUF 量化版本,点击下载按钮即可。

命令行版下载(llmster)

# 直接从 Hugging Face 拉取 GGUF 模型
lms get qwen/Qwen2.5-7B-Instruct-GGUF

# 下载 DeepSeek
lms get deepseek-ai/DeepSeek-R1-Distill-Qwen-7B-GGUF

推荐模型

模型 建议量化 运行配置
Qwen2.5-7B-Instruct Q4_K_M 8GB 以上显存/内存
DeepSeek-R1-Distill-Qwen-7B Q4_K_M 8GB 以上
Llama-3.2-3B-Instruct Q8_0 4GB 即可流畅运行
Phi-3-mini-4k-instruct Q4_K_M 6GB 以上

模型文件默认下载到 ~/.cache/lm-studio/models/ 目录。

四、加载模型并开启 API 服务

桌面版操作

  1. 左侧导航栏切换到 DeveloperServer 标签
  2. 选择要加载的模型
  3. 点击 Start Server,默认端口 1234
  4. 开启局域网访问:在服务器设置中勾选 Enable Network Access,或修改绑定地址为 0.0.0.0

命令行版(llmster)

# 1. 加载模型
lms load qwen/Qwen2.5-7B-Instruct-GGUF --identifier mymodel

# 2. 启动 HTTP 服务器
lms server start

# 3. 绑定到局域网(让同一局域网的其他设备也能访问)
lms server start --host 0.0.0.0 --port 1234

# 4. 验证服务器
curl http://localhost:1234/v1/models

# 5. 在局域网另一台机器验证
curl http://<你的UbuntuIP>:1234/v1/models

配置系统自启(可选)

创建 systemd 服务:

sudo vim /etc/systemd/system/lmstudio.service

写入以下内容(替换 YOUR_USERNAME 为你的用户名):

[Unit]
Description=LM Studio Server

[Service]
Type=oneshot
RemainAfterExit=yes
User=YOUR_USERNAME
Environment="HOME=/home/YOUR_USERNAME"
ExecStartPre=/home/YOUR_USERNAME/.lmstudio/bin/lms daemon up
ExecStartPre=/home/YOUR_USERNAME/.lmstudio/bin/lms load qwen/Qwen2.5-7B-Instruct-GGUF --yes
ExecStart=/home/YOUR_USERNAME/.lmstudio/bin/lms server start --host 0.0.0.0 --port 1234
ExecStop=/home/YOUR_USERNAME/.lmstudio/bin/lms daemon down

[Install]
WantedBy=multi-user.target
sudo systemctl daemon-reload
sudo systemctl enable lmstudio.service
sudo systemctl start lmstudio.service
systemctl status lmstudio

五、开启局域网 API 地址

最关键的一步——让局域网其他设备(同一网段的手机、笔记本、其他服务器)能访问你的 LM Studio 服务。

检查防火墙

sudo ufw allow 1234/tcp

查看本机 IP

hostname -I
# 或 ip addr show

调用方式(兼容 OpenAI API 格式)

LM Studio 提供完全兼容 OpenAI 的 API 接口,只需将 base_url 改为你的服务器地址即可。

Python 调用示例:

from openai import OpenAI

client = OpenAI(
    base_url="http://<你的UbuntuIP>:1234/v1",
    api_key="***"  # LM Studio 不验证 key
)

response = client.chat.completions.create(
    model="qwen2.5-7b-instruct",
    messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)

cURL 测试:

curl http://192.168.1.100:1234/v1/chat/completions   -H "Content-Type: application/json"   -d '{
    "model": "qwen2.5-7b-instruct",
    "messages": [{"role": "user", "content": "你好"}],
    "temperature": 0.7
  }'

六、支持的 API 端点

端点 方法 说明
/v1/models GET 列出所有模型
/v1/chat/completions POST 对话补全
/v1/completions POST 文本补全
/v1/embeddings POST 向量嵌入
/v1/responses POST OpenAI Responses API

七、常见问题

Q:AppImage 打不开?
安装 fuse:sudo apt install fuse libfuse2,然后重新运行。

Q:局域网其他机器连不上?
1. 确认服务器启动参数包含 --host 0.0.0.0
2. 检查防火墙:sudo ufw status
3. 确认两台机器在同一网段并能互相 ping 通

Q:加载模型后内存不够?
选择更小的量化版本(如 Q4_K_M 改为 Q4_0,或选择 3B/7B 模型而非 14B/72B),或减少上下文长度。

Q:没有 NVIDIA 显卡能用吗?
可以。LM Studio 默认使用 CPU 推理(llama.cpp),只是在 CPU 上 7B 模型推理速度较慢,但可以正常使用。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享