LM Studio 在 Ubuntu 上安装教程：模型下载与局域网 API 开启-无双技术网

一、系统要求

项目	要求
系统	Ubuntu 20.04 或更新版本
CPU	x64 架构，支持 AVX2 指令集
内存	推荐 ≥16GB
显卡	推荐 ≥4GB 显存（NVIDIA CUDA）
发行包	AppImage / 官方脚本安装

LM Studio 是一款可以在本地运行大语言模型的桌面应用，支持 Llama、DeepSeek、Qwen、Phi 等主流模型。它底层使用 llama.cpp，支持 CPU 和 GPU 推理，并提供 OpenAI 兼容的 API 接口。本文介绍在 Ubuntu 上安装 LM Studio 的完整流程。

二、安装方式（二选一）

方式 A：安装桌面版（推荐，带 GUI）

桌面版以 AppImage 格式分发，适合有桌面环境的 Ubuntu 系统。

# 1. 下载最新版 AppImage（以 x64 为例）
wget https://installers.lmstudio.ai/linux/x64/0.4.16-2/LM-Studio-0.4.16-2-x64.AppImage

# 2. 赋予执行权限
chmod +x LM-Studio-0.4.16-2-x64.AppImage

# 3. 运行
./LM-Studio-0.4.16-2-x64.AppImage

第一次运行时可能需要安装 fuse：

sudo apt install fuse libfuse2

打开后即可在图形界面中搜索模型、下载、聊天、开启 API。

方式 B：安装 headless 版（llmster，无 GUI）

适合服务器或无显示器环境。

# 一键安装
curl -fsSL https://lmstudio.ai/install.sh | bash

# 验证安装
lms --help

# 启动守护进程
lms daemon up

三、模型下载

桌面版下载

在 LM Studio 界面内：点击搜索框，输入模型名称（如 Qwen2.5-7B、DeepSeek-R1-Distill），选择 GGUF 量化版本，点击下载按钮即可。

命令行版下载（llmster）

# 直接从 Hugging Face 拉取 GGUF 模型
lms get qwen/Qwen2.5-7B-Instruct-GGUF

# 下载 DeepSeek
lms get deepseek-ai/DeepSeek-R1-Distill-Qwen-7B-GGUF

模型	建议量化	运行配置
Qwen2.5-7B-Instruct	Q4_K_M	8GB 以上显存/内存
DeepSeek-R1-Distill-Qwen-7B	Q4_K_M	8GB 以上
Llama-3.2-3B-Instruct	Q8_0	4GB 即可流畅运行
Phi-3-mini-4k-instruct	Q4_K_M	6GB 以上

四、加载模型并开启 API 服务

桌面版操作

左侧导航栏切换到 Developer 或 Server 标签
选择要加载的模型
点击 Start Server，默认端口 1234
开启局域网访问：在服务器设置中勾选 Enable Network Access，或修改绑定地址为 0.0.0.0

命令行版（llmster）

# 1. 加载模型
lms load qwen/Qwen2.5-7B-Instruct-GGUF --identifier mymodel

# 2. 启动 HTTP 服务器
lms server start

# 3. 绑定到局域网（让同一局域网的其他设备也能访问）
lms server start --host 0.0.0.0 --port 1234

# 4. 验证服务器
curl http://localhost:1234/v1/models

# 5. 在局域网另一台机器验证
curl http://<你的UbuntuIP>:1234/v1/models

配置系统自启（可选）

创建 systemd 服务：

sudo vim /etc/systemd/system/lmstudio.service

写入以下内容（替换 YOUR_USERNAME 为你的用户名）：

[Unit]
Description=LM Studio Server

[Service]
Type=oneshot
RemainAfterExit=yes
User=YOUR_USERNAME
Environment="HOME=/home/YOUR_USERNAME"
ExecStartPre=/home/YOUR_USERNAME/.lmstudio/bin/lms daemon up
ExecStartPre=/home/YOUR_USERNAME/.lmstudio/bin/lms load qwen/Qwen2.5-7B-Instruct-GGUF --yes
ExecStart=/home/YOUR_USERNAME/.lmstudio/bin/lms server start --host 0.0.0.0 --port 1234
ExecStop=/home/YOUR_USERNAME/.lmstudio/bin/lms daemon down

[Install]
WantedBy=multi-user.target

sudo systemctl daemon-reload
sudo systemctl enable lmstudio.service
sudo systemctl start lmstudio.service
systemctl status lmstudio

五、开启局域网 API 地址

最关键的一步——让局域网其他设备（同一网段的手机、笔记本、其他服务器）能访问你的 LM Studio 服务。

检查防火墙

sudo ufw allow 1234/tcp

查看本机 IP

hostname -I
# 或 ip addr show

调用方式（兼容 OpenAI API 格式）

LM Studio 提供完全兼容 OpenAI 的 API 接口，只需将 base_url 改为你的服务器地址即可。

Python 调用示例：

from openai import OpenAI

client = OpenAI(
    base_url="http://<你的UbuntuIP>:1234/v1",
    api_key="***"  # LM Studio 不验证 key
)

response = client.chat.completions.create(
    model="qwen2.5-7b-instruct",
    messages=[{"role": "user", "content": "你好"}]
)
print(response.choices[0].message.content)

cURL 测试：

curl http://192.168.1.100:1234/v1/chat/completions   -H "Content-Type: application/json"   -d '{
    "model": "qwen2.5-7b-instruct",
    "messages": [{"role": "user", "content": "你好"}],
    "temperature": 0.7
  }'

六、支持的 API 端点

端点	方法	说明
`/v1/models`	GET	列出所有模型
`/v1/chat/completions`	POST	对话补全
`/v1/completions`	POST	文本补全
`/v1/embeddings`	POST	向量嵌入
`/v1/responses`	POST	OpenAI Responses API