引言:当金融K线有了自己的语言模型
2025年7月,一个名为 Kronos 的项目悄然登陆 GitHub,不到一年便斩获近 3 万星标,成为 AI + 金融领域最炙手可热的开源项目。这个由清华大学团队打造的项目,被人工智能顶级会议 AAAI 2026 收录,标志着金融时序基础模型进入了一个全新的时代。
本文将带你全面认识 Kronos——这个被誉为”金融市场的语言模型”的开源神器。
什么是 Kronos?
Kronos 是首个专为金融 K 线(Candlestick/K-line)数据设计的开源基础模型(Foundation Model)。与传统的时间序列基础模型(TSFM)不同,Kronos 并非通用型模型,而是专门针对金融数据高噪声、多维度、非平稳的特性量身定制。
它由 Yu Shi(施煜)及其团队(包括宗良福、陈硕、赵博涵、许伟、张长水、李建)开发,训练数据覆盖 45+ 家全球交易所,涵盖加密货币、股票、商品期货和衍生品等多种资产类别。
此外,Kronos 论文已被 AAAI 2026(人工智能领域最顶级会议之一)正式接收,论文全文可在 arXiv 上查阅。
Kronos 两阶段框架概览
为什么金融 K 线需要专用基础模型?
一根 K 线并不是五个独立数字的简单组合:
- 开盘与收盘的关系——反映了市场情绪(阳线/阴线)
- 上下影线——编码了价格被拒绝和市场的犹豫
- 成交量——验证或否定价格行为的可靠性
- K线形态组合(十字星、锤子线、吞没形态等)——讲述着市场心理的故事
然而,大多数通用时间序列基础模型(如 TimesFM、Chronos、Moirai)把金融数据当作普通的单变量序列来处理,完全丢失了 K 线背后丰富的多维语义信息。这就好比用处理电量预测的模型去解读莎士比亚——架构没错,但理解不了内容。
Kronos 正是为了解决这个问题而生——它将 K 线数据视为一种特殊的”金融市场语言”,从零开始构建专门的理解系统。
核心创新:两阶段框架
Kronos 最核心的创新在于其独特的 两阶段框架:
阶段一:专用 Tokenizer 量化 OHLCV 数据
Kronos 设计了一种 专用的金融 Tokenizer,将连续的多维 K 线数据(Open, High, Low, Close, Volume/Amount)量化为 层级化的离散 Token。
这个 Tokenizer 学习了 K 线形态的”词汇表”——就像语言模型学习词根一样,它能将价格区间、实体大小、影线比例、成交量水平等关键特征编码为结构化的 Token,同时保留它们之间的内在关系。
Kronos 提供两个版本的 Tokenizer:
- Kronos-Tokenizer-2k(词汇量 2048,用于 mini 版本)
- Kronos-Tokenizer-base(词汇量 512,用于 small/base/large 版本)
阶段二:自回归 Transformer 预训练
量化后的离散 Token 序列被送入一个 Decoder-only 的 Transformer 进行自回归预训练。模型学习预测下一个 K 线 Token,就像 GPT 预测下一个单词一样。
这个将连续多维回归问题转化为离散序列建模问题的思路非常优雅——因为 Transformer 在序列建模方面已被证明极其强大。
预训练完成后,Kronos 可以在零样本(zero-shot)条件下,直接应用于从未见过的任务——不同市场、不同时间周期、不同资产类别,无需微调即可上手。
模型家族:多种规格适配不同场景
Kronos 提供了多个规格的预训练模型,满足不同的计算资源和应用需求:
| 模型 | Tokenizer | 上下文 | 参数量 | 开源 | 适用场景 |
|---|---|---|---|---|---|
| Kronos-mini | Tokenizer-2k | 2048 | 4.1M | ✓ | 快速实验、轻量部署 |
| Kronos-small | Tokenizer-base | 512 | 24.7M | ✓ | 个人量化研究 |
| Kronos-base | Tokenizer-base | 512 | 102.3M | ✓ | 专业量化多资产预测 |
| Kronos-large | Tokenizer-base | 512 | 499.2M | ✗ | 高性能(未开源) |
所有开源模型均可在 HuggingFace Hub 上直接下载,采用 MIT 开源协议。
性能表现
根据论文报告,Kronos 在零样本(zero-shot)场景下表现亮眼:
- 相比领先的通用时间序列基础模型,准确率提升 93%
- 相比非预训练的最优基线模型(如 LSTM),准确率提升 87%
- 经过微调后,在多个下游任务上达到 SoTA
这意味着 Kronos 在没有任何特定资产数据微调的情况下,凭借预训练学到的金融市场通用知识,就能超越专门针对该资产训练的模型。
快速上手:三分钟开始预测
Kronos 提供了非常简洁的 API,几行代码就能完成从数据加载到结果预测的完整流程。
安装依赖
pip install -r requirements.txt
加载模型
from model import Kronos, KronosTokenizer, KronosPredictor
# 从 HuggingFace Hub 加载
tokenizer = KronosTokenizer.from_pretrained("NeoQuasar/Kronos-Tokenizer-base")
model = Kronos.from_pretrained("NeoQuasar/Kronos-small")
创建预测器
predictor = KronosPredictor(model, tokenizer, max_context=512)
准备数据
K 线数据需包含:open, high, low, close(必选),volume 和 amount 可选。
import pandas as pd
df = pd.read_csv("./data/XSHG_5min_600977.csv")
df["timestamps"] = pd.to_datetime(df["timestamps"])
lookback = 400
pred_len = 120
x_df = df.loc[:lookback-1, ["open", "high", "low", "close", "volume", "amount"]]
x_timestamp = df.loc[:lookback-1, "timestamps"]
y_timestamp = df.loc[lookback:lookback+pred_len-1, "timestamps"]
执行预测
pred_df = predictor.predict(
df=x_df,
x_timestamp=x_timestamp,
y_timestamp=y_timestamp,
pred_len=pred_len,
T=1.0,
top_p=0.9,
sample_count=1
)
print(pred_df.head())
返回的 DataFrame 包含预测的 open, high, low, close, volume, amount 值,以提供的 y_timestamp 为索引。
批量预测(多资产并行)
df_list = [df1, df2, df3]
x_timestamp_list = [x_ts1, x_ts2, x_ts3]
y_timestamp_list = [y_ts1, y_ts2, y_ts3]
pred_df_list = predictor.predict_batch(
df_list=df_list,
x_timestamp_list=x_timestamp_list,
y_timestamp_list=y_timestamp_list,
pred_len=pred_len,
T=1.0,
top_p=0.9,
sample_count=1
)
Live Demo:亲眼见证预测效果
Kronos 团队部署了 BTC/USDT 的实时预测演示,可访问查看模型预测效果:
演示页面展示:
- BTC/USDT 未来 24 小时概率预测
- 上涨概率(Upside Probability)
- 波动率预测(Volatility Amplification)
- MC 蒙特卡洛模拟路径均值和置信区间
演示使用 Kronos-mini(仅 4M 参数),接受约 360 小时(15天)的 1 小时 K 线历史数据,通过蒙特卡洛采样(N=30 路径)生成概率分布预测。
微调:让 Kronos 更懂你的市场
Kronos 提供了完整的微调(Finetuning)流程,支持使用 Qlib(微软开源量化平台)处理中国 A 股市场数据并进行回测。
微调流程分为 4 步:
- 配置:在
finetune/config.py中设置路径和超参数 - 数据准备:使用 Qlib 下载和处理数据
- 模型微调:分两步——先微调 Tokenizer,再微调 Predictor
- 回测验证:评估微调模型的策略表现
微调脚本支持多 GPU 训练(torchrun),适合大规模场景。
结语:Kronos 开启的金融 AI 新范式
Kronos 的出现并非仅仅多了一个预测模型。它将金融 K 线视为一种”语言”的思路,打开了全新的可能性:
- 多资产统一建模:一个模型理解全球各类金融市场
- 零样本迁移:从 BTC 到 A 股无需重新训练
- 概率预测:不只是点预测,而是完整的概率分布
- 开源民主化:将机构级金融 AI 能力开放给每一个开发者
对于量化研究者、加密货币交易员、金融 AI 从业者而言,Kronos 无疑是一个值得深入研究的重磅开源项目。
项目链接
- GitHub:https://github.com/shiyu-coder/Kronos
- 论文:arXiv:2508.02739
- HuggingFace 模型:huggingface.co/NeoQuasar
- Live Demo:shiyu-coder.github.io/Kronos-demo/
- 协议:MIT















cqlbgzs@163.com 1年前0
d好879445037@qq.com 2年前0
购买了 无法下载Alexcc 3年前0
强大Alexcc 3年前0
看不了教程Alexcc 3年前0
雷刺下载Alexcc 3年前0
下载Alexcc 3年前0
下载dsa456159 3年前0
下载