Kronos:首个开源金融K线基础模型,被AAAI 2026收录的金融AI新星

引言:当金融K线有了自己的语言模型

2025年7月,一个名为 Kronos 的项目悄然登陆 GitHub,不到一年便斩获近 3 万星标,成为 AI + 金融领域最炙手可热的开源项目。这个由清华大学团队打造的项目,被人工智能顶级会议 AAAI 2026 收录,标志着金融时序基础模型进入了一个全新的时代。

本文将带你全面认识 Kronos——这个被誉为”金融市场的语言模型”的开源神器。

Kronos Logo

什么是 Kronos?

Kronos 是首个专为金融 K 线(Candlestick/K-line)数据设计的开源基础模型(Foundation Model)。与传统的时间序列基础模型(TSFM)不同,Kronos 并非通用型模型,而是专门针对金融数据高噪声、多维度、非平稳的特性量身定制。

它由 Yu Shi(施煜)及其团队(包括宗良福、陈硕、赵博涵、许伟、张长水、李建)开发,训练数据覆盖 45+ 家全球交易所,涵盖加密货币、股票、商品期货和衍生品等多种资产类别。

此外,Kronos 论文已被 AAAI 2026(人工智能领域最顶级会议之一)正式接收,论文全文可在 arXiv 上查阅。

Kronos Overview

Kronos 两阶段框架概览

为什么金融 K 线需要专用基础模型?

一根 K 线并不是五个独立数字的简单组合:

  • 开盘与收盘的关系——反映了市场情绪(阳线/阴线)
  • 上下影线——编码了价格被拒绝和市场的犹豫
  • 成交量——验证或否定价格行为的可靠性
  • K线形态组合(十字星、锤子线、吞没形态等)——讲述着市场心理的故事

然而,大多数通用时间序列基础模型(如 TimesFM、Chronos、Moirai)把金融数据当作普通的单变量序列来处理,完全丢失了 K 线背后丰富的多维语义信息。这就好比用处理电量预测的模型去解读莎士比亚——架构没错,但理解不了内容。

Kronos 正是为了解决这个问题而生——它将 K 线数据视为一种特殊的”金融市场语言”,从零开始构建专门的理解系统。

核心创新:两阶段框架

Kronos 最核心的创新在于其独特的 两阶段框架

阶段一:专用 Tokenizer 量化 OHLCV 数据

Kronos 设计了一种 专用的金融 Tokenizer,将连续的多维 K 线数据(Open, High, Low, Close, Volume/Amount)量化为 层级化的离散 Token

这个 Tokenizer 学习了 K 线形态的”词汇表”——就像语言模型学习词根一样,它能将价格区间、实体大小、影线比例、成交量水平等关键特征编码为结构化的 Token,同时保留它们之间的内在关系。

Kronos 提供两个版本的 Tokenizer:

  • Kronos-Tokenizer-2k(词汇量 2048,用于 mini 版本)
  • Kronos-Tokenizer-base(词汇量 512,用于 small/base/large 版本)

阶段二:自回归 Transformer 预训练

量化后的离散 Token 序列被送入一个 Decoder-only 的 Transformer 进行自回归预训练。模型学习预测下一个 K 线 Token,就像 GPT 预测下一个单词一样。

这个将连续多维回归问题转化为离散序列建模问题的思路非常优雅——因为 Transformer 在序列建模方面已被证明极其强大。

预训练完成后,Kronos 可以在零样本(zero-shot)条件下,直接应用于从未见过的任务——不同市场、不同时间周期、不同资产类别,无需微调即可上手。

模型家族:多种规格适配不同场景

Kronos 提供了多个规格的预训练模型,满足不同的计算资源和应用需求:

模型 Tokenizer 上下文 参数量 开源 适用场景
Kronos-mini Tokenizer-2k 2048 4.1M 快速实验、轻量部署
Kronos-small Tokenizer-base 512 24.7M 个人量化研究
Kronos-base Tokenizer-base 512 102.3M 专业量化多资产预测
Kronos-large Tokenizer-base 512 499.2M 高性能(未开源)

所有开源模型均可在 HuggingFace Hub 上直接下载,采用 MIT 开源协议。

性能表现

根据论文报告,Kronos 在零样本(zero-shot)场景下表现亮眼:

  • 相比领先的通用时间序列基础模型,准确率提升 93%
  • 相比非预训练的最优基线模型(如 LSTM),准确率提升 87%
  • 经过微调后,在多个下游任务上达到 SoTA

这意味着 Kronos 在没有任何特定资产数据微调的情况下,凭借预训练学到的金融市场通用知识,就能超越专门针对该资产训练的模型。

快速上手:三分钟开始预测

Kronos 提供了非常简洁的 API,几行代码就能完成从数据加载到结果预测的完整流程。

安装依赖

pip install -r requirements.txt

加载模型

from model import Kronos, KronosTokenizer, KronosPredictor

# 从 HuggingFace Hub 加载
tokenizer = KronosTokenizer.from_pretrained("NeoQuasar/Kronos-Tokenizer-base")
model = Kronos.from_pretrained("NeoQuasar/Kronos-small")

创建预测器

predictor = KronosPredictor(model, tokenizer, max_context=512)

准备数据

K 线数据需包含:open, high, low, close(必选),volume 和 amount 可选。

import pandas as pd

df = pd.read_csv("./data/XSHG_5min_600977.csv")
df["timestamps"] = pd.to_datetime(df["timestamps"])

lookback = 400
pred_len = 120

x_df = df.loc[:lookback-1, ["open", "high", "low", "close", "volume", "amount"]]
x_timestamp = df.loc[:lookback-1, "timestamps"]
y_timestamp = df.loc[lookback:lookback+pred_len-1, "timestamps"]

执行预测

pred_df = predictor.predict(
    df=x_df,
    x_timestamp=x_timestamp,
    y_timestamp=y_timestamp,
    pred_len=pred_len,
    T=1.0,
    top_p=0.9,
    sample_count=1
)

print(pred_df.head())

返回的 DataFrame 包含预测的 open, high, low, close, volume, amount 值,以提供的 y_timestamp 为索引。

批量预测(多资产并行)

df_list = [df1, df2, df3]
x_timestamp_list = [x_ts1, x_ts2, x_ts3]
y_timestamp_list = [y_ts1, y_ts2, y_ts3]

pred_df_list = predictor.predict_batch(
    df_list=df_list,
    x_timestamp_list=x_timestamp_list,
    y_timestamp_list=y_timestamp_list,
    pred_len=pred_len,
    T=1.0,
    top_p=0.9,
    sample_count=1
)

Live Demo:亲眼见证预测效果

Kronos 团队部署了 BTC/USDT 的实时预测演示,可访问查看模型预测效果:

👉 Kronos Live Demo

演示页面展示:

  • BTC/USDT 未来 24 小时概率预测
  • 上涨概率(Upside Probability)
  • 波动率预测(Volatility Amplification)
  • MC 蒙特卡洛模拟路径均值和置信区间

演示使用 Kronos-mini(仅 4M 参数),接受约 360 小时(15天)的 1 小时 K 线历史数据,通过蒙特卡洛采样(N=30 路径)生成概率分布预测。

微调:让 Kronos 更懂你的市场

Kronos 提供了完整的微调(Finetuning)流程,支持使用 Qlib(微软开源量化平台)处理中国 A 股市场数据并进行回测。

微调流程分为 4 步:

  1. 配置:在 finetune/config.py 中设置路径和超参数
  2. 数据准备:使用 Qlib 下载和处理数据
  3. 模型微调:分两步——先微调 Tokenizer,再微调 Predictor
  4. 回测验证:评估微调模型的策略表现

微调脚本支持多 GPU 训练(torchrun),适合大规模场景。

结语:Kronos 开启的金融 AI 新范式

Kronos 的出现并非仅仅多了一个预测模型。它将金融 K 线视为一种”语言”的思路,打开了全新的可能性:

  • 多资产统一建模:一个模型理解全球各类金融市场
  • 零样本迁移:从 BTC 到 A 股无需重新训练
  • 概率预测:不只是点预测,而是完整的概率分布
  • 开源民主化:将机构级金融 AI 能力开放给每一个开发者

对于量化研究者、加密货币交易员、金融 AI 从业者而言,Kronos 无疑是一个值得深入研究的重磅开源项目。


项目链接

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享