AlphaMind 预测引擎
针对商品期货与外汇深度优化的时序基础模型
一个 decoder-only Transformer,学的是 K 线序列的"语言"。 我们把价格行为 tokenize、在外汇与期货数据上自回归预训练,再把预测解码回概率分布的价格路径。
AlphaMind 预测引擎
针对商品期货与外汇深度优化的时序基础模型
Sequence Ingestion
Hierarchical Token Pairs
Autoregressive Forecast
Decoder-only Transformer · 自监督学习 · 端到端深度学习
什么是时序基础模型
基础模型(foundation model)是一个在海量数据上以自监督方式预训练的大模型, 然后再特化到下游任务。GPT 在自然语言上做到了这件事, Kronos 系列架构在 K 线上做到了同样的事。
AlphaMind 预测引擎是一个 decoder-only Transformer, 在金融时序的"语言"上预训练。它把一段 OHLCV K 线序列当作 GPT 看一段词序列那样处理—— tokenize、学条件分布、向前采样。
两阶段:(1) 一个学习好的 tokenizer 把连续 OHLCV 转成分层离散 token; (2) 一个因果 Transformer 自回归预测下一个 token。 推理时我们采样多条 token 路径、解码回价格、聚合成概率分布预测。
端到端三阶段
价格编码 → 推理核心 → 信号重组。上方动画展示了一次完整推理。
价格编码 · Price Encoding
学习好的 tokenizer 把连续 OHLCV 流映射成分层离散 token—— 每个 token 拆成粗粒度子 token(k_c bits)和细粒度子 token(k_f bits), 通过 Binary Spherical Quantization 量化。
推理核心 · Reasoning Core
一个因果 Transformer,N 层堆叠——多头自注意力、前馈网络、残差、Layer-Norm。 以 next-token prediction 的交叉熵自回归训练。
信号重组 · Signal Reconstruction
生成的 token 通过 tokenizer 的 decoder 解码回 OHLCV。 我们采样多条路径、聚合成概率分布、返回中位数路径与置信带。
针对商品期货与外汇专门训练
这个引擎不是通用时序模型——它专门在我们关心的市场上预训练。
外汇主要 + 交叉盘
EUR/USD、GBP/USD、USD/JPY、USD/CHF、AUD/USD、USD/CAD、NZD/USD 加主要交叉盘。 M1 到 H1 K 线,每个货币对至少 10 年历史数据。
商品 & 指数期货
黄金、白银、原油、布伦特、天然气、铜;标普 500、纳斯达克 100、道琼斯、 DAX、日经 225 期货。M1 到 H1,连续合约(已调整 roll)。
为什么专精,而不是泛化
一个泛化的时序基础模型——在天气、交通、零售等所有数据集上训练过——会在每个领域都"还行"。 我们做了一个明确的取舍:窄领域、深专精。
外汇和期货共享关键属性——24/5 流动性、美元计价、微秒级订单流、有清晰的交易时段结构。 一个 tokenizer 加一个 Transformer 可以把它们当作同一个市场"语言"的两个"方言"建模。
加密货币、股票、期权——微观结构不同、波动率分布不同、交易时段不同。 我们刻意不放进训练集,免得引擎被一个它没被设计来处理的市场拉偏。
输出概率分布,而不是单点
引擎不输出单一数字。对每个预测时段,我们从模型采样 N 条 token 路径、 每条解码回一条价格路径、聚合成完整的概率分布 P(x_{t+1:T} | x_{1:t})。
下游拿到的:中位数路径、百分位带(10/25/50/75/90),以及 价格在预测时段内突破某区间的校准概率。每个信号都在这个分布上 size—— 不是基于单点估计。
引擎看到的不是裸价格
六个经典与现代量化模型预先处理输入——状态、波动、滤波、频域、记忆、分解。 引擎拿到的是一个特征工程后的 embedding,不是原始 OHLCV 流。
多模型特征工程框架