Research Framework

多模型特征工程框架

Regime · Volatility · Filter · Frequency · Memory · Decomposition

六个经典与现代量化模型,每一个产出一组互补的特征流,喂给 AlphaMind 预测引擎。 我们不是用深度学习取代统计学,而是把它们叠在一起。

01 — 前提

为什么用 6 个模型,而不是一个大模型

单一视角不够

市场是异质的——状态、波动率、微观结构噪声、频率,各自活在不同时间尺度上。 一个模型不可能同时把它们全看清。

误差去相关

6 个归纳偏置不重叠的独立模型,会产出严格更不相关的误差。 引擎拿到的是一个更丰富、去相关的特征空间。

可解释

每一个模块的输出都数学可追溯。当引擎的预测改变时, 我们能归因到具体哪一路特征流变了。

02 — 模型栈

六个互补的量化模型

每个模型产出一组特征流,喂入 AlphaMind 预测引擎——它们共同构成引擎的输入 embedding。

状态识别

HMM Regime

Hidden Markov Model · 隐马尔可夫模型

基于状态空间的概率模型,从可观测的价格动力学中推断市场的潜在状态(牛/熊/震荡)。我们让每一次预测都以当前 regime 为条件——忽略 regime 的预测在数学上就是错的。

P(sₜ | x₁:ₜ) ∝ P(xₜ | sₜ) · Σ P(sₜ | sₜ₋₁) · P(sₜ₋₁ | x₁:ₜ₋₁)
在管道里的角色

产出 regime 标签,引擎据此路由到对应的预测头。

Rabiner (1989) · Hamilton (1989)
波动率

HAR-RV

Heterogeneous Autoregressive Realized Volatility

一个长记忆的波动率预测模型,把日、周、月三个时间尺度的实现方差联合起来。它捕捉到一个 GARCH 单独捕捉不到的事实——今天的波动率受多个时间尺度上波动率的同时影响。

RVₜ₊₁ = β₀ + β_d·RVₜ⁽ᵈ⁾ + β_w·RVₜ⁽ʷ⁾ + β_m·RVₜ⁽ᵐ⁾ + εₜ₊₁
在管道里的角色

校准引擎的置信区间——预测带的宽窄随 HAR-RV 的波动率预测扩张/收窄。

Corsi (2009)
滤波

Kalman Filter

卡尔曼滤波 · 递归状态空间估计器

一个最优递归滤波器,把噪声观测和潜在状态的动态模型融合在一起。我们用它从原始报价中提取不可观测的"真实价格"分量——把降噪后的信号交给引擎,而不是原始市场噪声。

x̂ₜ|ₜ = x̂ₜ|ₜ₋₁ + Kₜ(yₜ − Hₜ x̂ₜ|ₜ₋₁)
在管道里的角色

在 tokenization 之前对 OHLCV 流做降噪预处理,输出干净的状态向量。

Kalman (1960)
频域

ATFNet

自适应时频网络
TIMEFREQ

一个在时域和频域同时学习特征的神经网络架构,通过共享的自适应骨干完成两个域的特征提取。它能捕捉到纯时域模型系统性会漏掉的周期结构(日内季节性、交易时段效应等)。

h = Adaptive[ Encoderₜ(x) ⊕ Encoder_f(F{x}) ]
在管道里的角色

提供频率敏感的特征 embedding,拼接到 token 流里。

Liu et al. (2024)
长期记忆

Hurst Exponent

Hurst 指数 · R/S 长期记忆统计量
log nR/SH ≈ 0.62

从价格序列的 R/S 重标极差统计量估计的标度指数。H = 0.5 即随机游走;H > 0.5 即持续/趋势;H < 0.5 即均值回归。它告诉引擎该用哪种 prediction prior。

E[R(n)/S(n)] ∼ n^H, H = lim (log E[R/S]) / (log n)
在管道里的角色

在引擎内部的"趋势跟随"和"均值回归"两个预测头之间做切换。

Hurst (1951) · Mandelbrot & Wallis (1969)
信号分解

VMD

变分模态分解

一种非递归的信号分解方法,把价格序列分解成一组围绕自适应估计的中心频率的带限振荡模态。我们对每个模态分别建模,再聚合——是一个 decomposition-then-forecast 的流水线。

min { Σₖ ‖∂ₜ[(δ + j/(πt)) ∗ uₖ(t)] e^{−jωₖt}‖² }
在管道里的角色

多频段特征流——高/中/低频组件分别独立预测。

Dragomiretskiy & Zosso (2014)
03 — 整合

六路特征如何进入引擎

状态识别
波动率
滤波
TIMEFREQ
频域
log nR/SH ≈ 0.62
长期记忆
信号分解
Concatenate · Embed · Project
AlphaMind AI 预测引擎

参考文献

  • Rabiner, L. R. (1989). A tutorial on hidden Markov models and selected applications in speech recognition. Proceedings of the IEEE.
  • Hamilton, J. D. (1989). A new approach to the economic analysis of nonstationary time series and the business cycle. Econometrica.
  • Corsi, F. (2009). A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics.
  • Kalman, R. E. (1960). A new approach to linear filtering and prediction problems. Journal of Basic Engineering.
  • Liu, H. et al. (2024). ATFNet: Adaptive Time-Frequency Ensembled Network for Long-term Time Series Forecasting.
  • Hurst, H. E. (1951). Long-term storage capacity of reservoirs. Transactions of the American Society of Civil Engineers.
  • Dragomiretskiy, K., & Zosso, D. (2014). Variational mode decomposition. IEEE Transactions on Signal Processing.

别错过唯一能真正帮你赢在日内交易的AI

没有复杂术语,没有噪音,没有混乱的指标
只有清晰、可执行的信号。