量化研究

2026 量化論文筆記:可驗證來源與可回測 proxy

2026/05/26 本機:reports/quant-research/quant-ai-allocation-backtest-2026.md HackMD

更新時間:2026-05-26 16:05 CST
定位:研究筆記 / proxy backtest,不是買賣建議。這篇只把「目前可找到公開來源」的論文納入;未找到公開來源的標題先不當成已發表事實。

一句話結論

【判斷】這批量化 AI 論文真正值得追的是同一個方向:不要只把 ML 拿來預測價格,而是讓模型直接學 portfolio decision / risk objective。但用簡化 proxy 回測後,結果也提醒一件事:降低風險比提高報酬容易;要打敗 SPY 的長期總報酬很難。

本次 proxy 回測中:

  • SPY buy-and-hold 總報酬最高:2018-01-02 至 2026-05-22 成長 3.15x,CAGR 14.67%,但最大回撤 -33.72%
  • Trend inverse-vol proxy 報酬較低:成長 2.04x,CAGR 8.91%,但最大回撤只有 -9.86%,Sharpe_0rf 1.19,是風險控制最強的版本。
  • Sparse tangent proxy 成長 2.19x,CAGR 9.81%,最大回撤 -19.35%;沒有明顯優於簡單等權。

【解讀】如果目標是「長期資本成長」,SPY 仍是強 benchmark;如果目標是「降低 drawdown / CVaR」,risk-aware allocation 才有研究價值。


1. 來源查證:哪些標題目前有公開來源?

原始題目 / 相關論文 查證狀態 公開來源 本文處理方式
Joint-Embedding Predictive Learning of Latent Market States in U.S. Equities 未找到精確公開論文 不納入正式回測,只保留為「regime encoder」研究方向
Signature-Informed Transformer for Asset Allocation 找到精確 arXiv arXiv: 2510.03129 納入,做 risk-aware direct allocation proxy
Portfolio Transformer for Attention-Based Asset Allocation 找到相關 arXiv arXiv: 2206.03246 納入,作為 direct Sharpe optimization 的前序參考
Global Merger-Arbitrage Forecasting with Language Models 未找到精確公開論文 不納入回測;M&A 需要 deal database,不適合用 ETF proxy 硬測
Decision-focused Sparse Tangent Portfolio Optimization 未找到精確同名論文 相關:arXiv 2410.21100、DOI 10.1016/j.orl.2016.05.012 納入 sparse tangent / sparse Sharpe proxy

2. 已有來源論文重點

2.1 Signature-Informed Transformer for Asset Allocation

【來源】Yoontae Hwang, Stefan Zohren, Signature-Informed Transformer for Asset Allocation, arXiv:2510.03129v3,分類 cs.LG / cs.AI / q-fin.PM,初版 2025-10-03,更新 2026-01-22。來源:https://arxiv.org/abs/2510.03129

【事實】arXiv 摘要指出,傳統 deep learning asset allocation 常把 forecasting 與 optimization 分開,作者認為這會造成「prediction error 低,但 portfolio decision 不一定好」的 mismatch。論文提出 Signature-Informed Transformer,把 path signatures、特殊 attention module 與 direct policy learning 結合,並直接最小化 Conditional Value at Risk,讓訓練目標與金融風險目標更一致。

【我的解讀】這篇的重點不是「Transformer 比 MA 更會預測價格」,而是:

  1. feature extraction 與 allocation decision 合併;
  2. objective 從 MSE / return forecast 換成 CVaR;
  3. 模型被設計成看資產之間的幾何關係,而不是單一資產時間序列。

【可疑點】金融資料低訊噪,Transformer 容易過擬合;若 turnover、交易成本、universe selection、survivorship bias 沒嚴格處理,漂亮結果不一定能實盤。

2.2 Portfolio Transformer for Attention-Based Asset Allocation

【來源】Damian Kisiel, Denise Gorse, Portfolio Transformer for Attention-Based Asset Allocation, arXiv:2206.03246。來源:https://arxiv.org/abs/2206.03246

【事實】arXiv 摘要表示,傳統流程是 returns forecasting 後再 optimization;Portfolio Transformer 則試圖繞過報酬預測,直接最佳化 Sharpe ratio,作為 end-to-end portfolio optimization framework。

【我的解讀】這是 #2 的前序精神:不要先預測報酬再丟 optimizer,而是讓模型直接對 portfolio performance 負責。

2.3 Sparse Sharpe / Sparse Tangent Portfolio

【來源 1】Yizun Lin, Zhao-Rong Lai, Cheng Li, A Globally Optimal Portfolio for m-Sparse Sharpe Ratio Maximization, arXiv:2410.21100。來源:https://arxiv.org/abs/2410.21100

【來源 2】Sparse tangent portfolio selection via semi-definite relaxation, Operations Research Letters, DOI: 10.1016/j.orl.2016.05.012。來源:https://doi.org/10.1016/j.orl.2016.05.012

【事實】arXiv:2410.21100 摘要指出,現代投組管理可能需要 m-sparse portfolio,也就是最多只持有 m 個活躍資產,以降低管理與交易成本;但 Sharpe ratio + sparsity constraint 因為非凸與稀疏限制而困難。該文將 m-sparse fractional optimization 轉換成等價的 m-sparse quadratic programming problem,並提出 proximal gradient algorithm。

【我的解讀】這條線比單純 AI 更接近實務:不是要持有 500 個權重很漂亮但沒法執行的資產,而是要在可管理的持倉數內,把風險調整後報酬做出來。


3. Proxy 回測設計

這次沒有重做原論文模型;原因是:

  1. Signature-Informed Transformer 需要完整訓練 pipeline、path signature feature、CVaR loss 與原始 universe 設定。
  2. Portfolio Transformer 需要神經網路架構與訓練資料切分。
  3. Sparse Sharpe 需要更嚴格 optimizer;本文只做「可解釋、可重現」的近似版本。

因此本文做的是 proxy backtest:用簡化規則模擬論文思想,而不是宣稱復現論文。

資料與假設

【資料來源】Yahoo Finance chart API adjusted close。下載檔保存在本地:assets/quant-research/quant-paper-proxy-backtest/yahoo_adjusted_close.csv

【回測區間】2018-01-02 至 2026-05-22,共 2109 個交易日。

【資產池】

  • SPY:S&P 500 ETF
  • QQQ:Nasdaq 100 ETF
  • IWM:Russell 2000 ETF
  • TLT:20Y Treasury ETF
  • GLD:Gold ETF
  • HYG:High-yield bond ETF
  • UUP:US Dollar ETF

【交易假設】

  • 月底再平衡。
  • 使用 adjusted close。
  • 每次單邊 turnover 成本 5 bps。
  • 不含稅,不含借券 / 放空,不含股息稅差異。
  • 現金部位報酬假設為 0%。

策略定義

策略 對應研究概念 實作 proxy
SPY buy-and-hold benchmark 100% SPY,買入持有
Monthly equal weight naive diversified baseline 7 個 ETF 每月等權再平衡
Trend inverse-vol proxy Signature / CVaR / risk-control 思路 僅持有價格高於 200 日均線的資產,權重按 63 日 realized volatility 反比配置
Sparse tangent proxy sparse Sharpe / tangent portfolio 思路 每月用過去 252 日估計 mean / covariance,選 trailing Sharpe 前 3 名,再用 shrinkage covariance 做 long-only tangent-like weighting

4. 回測結果

4.1 總表

strategy final_growth_x total_return_pct cagr_pct ann_vol_pct sharpe_0rf max_drawdown_pct worst_month_pct positive_month_pct avg_annual_turnover_x rebalance_count
SPY buy-and-hold 3.15 215.04 14.67 19.23 0.76 -33.72 -12.49 67.00 0.12 1
Monthly equal weight 2.23 122.69 10.02 10.42 0.96 -18.79 -6.23 65.00 0.45 102
Trend inverse-vol proxy 2.04 104.47 8.91 7.51 1.19 -9.86 -3.83 68.00 4.12 97
Sparse tangent proxy 2.19 119.15 9.81 10.86 0.90 -19.35 -8.80 67.00 5.30 90

【解讀】

  • SPY 仍然是最難打敗的總報酬 benchmark。
  • Trend inverse-vol proxy 不是報酬最高,但 drawdown 壓得最漂亮;這比較符合「CVaR / risk-aware allocation」的研究價值。
  • Sparse tangent proxy 沒有打敗等權太多,且 turnover 較高。這提醒:sparse Sharpe 在小資產池、粗糙估計下,不會自動變魔法。

4.2 年度報酬

year SPY buy-and-hold Monthly equal weight Trend inverse-vol proxy Sparse tangent proxy
2018 -5.25 -2.02 -2.02 -5.25
2019 31.22 21.03 15.61 15.19
2020 18.33 18.96 17.11 12.97
2021 28.73 9.99 5.80 9.18
2022 -18.18 -15.39 1.78 1.99
2023 26.18 18.13 10.63 7.27
2024 24.89 14.53 11.98 16.13
2025 17.72 16.52 11.86 16.30
2026 YTD 9.64 7.67 3.34 10.21

【解讀】

2022 是最有資訊量的一年:SPY -18.18%,等權 -15.39%,但 Trend inverse-vol 與 Sparse tangent proxy 都小幅正報酬。這表示 risk-control / trend filter 的核心價值是在熊市與升息壓力期保命,而不是在 2021 或 2023 這種強多頭衝最快。

4.3 期末權重

strategy SPY QQQ IWM TLT GLD HYG UUP
SPY buy-and-hold 100.0 0.0 0.0 0.0 0.0 0.0 0.0
Monthly equal weight 14.3 14.3 14.4 14.3 14.1 14.3 14.3
Trend inverse-vol proxy 12.6 9.6 8.6 0.0 6.6 32.5 30.1
Sparse tangent proxy 43.7 36.1 20.2 0.0 0.0 0.0 0.0

【解讀】

  • Trend inverse-vol proxy 的期末配置偏 HYG / UUP,表示在當下規則中,低波動與趨勢條件讓風險資產權重被壓低。
  • Sparse tangent proxy 集中在 SPY / QQQ / IWM,這比較像「風險資產 momentum 延伸」,不是真正防守策略。

5. 對四個研究方向的實務判斷

A. JEPA market state:可研究,但先不要急著交易

【狀態】未找到公開精確論文,因此不納入本文實證。

【如果要做】我會先拿它做 regime encoder,不直接拿來下單。驗證重點是:embedding 是否能提前或同步辨識 volatility spike、correlation breakdown、breadth deterioration,而不是只重現 VIX。

B. Signature / Portfolio Transformer:真正價值在風控 objective

【狀態】有公開來源。

【本文 proxy 結果】Trend inverse-vol proxy 顯示:如果把目標放在 CVaR / drawdown control,確實可以顯著降低最大回撤;但代價是犧牲多頭市場報酬。

【實務意義】這類模型比較適合:

  • 多資產配置;
  • 風控 overlay;
  • 退休 / family office / 低回撤目標;
  • 不是純粹追求打敗 QQQ 的 aggressive strategy。

C. Merger-arbitrage LLM:不要用 ETF proxy 硬測

【狀態】未找到公開精確論文。

【原因】M&A arbitrage 的資料單位是 deal,不是 daily ETF price。需要 deal announcement、deal terms、regulatory status、spread、completion / break outcome。沒有乾淨 deal database,用 ETF 回測沒有意義。

D. Sparse tangent / sparse Sharpe:數學漂亮,但估計誤差是敵人

【狀態】有相關公開來源。

【本文 proxy 結果】Sparse tangent proxy 沒有明顯打敗等權,且 turnover 更高。

【解讀】這不是否定 sparse Sharpe,而是提醒:mean / covariance estimation 很脆弱。若要在台股或美股個股實作,必須加上:

  • shrinkage covariance;
  • liquidity filter;
  • turnover penalty;
  • sector cap;
  • walk-forward validation;
  • transaction cost sensitivity。

6. 下一步:如果要做成真正研究系統

我會分三階段:

  1. 先做 baseline suite:SPY、等權、risk parity、trend inverse-vol、sparse Sharpe。
  2. 再做台股 / 美股 universe:加入流動性、產業限制、交易成本、稅制。
  3. 最後才上神經網路:Transformer / JEPA 必須打敗上述 baseline,否則只是把 overfit 包裝得比較高級。

【關鍵判準】不是 in-sample Sharpe,而是:

  • walk-forward CAGR;
  • max drawdown;
  • turnover-adjusted return;
  • 2020 / 2022 / 2025-2026 各市場 regime 表現;
  • 是否能在不同 universe 上維持方向一致。

7. 可重現資料

本次輸出檔:

回測腳本:scripts/quant_paper_backtest.py


來源

  1. Yoontae Hwang, Stefan Zohren, Signature-Informed Transformer for Asset Allocation, arXiv:2510.03129. https://arxiv.org/abs/2510.03129
  2. Damian Kisiel, Denise Gorse, Portfolio Transformer for Attention-Based Asset Allocation, arXiv:2206.03246. https://arxiv.org/abs/2206.03246
  3. Yizun Lin, Zhao-Rong Lai, Cheng Li, A Globally Optimal Portfolio for m-Sparse Sharpe Ratio Maximization, arXiv:2410.21100. https://arxiv.org/abs/2410.21100
  4. Sparse tangent portfolio selection via semi-definite relaxation, Operations Research Letters. DOI: 10.1016/j.orl.2016.05.012. https://doi.org/10.1016/j.orl.2016.05.012
  5. Yahoo Finance chart API, adjusted close data for SPY / QQQ / IWM / TLT / GLD / HYG / UUP, downloaded 2026-05-26. Example endpoint pattern: https://query1.finance.yahoo.com/v8/finance/chart/SPY

Tags

量化研究、asset allocation、Transformer、Sharpe Ratio、backtest