2026-03-28

DeePM: 레짐 강건 딥러닝 기반 매크로 포트폴리오 관리

서론: 실전 포트폴리오 운용의 세 가지 난제

전통적인 추세 추종(trend-following) 전략은 2013~2019년 “CTA 겨울” 시기를 거치며 심각한 성과 부진을 경험했다. 레짐(시장 국면)이 바뀔 때마다 모델 성능이 무너지는 “레짐 취약성”은 퀀트 포트폴리오 운용의 고질적인 문제다.

옥스퍼드 대학 Oxford-Man Institute의 Kieran Wood, Stephen Roberts, Stefan Zohren 팀이 arXiv:2601.05975에 발표한 **DeePM(Deep Portfolio Manager)**은 실전 운용에서 발생하는 세 가지 근본 문제를 동시에 해결한다:

비동기 데이터(Ragged Filtration): 아시아·미국 선물처럼 서로 다른 시간대에 마감하는 자산 간 동시 데이터 사용으로 인한 룩어헤드 편향
낮은 신호 대비 잡음비(Low SNR): 금융 시계열의 구조적 노이즈
레짐 취약성: 특정 시장 환경에 과적합되어 레짐 전환 시 성능 붕괴

백테스트 결과 DeePM은 고전적 추세 추종 대비 순 위험조정 수익률 약 2배, 기존 최고 성능 모델인 Momentum Transformer 대비 약 1.5배의 샤프 비율을 달성했다.

본론: DeePM의 핵심 혁신 4가지

1. 인과적 체 (Causal Sieve): 룩어헤드 편향 원천 차단

멀티 자산 어텐션 모델의 가장 치명적인 함정은 동시 데이터에 의한 허구적 상관관계다. 예를 들어 같은 날 종가 기준으로 아시아 선물과 미국 선물을 동시에 어텐션 레이어에 입력하면, 실거래에서는 절대 얻을 수 없는 미래 정보가 모델에 스며든다.

DeePM의 해법은 Causal Sieve: 크로스 자산 어텐션에서 키(Key)와 값(Value)을 t-1 시점으로 강제 지연한다.

att(Q_t, K_{t-1}, V_{t-1})

시점 t의 쿼리는 모든 자산의 t-1 키/값을 참조하므로, 모델이 학습하는 것은 진짜 인과적 충격-반응 신호(Transfer Entropy)다. 흥미롭게도 정보 최신성을 극대화하는 “계단식(cascading)” 필터링보다 보수적 인과 체가 실제 OOS 성능이 더 높았다.

2. SoftMin-EVaR 목적함수: 레짐 취약성 제거

풀링된 샤프 비율 극대화는 “평균적으로는 좋지만 최악의 국면에서는 무너진다”는 은폐된 과적합을 낳는다. DeePM은 이를 SoftMin-EVaR 목적함수로 대체한다.

롤링 윈도우별 샤프 비율 중 최악 윈도우에 패널티를 가중하는 방식으로, 수학적으로 엔트로픽 가치-위험(EVaR, Entropic Value-at-Risk) — CVaR보다 테일에 민감한 코히런트 위험 척도 — 의 쌍대 형식과 동치다.

SoftMin_α(v) = −(1/α) log Σ_k exp(−α v_k)
EVaR_β(X) = inf_{z>0} { z⁻¹ log E[e^{-X/z}] + z·log(1/β) }

어블레이션 결과 이 목적함수가 OOS 안정성에 가장 큰 단일 기여 요인이었다. CTA 겨울(2013~2019), COVID, 인플레이션 쇼크, 고금리 지속 국면에서 일관되게 양의 성과를 유지했다.

3. 거시경제 그래프 사전(GNN): 경제적 위상 주입

데이터만으로 학습하면 노이즈에 과적합된 공분산 구조가 생성된다. DeePM은 경제적 연결 그래프를 그래프 신경망(GNN) 레이어로 주입해 스펙트럼 저역통과 필터 역할을 한다.

금리 ↔ FX (캐리 채널)
에너지 ↔ 인플레이션
BTC ↔ DXY (위험 선호도)

결과: 순수 데이터 기반 어텐션 대비 최대 낙폭(MDD) 21% 감소.

4. 전체 아키텍처 스택

입력 피처
  → VSN (변수 선택 네트워크: 노이즈 필터링)
  → LSTM (로컬 경로 의존성, 변동성 노이즈 제거)
  → 시간적 자기 어텐션 (장기 레짐 의존성)
  → Causal Sieve (크로스 자산, 엄격한 t-1 지연)
  → 매크로 GNN (경제 그래프 정규화)
  → SoftMin-EVaR 목적함수
  → 포트폴리오 가중치 w_t

결론: 실전 적용 시사점

DeePM이 제시하는 핵심 교훈은 세 가지다:

비동기 데이터의 룩어헤드 편향은 아키텍처 수준에서 막아야 한다. 데이터 전처리 단계 교정만으로는 불충분하다.
샤프 비율 극대화는 레짐 취약성을 숨긴다. 최악 국면 패널티를 훈련 목적함수에 포함시켜야 진짜 강건한 모델이 나온다.
경제 이론과 데이터 학습의 결합이 순수 데이터 기반보다 강하다. GNN 그래프 사전은 낮은 데이터·고불확실성 레짐에서 특히 효과적이다.

거래 비용 스케일러(γ=0.5)와 상위 K개 시드 앙상블도 주목할 만한 실용적 기여다. 실전 거래에서 학습 비용과 실제 비용 사이의 최적 균형을 찾는 것은 별도 데이터셋별 캘리브레이션이 필요하다.

📚 출처 및 참고자료

원본 논문: DeePM: Regime-Robust Deep Learning for Systematic Macro Portfolio Management
분석: Luxon AI ORACLE 리서치팀
원본 파일: oracle-2026-03-27-deepm-regime-robust-portfolio.md
게시일: 2026-03-28

이 분석은 교육·리서치 목적입니다. 투자 조언이 아닙니다.

← BACK TO BLOG