DeePM: 레짐 강건 딥러닝 기반 매크로 포트폴리오 관리
서론: 실전 포트폴리오 운용의 세 가지 난제
전통적인 추세 추종(trend-following) 전략은 2013~2019년 “CTA 겨울” 시기를 거치며 심각한 성과 부진을 경험했다. 레짐(시장 국면)이 바뀔 때마다 모델 성능이 무너지는 “레짐 취약성”은 퀀트 포트폴리오 운용의 고질적인 문제다.
옥스퍼드 대학 Oxford-Man Institute의 Kieran Wood, Stephen Roberts, Stefan Zohren 팀이 arXiv:2601.05975에 발표한 **DeePM(Deep Portfolio Manager)**은 실전 운용에서 발생하는 세 가지 근본 문제를 동시에 해결한다:
- 비동기 데이터(Ragged Filtration): 아시아·미국 선물처럼 서로 다른 시간대에 마감하는 자산 간 동시 데이터 사용으로 인한 룩어헤드 편향
- 낮은 신호 대비 잡음비(Low SNR): 금융 시계열의 구조적 노이즈
- 레짐 취약성: 특정 시장 환경에 과적합되어 레짐 전환 시 성능 붕괴
백테스트 결과 DeePM은 고전적 추세 추종 대비 순 위험조정 수익률 약 2배, 기존 최고 성능 모델인 Momentum Transformer 대비 약 1.5배의 샤프 비율을 달성했다.
본론: DeePM의 핵심 혁신 4가지
1. 인과적 체 (Causal Sieve): 룩어헤드 편향 원천 차단
멀티 자산 어텐션 모델의 가장 치명적인 함정은 동시 데이터에 의한 허구적 상관관계다. 예를 들어 같은 날 종가 기준으로 아시아 선물과 미국 선물을 동시에 어텐션 레이어에 입력하면, 실거래에서는 절대 얻을 수 없는 미래 정보가 모델에 스며든다.
DeePM의 해법은 Causal Sieve: 크로스 자산 어텐션에서 키(Key)와 값(Value)을 t-1 시점으로 강제 지연한다.
att(Q_t, K_{t-1}, V_{t-1})
시점 t의 쿼리는 모든 자산의 t-1 키/값을 참조하므로, 모델이 학습하는 것은 진짜 인과적 충격-반응 신호(Transfer Entropy)다. 흥미롭게도 정보 최신성을 극대화하는 “계단식(cascading)” 필터링보다 보수적 인과 체가 실제 OOS 성능이 더 높았다.
2. SoftMin-EVaR 목적함수: 레짐 취약성 제거
풀링된 샤프 비율 극대화는 “평균적으로는 좋지만 최악의 국면에서는 무너진다”는 은폐된 과적합을 낳는다. DeePM은 이를 SoftMin-EVaR 목적함수로 대체한다.
롤링 윈도우별 샤프 비율 중 최악 윈도우에 패널티를 가중하는 방식으로, 수학적으로 엔트로픽 가치-위험(EVaR, Entropic Value-at-Risk) — CVaR보다 테일에 민감한 코히런트 위험 척도 — 의 쌍대 형식과 동치다.
SoftMin_α(v) = −(1/α) log Σ_k exp(−α v_k)
EVaR_β(X) = inf_{z>0} { z⁻¹ log E[e^{-X/z}] + z·log(1/β) }
어블레이션 결과 이 목적함수가 OOS 안정성에 가장 큰 단일 기여 요인이었다. CTA 겨울(2013~2019), COVID, 인플레이션 쇼크, 고금리 지속 국면에서 일관되게 양의 성과를 유지했다.
3. 거시경제 그래프 사전(GNN): 경제적 위상 주입
데이터만으로 학습하면 노이즈에 과적합된 공분산 구조가 생성된다. DeePM은 경제적 연결 그래프를 그래프 신경망(GNN) 레이어로 주입해 스펙트럼 저역통과 필터 역할을 한다.
- 금리 ↔ FX (캐리 채널)
- 에너지 ↔ 인플레이션
- BTC ↔ DXY (위험 선호도)
결과: 순수 데이터 기반 어텐션 대비 최대 낙폭(MDD) 21% 감소.
4. 전체 아키텍처 스택
입력 피처
→ VSN (변수 선택 네트워크: 노이즈 필터링)
→ LSTM (로컬 경로 의존성, 변동성 노이즈 제거)
→ 시간적 자기 어텐션 (장기 레짐 의존성)
→ Causal Sieve (크로스 자산, 엄격한 t-1 지연)
→ 매크로 GNN (경제 그래프 정규화)
→ SoftMin-EVaR 목적함수
→ 포트폴리오 가중치 w_t
결론: 실전 적용 시사점
DeePM이 제시하는 핵심 교훈은 세 가지다:
- 비동기 데이터의 룩어헤드 편향은 아키텍처 수준에서 막아야 한다. 데이터 전처리 단계 교정만으로는 불충분하다.
- 샤프 비율 극대화는 레짐 취약성을 숨긴다. 최악 국면 패널티를 훈련 목적함수에 포함시켜야 진짜 강건한 모델이 나온다.
- 경제 이론과 데이터 학습의 결합이 순수 데이터 기반보다 강하다. GNN 그래프 사전은 낮은 데이터·고불확실성 레짐에서 특히 효과적이다.
거래 비용 스케일러(γ=0.5)와 상위 K개 시드 앙상블도 주목할 만한 실용적 기여다. 실전 거래에서 학습 비용과 실제 비용 사이의 최적 균형을 찾는 것은 별도 데이터셋별 캘리브레이션이 필요하다.
📚 출처 및 참고자료
- 원본 논문: DeePM: Regime-Robust Deep Learning for Systematic Macro Portfolio Management
- 분석: Luxon AI ORACLE 리서치팀
- 원본 파일: oracle-2026-03-27-deepm-regime-robust-portfolio.md
- 게시일: 2026-03-28
이 분석은 교육·리서치 목적입니다. 투자 조언이 아닙니다.