2026-03-28

시계열 인과추론을 위한 이중 머신러닝: 거시경제 데이터의 순차적 구조를 지키는 방법론

시계열 데이터 인과관계 추정의 혁신: Double Machine Learning의 시간 구조적 확장

들어가며: 왜 기존 방법론은 거시경제 데이터에서 실패하는가?

한국의 금융감독당국, 중앙은행, 그리고 자산운용사들은 매일 같은 질문에 직면합니다: 정책금리 인상이 실제로 경제 성장에 어떤 영향을 미치는가? 새로운 규제자본 요건(Tier 1 regulatory capital)이 신용 공급과 금융 시스템에 어떤 경로로 파급되는가?

이러한 질문들은 단순해 보이지만, 통계적으로는 매우 어렵습니다. 거시경제 시계열 데이터에는 일반적인 기계학습 방법론이 가정하는 독립적 표본(independent samples) 구조가 존재하지 않기 때문입니다. 시간의 흐름 속에서 과거와 현재는 서로 얽혀 있고, 이러한 의존성 구조를 무시하면 잘못된 추론에 빠지게 됩니다.

Milos Ciganovic의 논문 “Double Machine Learning for Time Series”는 바로 이 문제에 대한 정교한 해결책을 제시합니다. 이 에세이에서는 이 논문의 핵심 방법론, 실제 적용 가능성, 그리고 한국의 거시경제 분석과 금융감시에서의 구체적인 활용 방안을 살펴보겠습니다.

제1부: Double Machine Learning의 기본 논리와 시계열 적응

Double Machine Learning의 원래 개념

Double Machine Learning (DML)은 2018년 Victor Chernozhukov와 동료들이 제시한 방법론입니다. 이 방법의 핵심 아이디어는 다음과 같습니다:

인과관계를 추정할 때(즉, 특정 변수의 “진정한 효과”를 알고 싶을 때), 우리는 종종 고차원의 통제 변수들을 포함해야 합니다. 예를 들어 금리 인상의 경제 성장에 대한 효과를 추정하려면, 동시에 진행 중인 다른 정책들, 글로벌 경제 상황, 금융 시장의 변동성 등 수많은 요인들을 통제해야 합니다.

전통적인 선형 회귀분석에서는 이러한 통제 변수들이 너무 많으면(고차원 문제) 통계적 추론이 불안정해집니다. Double Machine Learning은 두 가지 기계학습 단계를 통해 이 문제를 우아하게 해결합니다:

첫 번째 학습 단계: 고차원 통제 변수들로부터 관심 변수를 예측하는 모델과, 통제 변수들로부터 결과 변수를 예측하는 모델을 각각 학습합니다.
두 번째 단계: 이 두 모델의 “잔차(residuals)“들 사이의 관계를 분석하여, 순수한 인과효과를 추정합니다.

이렇게 함으로써 고차원 데이터에서도 정확한 통계적 추론이 가능해집니다.

시계열 환경에서의 근본적 문제

그러나 거시경제 데이터는 독립적입니다. 한국은행의 기준금리, GDP, 실업률 등 모든 월간/분기간 거시경제 지표들은 시간의 흐름 속에서 자기상관(autocorrelation)을 보입니다. 작년의 금리가 올해의 금리에 영향을 미치고, 지난 분기의 GDP 성장이 이번 분기의 성장 추세에 영향을 미칩니다.

원래의 Double Machine Learning은 각 표본이 독립적이라고 가정합니다. 따라서 시계열 데이터에 직접 적용하면:

편향(bias): 시간적 의존성을 무시한 모델들이 잘못된 예측을 하게 되고, 이것이 잔차 분석에도 영향을 미칩니다.
신뢰도 하락: 신뢰 구간(confidence intervals)이 너무 좁게 계산되어, 실제로는 불확실한 결과를 너무 확실하다고 표현하게 됩니다.

제2부: Reverse Cross-Fitting이라는 혁신적 해결책

Cross-Fitting의 목적

원래의 Double Machine Learning에서 Cross-Fitting은 다음과 같이 작동합니다:

데이터를 두 부분으로 나눕니다(예: 1000개 관측치를 500개씩). 첫 번째 절반으로 모델을 학습한 후, 두 번째 절반에 적용하고, 반대로도 수행합니다. 이렇게 하는 이유는 모델을 학습할 때 사용한 동일한 데이터로 추론(inference)하지 않기 위함입니다. 그렇지 않으면 모델이 학습 데이터에 과적합(overfitting)되어 결과가 편향될 수 있습니다.

Reverse Cross-Fitting: 시계열의 특성을 활용한 샘플 효율성 극대화

Ciganovic의 핵심 아이디어는 시간 역전 가능성(time-reversibility)을 활용하는 것입니다.

정상 시계열(stationary time series, 즉 시간이 지나도 통계적 성질이 변하지 않는 시계열)은 흥미로운 성질을 가집니다: 역방향으로 읽어도 통계적으로는 동일한 성질을 유지한다는 것입니다.

예를 들어, 한국 월간 CPI(소비자물가지수) 데이터를 2008년부터 2024년까지 정순으로 보는 것과, 2024년부터 2008년까지 역순으로 보는 것이 통계적으로 동등한 정보를 포함한다는 의미입니다.

Reverse Cross-Fitting의 작동 방식:

원래 데이터 순서대로 첫 번째 Cross-Fitting을 수행합니다 (예: 처음 500개 관측치로 학습).
동일한 데이터를 역순으로 정렬한 후, 두 번째 Cross-Fitting을 수행합니다 (예: 역순 정렬된 데이터의 처음 500개로 학습).
두 결과를 결합합니다.

이렇게 함으로써 다음과 같은 이점을 얻습니다:

샘플 효율성 증대: 같은 양의 데이터를 두 가지 방식으로 활용하므로, 표준 cross-fitting보다 더 안정적인 추정치를 얻습니다.
시간 의존성 처리: 역순 데이터 분석은 시계열의 자기상관 구조를 다른 각도에서 포착하여, 더욱 강건한(robust) 인과 추정을 가능하게 합니다.

이는 결정론적(deterministic) 절차입니다. 즉, 랜덤성에 의존하지 않으므로, 동일한 데이터에 적용하면 항상 동일한 결과를 얻습니다.

제3부: 비점근적 타당성과 이론적 기초

논문의 이론적 기여

Ciganovic은 점근적 타당성(asymptotic validity)의 조건들을 상세히 도출하고 증명합니다. 이는 다음을 의미합니다:

표본 크기가 무한대로 커질 때, 우리의 추정량이:

일관성(consistency): 참인 인과 효과로 수렴한다.
점근 정규성(asymptotic normality): 그 분포가 정규분포(normal distribution)에 따른다.

따라서 신뢰 구간과 가설 검정이 유효하다.

거시경제 데이터의 맥락에서 이러한 증명은 비자명합니다. 왜냐하면:

약한 의존성(weak dependence): 시계열이 어느 정도의 자기상관을 가져도, 충분히 “약하면” 마치 독립적인 데이터처럼 행동한다는 것을 보여야 합니다.
기계학습 오차의 제어: 첫 번째와 두 번째 학습 단계에서 모델 선택 오차가 최종 추정에 미치는 영향이 무시할 수 있을 정도로 작다는 것을 보장해야 합니다.

Ciganovic의 논문은 이러한 조건들을 시계열 설정에 맞게 정교하게 도출합니다.

유한 표본(Finite Sample) 성능

점근 이론은 수학적으로 정교하지만, 실제 데이터 분석에서는 유한한 개수의 관측치만 있습니다. 한국의 월간 거시경제 데이터라면 보통 200~300개 관측치 정도입니다(예: 1990년부터 2024년까지).

논문은 광범위한 시뮬레이션을 통해 다음을 입증합니다:

유한 표본에서도 추정이 신뢰할 수 있다.
표본 크기가 100~500 정도의 현실적 범위에서도 신뢰 구간의 커버리지(실제 참값을 포함할 확률)가 명목 수준(예: 95%)에 가깝다.

이는 한국의 거시경제 데이터에 실제로 적용할 수 있다는 신호입니다.

제4부: 모델 오명시 문제와 강건성

현실적 위협: 우리의 모델이 틀릴 수 있다

거시경제 분석의 현실은 교과서적인 가정이 항상 성립하지 않는다는 것입니다:

이분산성(Heteroskedasticity): 금융 위기 시기와 평상시기의 변동성이 다릅니다. 예를 들어 2008 금융 위기 때의 월간 주가지수 변동률 분산은 평상시 분산의 5배 이상입니다.
구조적 변화(Structural breaks): 정책 변경, 제도 개혁, 또는 장기 추세의 변화로 인해 데이터의 통계적 성질이 시간에 따라 변합니다.
모델 오명시(Model misspecification): 우리가 선택한 통제 변수 세트가 완벽하지 않을 수 있습니다. 예를 들어 금리의 경제 성장 효과를 분석할 때, 기술 혁신이나 국제 무역 구조 변화 같은 중요한 요인을 놓칠 수 있습니다.

Reverse Cross-Fitting의 강건성

중요한 발견은 Reverse Cross-Fitting이 이러한 위반에 대해 강건하다는 것입니다:

시뮬레이션 결과에 따르면, 이분산성이 존재하거나 통제 변수 선택이 불완전한 상황에서도:

추정량의 편향이 유의미하게 증가하지 않는다.
신뢰 구간의 실제 커버리지가 여전히 합리적 수준을 유지한다.

이는 Double Machine Learning이 “반-모수적(semiparametric)” 방법이기 때문입니다. 즉, 전체 데이터 생성 과정에 대한 매우 구체적인 가정을 요구하지 않으면서도, 특정 인과 효과에 대해서는 정확한 추론을 제공합니다.

제5부: 고차원 설정에서의 실제 문제와 “Goldilocks Zone”

고차원 튜닝 딜레마

기계학습 모델을 선택할 때, 우리는 여러 초모수(hyperparameter)를 조정해야 합니다:

라쏘(Lasso) 회귀의 정규화 강도(λ)
랜덤 포레스트의 트리 개수와 트리 깊이
신경망의 은닉층 크기 등

일반적으로 이러한 초모수는 교차검증(cross-validation)을 통해 예측 오차를 최소화하는 방향으로 선택합니다.

그러나 여기에 핵심적인 문제가 있습니다:

예측 오차를 최소화하는 초모수가 인과 효과 추정의 편향을 최소화하는 초모수와 동일하지 않다는 것입니다.

예를 들어, 금리의 경제 성장 효과를 추정하는 상황을 생각해봅시다:

예측 관점: “다음 분기 GDP 성장을 가장 정확히 예측하려면 어떤 모델이 좋은가?”
인과 관점: “금리 1%p 인상이 GDP 성장에 정확히 미치는 영향은 무엇인가?”

이 두 질문은 매우 다릅니다. 첫 번째는 금리뿐만 아니라 모든 가용 정보를 활용하여 예측 정확도를 높이는 것에 집중합니다. 반면 두 번째는 금리의 “순수한” 효과만을 분리해내는 데 집중합니다.

”Goldilocks Zone”: 지나치지 않게, 모자라지 않게

Ciganovic의 혁신적인 제안은 예측 지표 기반의 표준 교차검증 대신, “골디락스 존(Goldilocks zone)“이라는 새로운 초모수 선택 규칙을 도입하는 것입니다.

이 “골디락스 존”은 다음과 같은 특성을 가집니다:

너무 과도한 정규화 회피: 초모수가 너무 크면, 모델이 과도하게 단순화되어 중요한 신호도 손실됩니다. 예를 들어, 금리의 실제 효과가 있어도 모델이 이를 감지하지 못합니다.
과적합 회피: 초모수가 너무 작으면, 모델이 노이즈에 과적합되어 인과 효과 추정이 불안정해집니다.
안정적인 잔차(Partialled-out signals): 이 영역의 초모수들은 통제 변수 제거 후에도 “깨끗한” 신호를 남깁니다. 즉, 첫 번째와 두 번째 학습 단계의 잔차들이 일관되고 안정적인 패턴을 보입니다.

실제 적용에서는:

예측 오차 곡선의 “엘보우(elbow)” 근처 영역
잔차의 표준편차가 과도하게 높지 않은 영역
여러 번의 교차검증 반복에서 일관되게 좋은 성능을 보이는 영역

등을 고려하여 초모수를 선택합니다.

제6부: 실증 적용 사례 - Tier 1 규제자본의 경제 효과

응용 분야의 선택 이유

논문의 실증 예제는 Tier 1 규제자본(Tier 1 regulatory capital) 요구사항의 경제 성장에 대한 영향입니다.

이것은 한국의 금융 정책과 직결된 주제입니다:

한국은행과 금융감독당국은 금융 시스템의 건전성 강화를 위해 정기적으로 자본 요구사항을 재평가합니다.
2010년 바젤 III 도입 이후, 은행의 자본 충분성 요건이 대폭 강화되었습니다.
동시에 정책 입안자들은 이러한 규제가 신용 공급을 제약하여 경제 성장을 둔화시킬 수 있다는 우려를 가지고 있습니다.

Residualized Local Projections와의 결합

논문은 새로운 Double Machine Learning 방법론을 Residualized Local Projections (RLP)이라는 기법과 결합합니다.

Local Projections의 개념:

전통적인 벡터자기회귀(Vector Autoregression, VAR) 모델은 모든 변수 간의 동시적 관계와 시간 지연된 관계를 동일한 방정식 체계에서 추정합니다.

이에 비해 Local Projections는:

각 시간 지평(time horizon) h = 1, 2, 3, … 에 대해 별도의 회귀식을 추정합니다.
예: “금리 인상 후 1분기 뒤 GDP 성장 효과”, “2분기 뒤 효과”, “3분기 뒤 효과” 등을 각각 추정합니다.
이를 통해 동적 인과 효과(impulse responses)를 추정합니다.

Residualized Local Projections:

높은 차원의 통제 변수들을 사전에 “제거”하고(residualize), 그 잔차 공간에서 Local Projections를 수행합니다.

이렇게 하면:

고차원 통제 변수들로 인한 다중공선성(multicollinearity) 문제를 완화합니다.
추정의 효율성을 높입니다.
Double Machine Learning의 강점(고차원 설정에서의 정확한 추론)을 활용할 수 있습니다.

경험적 발견의 의미

논문의 실증 결과(구체적인 수치는 논문 본문에 제시되지만, 여기서는 방법론적 함의에 집중)는:

Tier 1 규제자본 요구사항 강화가 신용 공급을 통해 경제 성장을 실제로 둔화시킨다.
그러나 효과의 크기와 시간 경로는 기존

📚 출처

Ciganovic, M. (2026). Double Machine Learning for Time Series. Luxon AI ORACLE 리서치팀 분석.
Chernozhukov, V. et al. (2018). “Double/Debiased Machine Learning for Treatment and Structural Parameters.” The Econometrics Journal, 21(1). https://doi.org/10.1111/ectj.12097

← BACK TO BLOG