1형 당뇨병에서 혈당 예측: 해석 가능한 인공지능 접근법들의 비교 분석

이 논문은 1형 당뇨병 환자의 혈당을 예측하기 위해 다양한 해석 가능한 머신러닝(ML) 모델을 활용하고, ECG(심전도) 신호에서 추출한 심박변이도(HRV) 특성과 연속 혈당 모니터링(CGM) 데이터를 결합해 성능을 평가하는 내용입니다. 주요 결론은 결정 트리(Decision Tree) 모델이 범위 분류 정확도와 해석성에서 가장 뛰어나다는 점입니다. 또한 HRV 특성을 포함함으로써 예측력이 향상됨을 보여주며, 향후 데이터 확장과 비침습 혈당 모니터링의 가능성을 제시합니다.🧑‍⚕️📈

1. 서론: 1형 당뇨병과 혈당 예측의 중요성

1형 당뇨병(T1D)은 자가면역 질환으로, 유전적 요인, 환경적 요인, 면역계가 복합적으로 작용하여 발생합니다. 이 질환은 인슐린 생산이 부족해 혈당 조절이 어려워지며, 전 세계 당뇨병 환자 중 약 2%를 차지합니다.

"이 질환의 주된 특징은 인슐린 결핍으로 인한 고혈당입니다. 결국 인체는 혈당을 제대로 조절하지 못하게 됩니다."

치료법이 완전히 확립되지 않았기 때문에 인슐린 투여와 건강한 생활습관의 지속적인 관리가 매우 중요합니다. 합병증을 예방하려면 짧은 시간 내 혈당 변동을 예측(단기 혈당 예측)하는 것이 필수적입니다.

이에 최근 연속 혈당 측정기(CGM)가 보급되었으며, 이 데이터를 활용한 인공지능(AI) 기반 예측 모델이 발전하고 있습니다. 하지만 기존 AI 모델은 대부분 결과의 원리를 설명하지 않는 "블랙박스" 구조여서 사용자가 신뢰하기 어렵다는 문제가 있습니다.

반면, 해석 가능한 AI 모델은 의사결정 과정을 명확히 보여주기 때문에 헬스케어 현장에서 전문가의 신뢰를 더 잘 얻으며, 치료의 개인화와 결과 향상에 기여할 수 있습니다.

2. 선행 연구: 기존 AI 모델의 성과와 한계

지금까지 혈당 예측 분야에서는 회귀, 분류, 인공신경망(ANN), 순환신경망(RNN), LSTM 등 여러 AI기법이 도입되었습니다. 딥러닝 신경망은 직관적으로 성능이 뛰어나지만, 내부 작동 원리를 이해하기 어려운 블랙박스입니다.

"딥러닝 신경망은 고성능을 보이지만, 내부 동작을 이해할 수 없으며, 특히 의료 데이터에서는 이는 치명적인 한계가 될 수 있습니다."

최근에는 해석 가능성과 임상 적용 가능성을 강화하기 위해 LASSO 회귀, 다중 선형 회귀(MLR), 결정 트리 등 해석 가능한 모델의 성능을 실험적으로 비교하는 연구들이 나타나고 있습니다.

📋 주요 선행 연구들을 표로 정리하면 아래와 같습니다(일부):

Zhu et al.: DRNN, 해석 불가, ECG/HRV 미적용, 소수 대상자
McShinsky et al.: 여러 ML 알고리즘, 가장 성능 좋은 LASSO가 해석 가능, 다수 특성 활용
Zhang et al.: 30분 예측은 해석불가, 60분 예측은 해석 가능한 MLR 우수
본 연구: 해석 가능한 회귀·트리 모델, HRV 특성 포함, 데이터 세부 설명 가능, 미래엔 비침습 모니터링 요소 확장 가능

"우리 연구는 D1NAMO 데이터 셋의 BGL과 HRV 특성을 해석 가능한 모델로 활용한 최초의 사례입니다."

3. 데이터 및 방법론

3.1. 데이터셋

D1NAMO 데이터셋: 8주간 29명(건강인 20, T1D 환자 9명) 대상, ECG·호흡·가속도 등 실시간 신호와 혈당 데이터 수집.
이 중 당뇨환자 3명(002, 007, 008)의 데이터만 활용(나머지 환자 데이터는 품질·동기화 한계로 제외).

3.2. ECG 신호 전처리

ECG 신호의 잡음 제거를 위해 필터링, R-peak 탐지, QRS complex 분석 등 까다로운 전처리 단계를 거침.
신호 품질이 일정기준 미만이면 해당 구간 제외.

ECG 신호 전처리 예시

위: 필터링 전, 아래: 필터링 후 ECG 신호

3.3. 특성(Feature) 추출

HRV의 시간(domain) 및 주파수(domain) 특성(예: SDNN, RMSSD, NN50, HF/LF 밴드 파워 등)만 사용.
최종 데이터 구조는 다음과 같음:

i = subid; BGLt; HRV 특성들...; BGLt+30

즉, 각 시점의 혈당 + 동시 HRV 특성 → 30분 뒤 혈당 예측

3.4. 머신러닝 모델 및 평가 지표

모델: Linear, Ridge, LASSO, Elastic Net, Bayesian Ridge, Decision Tree(모두 해석 가능)
교차검증: 10-fold
회귀 평가 지표: RMSE (의료 맥락상 큰 예측오차에 더 민감)
분류 문제로 전환: 혈당을 7개 범주로 나누어(F1 점수로) 평가

"모델의 목표는 30분 후 혈당을 예측하거나, 7개 범위(아주 낮음~아주 높음) 중 올바른 클래스를 예측하는 것입니다."

4. 결과

4.1. 회귀(Regression) 성능

환자별 최적 모델과 RMSE(유의미한 오차 감소):
- 002번: Ridge, Elastic Net, Bayesian Ridge (1.98 mmol/L)
- 007번: LASSO, Elastic Net, Linear (1.33 mmol/L)
- 008번: Bayesian Ridge, Ridge (1.45 mmol/L)

4.2. 다중 클래스 분류(F1 Score) 성능

결정 트리 모델이 3명 모두에서 가장 높은 가중 F1점수:
- 002번: 0.87
- 007번: 0.84
- 008번: 0.82

"결정 트리 모델이 가장 정확하게 혈당 범위를 구분했고, 특히 위험(저/고혈당) 범주 진입 시 조기 알람 제공에서 핵심적 역할을 할 수 있습니다."

결정 트리의 해석성:
- 각 노드는 어떤 특성과 값 비교로 분기했는지 명확히 시각화 가능.
- 블루(저혈당) ~ 오렌지(고혈당)까지 색상으로 혈당 범위 예측이 쉽게 드러남.

결정 트리 예시

"결정 트리의 구조는 투명해서, 사용자는 각 노드에서 어떤 특성이 의사결정에 기여하는지 쉽게 파악할 수 있습니다."

4.3. 부가 성능(속도 및 메모리)

결정 트리 학습 평균 2.97초, 추론 5ms/건, 메모리 약 134kB.
Linear Regression은 더 빠르고 작지만, 예측 성능은 결정 트리에 못 미침.

5. 논의

해석 가능한 모델은 환자 개개인 맞춤형 구조로 생성되어, 각 환자별로 트리 구조·분기 특성이 다를 수 있음.
HRV 특성 통합 시 각 환자에서 RMSE 5%~14% 감소 효과, 즉 혈당 단독 예측보다 성능이 뚜렷이 향상됨.
ECG 기반 HRV 특성 결합은 비침습 혈당 모니터링 시스템 개발로 확장 가능성을 시사함.

"HRV 특성을 통합하면 맞춤형 혈당 예측 정확도가 눈에 띄게 향상됩니다."

6. 결론 및 향후 연구

본 연구는 1형 당뇨 환자 3명을 대상으로 해석 가능한 ML 모델 조합(특히 결정 트리)이 30분 후 혈당 범위 예측에서 우수함을 보였습니다.
더 큰 규모, 다양한 혈당 상황의 데이터 확보 및 장기 예측(45, 60, 180분 등)에 대한 성능 검증이 필요합니다.
HRV와 혈당 간의 상호작용을 심층 분석해 비침습 혈당 예측의 현실적 기술적 토대를 마련하고자 합니다.

마무리

이 논문은 해석 가능한 인공지능이 단순한 예측 정확도를 넘어 실제 임상 현장에서 신뢰와 적용 가능성을 어떻게 높일 수 있는지 잘 보여줍니다. 앞으로 의료 전문가와 환자 모두 쉽게 이해할 수 있고, 믿고 활용할 수 있는 개인맞춤형, 비침습적 당뇨 관리 시스템의 기반이 될 것으로 기대됩니다. 🚀🩺

"해석 가능한 머신러닝 모델은 환자와 의사가 모두 이해하고 신뢰할 수 있는 예측 결과를 만들어, 보다 안전하고 개인화된 당뇨 관리를 가능하게 만듭니다."