이 연구는 수면 중 ECG 데이터를 활용하여 나이로 인한 자율신경계 변화를 보정한 HRV(심박 변이도) 특징을 통해 비침습적으로 혈당을 예측하는 새로운 방법을 제시합니다. 연령 보정 기법을 적용한 HRV 특징은 기존 방식보다 혈당 예측 정확도를 25.6% 향상시켰으며, 특히 렘(REM) 수면 중 HRV가 혈당 예측에 중요함을 보여주었습니다. 이는 당뇨병 관리에 있어 비침습적 혈당 모니터링의 가능성을 열어주는 탐색적 연구입니다.


1. 서론: 당뇨병 관리와 비침습 혈당 측정의 중요성 ✨

전 세계적으로 5억 3천7백만 명 이상의 성인에게 영향을 미치고 있는 당뇨병은 여전히 주요 사망 원인 중 하나예요. 효과적인 혈당 관리는 당뇨 합병증을 예방하는 데 매우 중요하지만, 기존의 침습적인 혈당 측정 방식은 불편함과 번거로움 때문에 환자들의 적극적인 참여를 어렵게 하고 있습니다. 이러한 문제점을 해결하기 위해 신뢰할 수 있는 비침습적 혈당 측정 방법의 필요성이 커지고 있어요.

최근에는 생체 신호 처리 기술의 발전 덕분에 특히 심박 변이도(HRV)와 같은 생리학적 신호가 비침습적 혈당 예측에 활용될 수 있다는 가능성이 주목받고 있습니다. HRV는 자율신경계(ANS)의 활동을 반영하는데, 이 자율신경계는 혈당 항상성 조절에 핵심적인 역할을 하거든요. 이전 연구들에서도 HRV 파라미터와 혈당 수치 간의 유의미한 상관관계가 여러 번 보고되었어요. 예를 들어, 2023년 임 등은 혈당 조절이 잘 되지 않는 환자에게서 HRV 감소가 관찰되었고, 2024년 카지사 등은 건강한 성인의 수면 중 혈당 수치와 HRV 사이에 중간 정도의 음의 상관관계가 있다고 보고했죠.

하지만 기존의 HRV 기반 혈당 예측 연구에는 몇 가지 중요한 한계점이 있었습니다. 가장 큰 문제는 바로 나이와 관련된 자율신경계 변화를 충분히 고려하지 않았다는 점이에요. 나이가 들수록 HRV는 자연스럽게 감소하는데, 이러한 변화를 보정하지 않으면 정확한 분석이 어려울 수 있습니다. 2023년 스토이멘스키 등은 연령 및 성별 보정이 HRV 기반 혈당 예측 성능을 크게 향상시킨다는 사실을 입증하며 이 문제에 대한 해결책을 제시하기도 했어요.

또한, 수면이 혈당 조절에 미치는 영향은 점점 더 중요하게 인식되고 있지만, 수면 단계별 HRV 역동성에 대한 연구는 아직 부족한 편입니다. 당뇨병 환자의 경우 수면의 질이 좋지 않으면 야간 혈당 변동성이 커진다는 보고도 있고, 2023년 청 등은 안정 수면 및 렘(REM) 수면 단계에서 측정된 HRV 지표가 제2형 당뇨병 환자의 공복 혈당 및 HbA1c 수치와 유의미하게 연관되어 있다고 밝혔습니다. 이는 특정 수면 단계에서 혈당과 관련된 자율신경계 반응이 더 뚜렷하게 나타날 수 있음을 시사하죠.

이러한 배경을 바탕으로, 본 연구는 수면 단계별 ECG 분석을 통해 얻은 HRV 특징에 새로운 연령 보정 기법을 적용하고, 이 방법이 비침습적 혈당 예측 정확도에 미치는 영향을 평가하는 것을 목표로 합니다. 저희는 나이 보정을 거친 수면 단계별 HRV 특징이 다양한 연령대의 인구 집단에서 자율신경계 기능 평가의 근본적인 한계를 해결하여 기존 접근 방식보다 훨씬 뛰어난 성능을 보일 것이라고 가설을 세웠습니다.


2. 결과 및 논의 📊

2.1 연령 보정 HRV 모델의 성능 ✨

저희가 개발한 연령 보정 모델은 5겹 교차 검증에서 평균 R<sup>2</sup> 값이 0.161±0.010을 기록했고, 평균 절대 오차(MAE)는 0.182±0.006, 그리고 피어슨 상관계수는 0.409 (p<0.001)로 나타났습니다. 이는 연령 보정을 하지 않은 기존 모델(R<sup>2</sup>=0.132, MAE=0.185)과 비교했을 때 R<sup>2</sup> 값에서 무려 +25.6% (절대값 +0.034)의 상당한 개선을 보여준 결과입니다! 👏 이 결과는 t-검정에서도 통계적으로 유의미한 것으로 확인되었어요 (p<0.01).

특히, 여러 기계 학습 모델을 비교했을 때 BayesianRidge 회귀 모델이 최적의 혈당 예측 성능을 달성했습니다. 이는 아래 그림 1에서 확인하실 수 있습니다. 이 초기 결과는 연령 보정이 혈당 예측을 위한 HRV 특징의 예측 유용성을 높일 수 있음을 시사해요. 하지만 더 큰 규모의 코호트에서 추가적인 검증이 필요합니다.

Refer to caption 그림 1: 베이지안 릿지 회귀를 통한 최적의 혈당 예측 성능 비교 (R<sup>2</sup> = 0.161, MAE = 0.182).

또한, 교차 검증 분석 결과 모든 폴드(fold)에서 모델의 안정성이 매우 견고하다는 것을 알 수 있었습니다. 변동 계수(Coefficient of Variation)는 5.9%에 불과했으며, 모든 폴드에서 R<sup>2</sup> 값이 0.15 이상을 달성하여 일관된 일반화 가능성을 입증했어요. 아래 그림 2를 참고해 주세요.

Refer to caption 그림 2: 교차 검증을 통한 모델 안정성 확인 (R<sup>2</sup> = 0.161 ± 0.010, CV = 5.9%)


2.2 특징 중요도 및 제거 분석 🧐

가장 중요한 예측 특징 3가지는 수면 단계별 HRV 측정치였으며, 모두 연령 보정이 적용된 특징들이었습니다 (표 1 참고). 특히 hrv_rem_mean_rr_age_normalized (r=0.443, p=0.004), hrv_ds_mean_rr_age_normalized (r=0.438, p=0.005)와 함께 확장기 혈압(DBP, r=0.437)이 상위권에 올랐습니다. 연령 보정 특징이 이렇게 상위권을 차지했다는 것은 저희의 연령 보정 전략이 나이 관련 교란 요인을 성공적으로 완화했음을 직접적으로 보여주는 증거라고 할 수 있죠.

아래 그림 3에서 전체 예측 특징 순위를 확인하실 수 있는데, 연령 보정 HRV 특징들이 통계적으로 매우 유의미하게(15개 특징 중 12개가 p<0.05) 상위권을 점령하고 있음을 명확히 볼 수 있습니다.

Refer to caption 그림 3: 연령 보정 HRV 특징의 높은 예측 순위 (15개 중 12개 특징 p<0.05).

표 1: 혈당 수치와의 상관관계 기반 상위 5개 예측 특징

특징상관계수 (r)p-값
hrv_rem_mean_rr_age_normalized0.4430.004
hrv_ds_mean_rr_age_normalized0.4380.005
Diastolic blood pressure0.4370.005
hrv_rs_mean_rr_age_normalized0.3950.011
systolic blood pressure0.3880.013

2.3 체계적인 제거 연구 결과 🔬

체계적인 제거(Ablation) 연구 결과는 그림 4에 요약되어 있으며, 다중 모드 통합(multi-modal integration)이 단일 모드 접근 방식보다 훨씬 뛰어난 성능을 보였고, 특히 15가지 특징 구성이 혈당 예측에 최적임을 입증했습니다.

Refer to caption 그림 4: 다중 모드 통합의 우수한 성능; 15가지 특징 구성이 혈당 예측에 최적.

제거 연구를 통해 핵심적인 아키텍처 기여도를 파악할 수 있었습니다 (표 2 참고).

표 2: 제거 연구 결과 (15가지 특징 기준)

  • 연령 보정은 성능을 +25.6% 향상시켰습니다.
  • 수면 단계별 HRV 특징은 긍정적인 예측 성능에 필수적입니다.
  • 다중 모드 통합은 단일 모드 접근 방식보다 훨씬 뛰어난 성능을 보였습니다.
  • 임상 특징만으로는 예측 능력이 오히려 음수를 나타냈습니다.

이러한 결과는 견고한 혈당 예측을 위해 연령 보정다중 모드 통합 (특히 수면 단계별 HRV)이 모두 필수적임을 강조합니다.

이러한 아키텍처 기여는 그림 5에서 시각적으로 요약되어 있습니다. 연령 보정을 통해 비보정 특징 대비 +25.6%의 상당한 성능 향상을 보여주는 것을 알 수 있습니다 (R<sup>2</sup> = 0.161 vs 0.132).

Refer to caption 그림 5: 제거 연구 결과, 연령 보정이 +25.6% 성능 향상 (R<sup>2</sup> = 0.161 vs 0.132)을 제공함을 보여줌.


2.4 임상적 정확도 및 모델 안정성 👍

저희 모델은 강력한 임상적 허용 오차를 보여주었습니다. 예측치의 68.2%가 실제 혈당 수치의 ±1.0 mmol/L 이내에 들었으며, 이 수치는 ±1.5 mmol/L 이내에서는 84.1%, ±2.0 mmol/L 이내에서는 95.3%로 증가했습니다. 교차 검증 안정성 또한 매우 높아서 평균 R<sup>2</sup>가 0.161±0.010이었고, 모든 폴드에서 R<sup>2</sup>가 0.15 이상을 달성하여 일관된 일반화 가능성을 확인했습니다.


2.5 수면 단계별 분석 🌙

표 3: 혈당 예측에 대한 개별 수면 단계 기여도

수면 단계예측 능력 기여도
렘(REM) 수면가장 높음
깊은 수면보완적인 통찰력
빠른 수면중간

참고: 렘(REM) 수면 특징이 가장 높은 예측 능력을 보였습니다. 이는 이 단계 동안 알려진 자율신경계-대사 연결과 일치합니다.

이 예비 연구는 연령 보정 HRV 특징이 비침습적 혈당 예측 정확도를 향상시킬 수 있으며, 기존 접근 방식보다 25.6%의 초기 개선을 달성했음을 시사합니다. 이 방법론은 다양한 연령대의 인구 집단에서 자율신경계 기능 평가의 근본적인 한계를 해결하여, 이전 HRV 연구에서 지적된 연령 관련 성능 저하에 대한 예비 솔루션을 제공합니다. 저희의 예비 R<sup>2</sup> 값인 0.161은 최근 ECG 기반 혈당 탐지 연구들이 75-78%의 이진 분류 정확도를 달성한 것과 비교했을 때, 이진 분류가 아닌 연속적인 예측을 제공한다는 점에서 초기 가능성을 보여줍니다. ±1.5 mmol/L 이내에서 84.1%의 예측치를 보이는 예비 허용 오차 분석은 잠재력을 시사하지만, 임상적 유용성 평가를 위해서는 광범위한 임상 검증이 필요합니다.

렘 수면 특징의 우수한 성능은 알려진 생리학적 사실과 일치합니다. 렘 수면은 복잡한 대사 조절을 반영하는 다양한 자율신경계 활동을 보이는데, 이는 혈당과 관련된 자율신경계 조절에 대한 감수성을 향상시킬 수 있습니다 (표 3 참고). 깊은 수면의 부교감신경 우세는 보완적인 대사 통찰력을 제공합니다.


3. 결론 🌟

이 예비 연구는 수면 단계별 ECG 분석을 통해 비침습적 혈당 예측 정확도를 향상시킬 수 있는 새로운 연령 보정 심박 변이도(HRV) 특징 기술의 초기 가능성을 제시합니다. 저희 방법론은 예측 성능에서 25.6%의 개선을 달성했으며 (연령 보정 특징 R<sup>2</sup> = 0.161 vs. 비보정 특징 R<sup>2</sup> = 0.132, p < 0.01), 체계적인 제거 연구를 통해 연령 보정이 모델 성능에 중요한 역할을 함을 확인했습니다.

이 연구는 개념 증명(proof-of-concept) 단계이며, 임상적으로 고려되기 위해서는 광범위한 검증이 필요합니다. 43명의 피험자로부터 얻은 단일 채널 ECG 데이터로 테스트되었으며, 특히 렘 수면 HRV 특징과 같은 수면 단계별 특정 분석이 기존 측정법보다 이점을 제공할 수 있다는 예비 증거를 제공합니다.

이번 연구의 중요한 한계점으로는 적은 표본 크기(n=43), 인구통계학적 다양성 부족, 그리고 검증의 예비적인 성격 등이 있습니다. 향후 연구는 대규모 다기관 검증 (n>>200), 다양한 인구 집단 테스트, 그리고 전향적 임상 시험에 초점을 맞춰야 임상적 유용성을 확립할 수 있을 것입니다. 따라서 이 연구는 추가적인 검증이 필요한 탐색적 연구로 간주되어야 합니다.

혈당 예측을 넘어, 연령 보정 프레임워크는 다양한 인구 집단에서 자율신경계 기능 평가의 근본적인 과제를 해결하며, 심혈관 질환 위험 계층화 및 수면 장애 진단을 포함한 다른 HRV 기반 생체 의학 응용 분야로 확장될 잠재력이 있습니다. 이 연구는 당뇨병 관리에서 수면 인지 및 연령 조정된 생리학적 모니터링을 위한 예비 토대를 마련했습니다.

현재 이 예비 연구의 해석 및 일반화 가능성을 제한하는 몇 가지 중요한 한계점이 있습니다. 적은 코호트(n=43)는 통계적 검정력과 일반화 가능성을 제한하며, 인구 통계학적 동질성은 더 넓은 인구 집단을 대표하지 않을 수 있습니다. 데이터의 단일 사이트 특성은 견고성을 위해 다기관 검증을 필요로 하며, 예비 교차 검증 결과는 결정적인 결론을 내리기 전에 독립적인 데이터 세트 확인이 필요합니다. 현재 성능 수준은 임상적 적용에는 아직 불충분하며, 간단한 연령 보정 접근 방식은 다양한 인구 집단에 걸친 자율신경계 변화의 모든 복잡성을 포착하지 못할 수 있습니다. 이러한 한계점으로 인해 대규모 다기관 검증 연구 (n>>200), 다양한 인구 통계학적 테스트, 전향적 임상 시험을 포함한 광범위한 추가 연구가 필수적이며, 그 후에야 임상적 유용성을 확립할 수 있습니다. 본 연구는 연령 보정 HRV 특징의 혈당 예측 잠재력에 대한 예비 증거를 제공하는 탐색적 연구로 간주되어야 합니다.


4. 방법론 🔬

이 연구에는 밤샘 ECG 기록, 추출된 RR-간격, 임상 혈당 측정치, 그리고 검증된 수면 품질 평가를 포함하는 다중 모드 데이터가 완벽하게 갖춰진 43명의 성인 피험자가 참여했습니다. 포함 기준은 임상 혈당 측정 기록과 정확한 RR-간격 추출에 충분한 품질의 밤샘 ECG 기록이 있는 성인이었습니다.

4.1 데이터 획득 및 신호 처리 📈

ECG 기록 💗

표준 모니터링 장비를 사용하여 250Hz의 샘플링 주파수로 단일 채널 ECG 신호를 획득했습니다. 원시 신호는 생리학적 진폭 범위(±5mV)를 보장하기 위해 스케일링 검증을 거쳤는데, 이는 후속 분석에 영향을 미칠 수 있는 장비 변동을 해결하기 위함입니다.

RR-간격 추출 📊

R-피크 감지는 적응형 임계값 알고리즘을 사용하여 수행되었으며, 품질 관리를 위해 수동으로 검증했습니다. RR-간격은 통계적 이상치 감지(로컬 평균에서 3 표준 편차를 벗어나는 간격은 제외)를 사용하여 체계적인 인공물 제거를 거쳐 추출했습니다.

수면 단계 분류 😴

수면 단계는 미국 수면 의학회(AASM)가 정한 기준을 사용하여 식별했습니다.

  1. 깊은 수면 (Deep Sleep, DS): 부교감신경이 지배적인 서파 수면.
  2. 렘(REM) 수면: 다양한 자율신경계 활동을 보이는 빠른 눈 움직임 단계.
  3. 빠른 수면 (Rapid Sleep, RS): 중간 자율신경계 특성을 가진 과도기적 수면 상태.

4.2 HRV 특징 추출 🌟

시간 영역 HRV 파라미터는 Task Force 지침에 따라 각 수면 단계별로 별도로 계산되었습니다.

각 수면 단계별 표준 HRV 측정 지표

  1. 평균 RR 간격 (ms).
  2. 연속적인 차이의 제곱근 평균 (RMSSD, ms).
  3. NN 간격의 표준 편차 (SDNN, ms).
  4. 50ms 이상 차이 나는 연속 RR 간격의 비율 (pNN50, %).
  5. RR 간격 범위 (최대 – 최소, ms).

4.3 연령 보정 기법 👵👴

나이 관련 자율신경계 감소를 보정하기 위해 새로운 수학적 연령 보정 접근 방식을 개발했습니다. 아래와 같은 공식으로 설명할 수 있습니다.

HRV​_age_normalized = (HRV_raw / (age_factor + ε))

여기서,

age_factor = (age / 65.0)

ε = 0.1 (수치 안정성 계수)

이 공식은 건강한 인구에서 전형적인 자율신경계 기능 변화를 나타내는 기준점으로 연령 65세를 사용하여 예상되는 나이 관련 감소에 상대적으로 HRV 특징을 스케일링합니다. 안정성 계수 ε는 정규화 효과를 유지하면서 수치 불안정성을 방지합니다.

연령 보정은 특히 모든 수면 단계에 걸쳐 평균 RR 간격 특징에 적용되었습니다.

  • hrv_ds_mean_rr_age_normalized (깊은 수면 평균 RR 간격 연령 보정)
  • hrv_rem_mean_rr_age_normalized (렘 수면 평균 RR 간격 연령 보정)
  • hrv_rs_mean_rr_age_normalized (빠른 수면 평균 RR 간격 연령 보정)

4.4 목표 변수 엔지니어링 🎯

주요 목표

임상 혈당 측정값은 분포의 비대칭성을 해결하고 회귀 안정성을 향상시키기 위해 로그 변환되었습니다.

y_target = ln(glucose_mmol_L)

이 변환은 혈당 분포를 정규화하고 생리학적 범위 전반에 걸쳐 분산을 안정화하여 기계 학습 성능을 향상시킵니다.


4.5 특징 선택 전략 🧠

체계적인 상관관계 기반 특징 선택 접근 방식이 사용되었습니다.

  1. 상관관계 분석: 모든 특징과 로그 변환된 혈당 목표에 대해 피어슨 상관계수를 계산했습니다.
  2. 통계적 필터링: 통계적 관련성과 포함 간의 균형을 맞추기 위해 p-값이 0.2 미만인 특징을 유지했습니다.
  3. 순위 선택: 최종 모델링을 위해 절대 상관관계 강도에 따라 상위 15개 특징을 선택했습니다.

이러한 보수적인 접근 방식은 생체 의학 특징 선택의 모범 사례를 따르면서 작은 데이터 세트에 대한 과적합을 방지하고 관련 예측 특징을 유지합니다.


4.6 기계 학습 구현 💻

모델 선택 💡

BayesianRidge 회귀 모델은 작은 데이터 세트에서 견고한 성능과 내장된 불확실성 정량화를 제공하기 때문에 선택되었습니다.

하이퍼파라미터: α1=α2=λ1=λ2=1×10^-6

이러한 파라미터는 작은 표본 크기에 대한 최적의 정규화를 제공하는 동시에 모델 유연성을 유지합니다.

교차 검증 🔄

계층화 샘플링을 통한 5겹 교차 검증은 강력한 성능 추정을 보장하고 과적합을 방지했습니다. 성능 측정 지표는 다음과 같습니다.

  • 결정 계수 (R<sup>2</sup>)
  • 평균 절대 오차 (MAE)
  • 유의성 검정을 포함한 피어슨 상관계수.

4.7 제거 연구 설계 🗑️

체계적인 제거(Ablation) 분석은 개별 구성 요소의 기여도를 검증했습니다.

  1. 전체 모델: 연령 보정 HRV를 포함한 모든 특징.
  2. 연령 보정 없음: 연령 보정 없는 원시 HRV 특징.
  3. 수면 HRV 없음: 수면 단계별 HRV 특징 제외.
  4. ECG만: ECG에서 파생된 특징만.
  5. 임상적 특징만: HRV 없는 전통적인 임상 파라미터.

이 접근 방식은 각 방법론적 구성 요소의 특정 기여도를 정량화합니다.


4.8 구현 세부 사항 ⚙️

모든 분석은 Google Cloud Platform의 TPU v3-8 (128GB HBM)을 사용하여 수행되었습니다. 소프트웨어 스택은 Python 3.9, TensorFlow 2.19.0 (PJRT 런타임), 그리고 TPU 최적화 라이브러리(NumPy, SciPy, Scikit-learn, XGBoost, Statsmodels)를 기반으로 했습니다. 맞춤형 모듈은 ECG 신호 처리 및 특징 추출을 처리했습니다. 재현성은 고정된 임의 시드(seed=42)와 Docker 컨테이너화를 통해 보장되었습니다.


마치며 💡

이 예비 연구는 비침습적 혈당 예측 분야에서 연령 보정 심박 변이도(HRV) 특징이 가진 잠재력을 성공적으로 보여주었습니다. 특히, 나이와 관련된 자율신경계 변화를 보정하고 수면 단계별 HRV 데이터를 활용하는 접근 방식은 기존 방법 대비 25.6%의 예측 성능 향상을 가져왔다는 점에서 큰 의미가 있습니다. 비록 아직 소규모 코호트 연구의 한계가 있지만, 렘 수면 중 HRV의 중요성을 확인하고 향후 당뇨병 관리의 비침습적 모니터링 기술 발전에 중요한 발판을 마련했습니다. 앞으로 대규모 연구와 임상 검증을 통해 이 기술이 당뇨병 환자들에게 실질적인 도움이 될 수 있기를 기대합니다! 😊

함께 읽으면 좋은 글

함께 읽으면 좋은 글

HarvestAI한국어

에이전트가 ‘코딩’하고, 연구가 ‘루프’를 돌기 시작한 시대: 안드레이 카파시 대담 요약

안드레이 카파시는 최근 몇 달 사이 코딩 에이전트의 도약으로 인해, 사람이 직접 코드를 치기보다 “에이전트에게 의도를 전달하는 일”이 핵심이 됐다고 말합니다. 그는 이 흐름이 오토리서치(AutoResearch)처럼 “실험–학습–최적화”를 사람이 거의 개입하지 않고 굴리는 자율 연구 루프로...

2026년 3월 21일더 읽기
Harvest건강한국어

마누엘 솔라 아르호나 - 훈련의 본질과 복잡성 과학 | EP437

이 에피소드에서는 전 사이클 선수이자 코치이며, "훈련의 본질(The Nature of Training)"의 저자인 마누엘 솔라 아르호나와 함께 복잡성 과학이 지구력 훈련에 어떻게 적용되는지에 대해 깊이 있게 탐구합니다. 복잡한 시스템으로서의 인체와 훈련의 진화론적 관점, 그리고 환원주의의...

2026년 2월 22일더 읽기
Harvest데이터와 판단 · 건강한국어

건강한 집단을 대상으로 한 웨어러블 센서 기반 비침습적 간질액 포도당 예측을 위한 딥러닝 모델 비교 연구

이 논문은 건강한 사람들을 대상으로 웨어러블 기기에서 수집된 생체 신호만을 이용하여 혈당(정확히는 간질액 포도당, IG)을 예측하는 딥러닝 모델들을 비교 분석한 파일럿 연구입니다. 연구진은 음식 기록이나 운동 정보 같은 번거로운 추가 데이터 없이, 순수하게 센서 데이터만으로 BiLSTM 모...

2026년 2월 2일더 읽기