MICCAI

VesselSDF: 혈관 네트워크 재구성을 위한 거리 필드 사전 정보

VesselSDF uses a new "distance field" approach to perfectly map blood vessels from sparse CT scans, overcoming past limitations.

연구 분야 Medical Image Analysis

Article Type Research analysis

Authors Esposito et al.

Original Paper Published 2026

ISOM Posted 2026-03-20 04:08 UTC

Read Time 36M

Open PDF Open Source Page

Editorial Disclosure

ISOM follows an editorial workflow that structures the source paper into a readable analysis, then publishes the summary, source links, and metadata shown on this page so readers can verify the original work.

The goal of this page is to help readers understand the paper's core question, method, evidence, and implications before opening the original publication.

배경 및 학술적 계보

기원 및 학술적 계보

의학 영상 데이터, 특히 희소 CT 스캔 슬라이스에서 혈관 네트워크를 정확하게 재구성하는 문제는 임상 진단 및 수술 계획에서 오랫동안 근본적인 과제였습니다. 이 문제는 컴퓨터 단층 촬영(CT)과 같은 의료 영상 기술이 관상동맥 질환부터 종양 평가에 이르기까지 다양한 질환을 진단하는 데 필수적이 되면서 처음으로 부상하고 중요성을 얻었습니다. 이러한 복잡한 트리 모양 구조를 분할하기 위한 초기 접근 방식은 종종 전통적인 이미지 처리 기술에 의존했습니다. 그러나 수술 내비게이션, 혈류 역학 분석 및 이상 징후 조기 감지를 위한 혈관의 보다 정확한 3D 모델에 대한 수요가 증가함에 따라 이러한 방법의 한계가 명확해졌습니다. 딥러닝의 출현은 의료 영상 분할에 상당한 발전을 가져왔지만, 이러한 정교한 모델조차도 혈관 네트워크의 고유한 특성으로 어려움을 겪었습니다.

저자들이 VesselSDF를 개발하도록 강요한 근본적인 "고충점(pain points)"은 이전 접근 방식의 세 가지 중요한 한계에서 비롯됩니다.

거친 표면 인공물: 전통적인 이진 복셀 분류 방법은 혈관을 이산적인 3D 큐브로 표현합니다. 이러한 이산적 특성은 재구성된 혈관에서 거칠고 블록 같은 표면을 자주 발생시키며, 이는 표면 대 부피 비율이 높은 얇은 혈관에서 특히 문제가 됩니다. 이러한 매끄러움의 부족은 임상 응용 분야에서 모델의 정확성을 떨어뜨립니다.
비등방성 왜곡 및 단편화: 의료 CT 스캔은 종종 각 슬라이스 내에서 슬라이스 간 간격(슬라이스 두께, $\Delta z$)에 비해 훨씬 높은 해상도(평면 내, $\Delta x, \Delta y$)를 갖습니다. 이러한 상당한 차이는 비등방성 왜곡을 생성하여 혈관이 단편화되거나 연결되지 않은 것처럼 보이게 하며, 특히 분기점이나 급격하게 방향이 바뀌는 곳에서 그렇습니다.
SDF에서의 부유 인공물: 부호화 거리 필드(SDF)는 연속적인 표면을 표현하는 유망한 방법을 제공하지만, 기존의 SDF 기반 방법 자체는 종종 "부유 인공물"을 생성합니다. 이는 재구성에서 나타나지만 실제 혈관 구조에 해당하지 않는 작고 분리된 표면 조각으로, 3D 모델의 전반적인 품질과 신뢰성을 저하시킵니다.

직관적인 도메인 용어

부호화 거리 필드 (Signed Distance Field, SDF): 도시의 3D 지도가 있고 도시의 모든 지점에서 가장 가까운 강까지의 거리를 알고 싶다고 상상해 보세요. SDF는 혈관에 대한 지도와 같습니다. 공간의 모든 지점에 대해 혈관 표면까지의 최단 거리를 알려줍니다. 지점이 혈관 내부에 있으면 거리는 음수이고, 외부에 있으면 양수이며, 정확히 표면에 있으면 거리는 0입니다. 이러한 연속적인 표현은 부드러운 모양을 포착하는 데 도움이 됩니다.
이진 복셀 분류 (Binary Voxel Classification): 3D 이미지가 작은 레고 벽돌(복셀)로 만들어졌다고 생각하세요. 이진 복셀 분류는 각 개별 레고 벽돌이 혈관의 일부인지(빨간색으로 칠함) 또는 혈관의 일부가 아닌지(투명하게 둠) 결정하는 것과 같습니다. 각 작은 큐브에 대한 간단한 "예" 또는 "아니요" 결정으로, 블록 같거나 단편화된 결과를 초래할 수 있습니다.
희소 CT 스캔 슬라이스 (Sparse CT Scan Slices): 매우 얇고 간격이 넓은 몇 개의 단면만 보고 복잡한 나무의 전체 3D 모양을 이해하려고 한다고 상상해 보세요. 희소 CT 스캔은 유사합니다. 신체의 제한된 "슬라이스"를 얻고 그 사이에 상당한 간격이 있습니다. 이러한 몇 개의 멀리 떨어진 슬라이스에서 연속적인 구조(예: 혈관)를 재구성하는 것은 주요 과제입니다.
구조적 연속성 / 기하학적 충실도 (Structural Continuity / Geometric Fidelity): 이는 재구성된 혈관이 자연스럽고 끊김 없는 흐름과 정확한 모양을 얼마나 잘 유지하는지를 나타냅니다. 혈관이 연속적인 튜브여야 한다면, "구조적 연속성"은 끊김이나 파손이 없음을 의미합니다. "기하학적 충실도"는 곡선, 분기 및 직경이 실제 혈관과 일치하며 거칠거나 왜곡되거나 단순화되지 않았음을 의미합니다.
부유 인공물 (Floating Artifacts): 조각가가 세부적인 조각상을 조각하려고 하지만 실수로 주요 조각 주위에 작고 원치 않는 돌 조각이 떠 있도록 남겨둔다고 상상해 보세요. 3D 혈관 재구성에서 부유 인공물은 최종 모델에 나타나지만 실제 혈관 네트워크에 속하지 않는 작고 분리된 기하학적 조각입니다. 이는 재구성의 품질과 사실성을 저하시키는 잘못된 요소입니다.

표기법 표

표기법	설명
$V$	입력 체적 CT 스캔
$D, H, W$	CT 스캔의 차원 (깊이, 높이, 너비)
$\mathbf{x}$	$\mathbb{R}^3$에서의 3D 공간 좌표
$f_{SDF}(\mathbf{x}; \theta_r)$	$\mathbf{x}$에서의 예측된 부호화 거리 필드 (SDF), $\theta_r$로 매개변수화됨
$S$	$f_{SDF}$의 제로 레벨 집합으로 정의되는 혈관 표면
$f_o(\mathbf{x}; \theta_o)$	$\mathbf{x}$에서의 예측된 이진 점유 확률, $\theta_o$로 매개변수화됨
$f^*_{SDF}(\mathbf{x})$	$\mathbf{x}$에서의 실제 SDF
$y$	$\mathbf{x}$에서의 점유에 대한 실제 이진 레이블 (혈관의 경우 1, 배경의 경우 0)
$\mathcal{L}$	총 손실 함수
$\mathcal{L}_{sdf}$	SDF 감독 손실 (L1 노름)
$\mathcal{L}_{occ}$	점유 감독 손실 (이진 교차 엔트로피)
$\mathcal{L}_{eik}$	오일러 정규화 손실
$\mathcal{L}_{gauss}$	거리 가중 가우시안 정규화 손실
$\mathcal{L}_{sur}$	표면 정규화 손실
$\lambda_s, \lambda_o, \lambda_e, \lambda_g, \lambda_r$	해당 손실 항의 가중치
$\partial_x, \partial_y, \partial_z$	x, y, z 좌표에 대한 편미분
$\gamma$	오일러 손실에서 z-차원 기울기에 대한 비등방성 스케일링 인수
$G_\sigma(\cdot)$	표준 편차 $\sigma$를 갖는 3D 가우시안 블러 연산자
$\beta$	표면 정규화를 위한 하이퍼파라미터
$\Omega$	3D 훈련 볼륨
$\theta_o$	이진 점유 U-Net의 매개변수
$\theta_r$	SDF 정제기 U-Net의 매개변수
$g_e, h_e$	어텐션 게이트의 게이팅 및 스킵 연결 특징 맵
$a_e$	어텐션 가중치
$\mathcal{A}(\cdot)$	학습된 어텐션 함수
$W_g, W_h$	어텐션 게이트의 학습 가능한 가중치 행렬

문제 정의 및 제약 조건

핵심 문제 공식화 및 딜레마

이 논문에서 다루는 핵심 문제는 희소 의료 영상 데이터, 특히 CT 스캔 슬라이스에서 복잡한 혈관 네트워크를 정확하고 견고하게 재구성하는 것입니다.

제안된 VesselSDF 프레임워크의 시작점(입력/현재 상태)은 체적 CT 스캔 $V \in \mathbb{R}^{D \times H \times W}$으로 표현되며, 여기서 $D$는 축 방향 슬라이스 수, $H, W$는 평면 내 차원을 나타냅니다. 이 입력 데이터는 특히 영상 평면 간의 희소성과 방사선량 감소 또는 시간 제약과 같은 요인으로 인한 평면 통과 해상도 제한으로 특징지어집니다.

원하는 종점(출력/목표 상태)은 연속적인 부호화 거리 필드(SDF) $f_{SDF}(\mathbf{x}; \theta_r)$이며, 이는 혈관 표면을 제로 레벨 집합으로 암시적으로 정의합니다: $S := \{\mathbf{x} \in \mathbb{R}^3 \mid f_{SDF}(\mathbf{x}; \theta_r) = 0\}$. 이 SDF는 혈관의 부드러운 관형 기하학, 복잡한 분기 패턴을 정확하게 포착하고 구조적 연속성과 기하학적 충실도를 유지하는 고품질 재구성 혈관을 생성할 수 있어야 합니다. 궁극적인 목표는 임상 환경에 보다 신뢰할 수 있는 혈관 분석을 제공하는 것입니다.

VesselSDF가 해결하려고 하는 정확한 누락된 연결 또는 수학적 격차는 이산적인 복셀 기반 표현과 결함이 있는 연속 SDF 방법을 넘어서 진정으로 정확하고 위상적으로 일관된 연속 혈관 표면을 달성하는 데 있습니다. 전통적인 이진 복셀 분류 접근 방식은 기초적이지만 본질적으로 거친 표면 인공물을 생성하며, 특히 얇은 혈관에서 두드러집니다. 또한 CT 스캔에서 평면 내 해상도($\Delta x, \Delta y$)와 슬라이스 두께($\Delta z$) 간의 상당한 비등방성은 특히 중요한 분기점에서 혈관 구조의 단편화를 초래합니다. 부호화 거리 필드는 연속 표면 표현에 유망한 방향을 제공하지만, 기존의 SDF 기반 방법은 종종 바람직하지 않은 "부유 인공물"을 생성합니다. 즉, 재구성 품질을 심각하게 저하시키는 분리된 표면 조각입니다. 이 논문은 혈관 분할을 연속적인 SDF 회귀 문제로 재구성하여 혈관 기하학 및 연결성을 본질적으로 포착하는 연속적인 표현을 학습함으로써 이러한 한계를 직접적으로 해결합니다.

이 분야의 연구자들을 역사적으로 가두어 온 고통스러운 절충 또는 딜레마는 특히 얇고 트리 모양의 구조에 대해 미세한 혈관 연결성을 보존하는 것과 정확한 경계를 유지하는 것 사이의 근본적인 긴장입니다. 한 측면을 개선하는 것이 종종 다른 측면을 손상시킵니다. 예를 들어, 연속성을 보장하기 위한 공격적인 평활화는 과도한 평활화와 미세한 세부 정보 손실로 이어질 수 있으며, 정확한 경계에 초점을 맞추는 것은 단편화되거나 연결되지 않은 혈관 세그먼트를 초래할 수 있습니다. 종종 이진 복셀 분류에 기반한 이전 딥러닝 접근 방식은 이 딜레마로 어려움을 겪어 구조적 일관성이 부족하거나 특정 훈련 데이터를 넘어서는 일반화에 실패하여 일반화 가능한 기하학적 원리를 학습하기보다는 구성을 암기하는 모델로 이어집니다.

제약 조건 및 실패 모드

정확한 혈관 네트워크 재구성 문제는 연구자들이 직면하는 몇 가지 가혹하고 현실적인 벽으로 인해 엄청나게 어렵습니다.

물리적/기하학적 제약 조건:
- 얇고 분기하는 구조: 혈관은 복잡한 분기 패턴과 다양한 직경을 가지며 종종 매우 얇습니다. 희소 데이터에서 이러한 섬세한 트리 모양 구조를 정확하게 재구성하는 것은 상당한 과제입니다.
- 복잡한 위상: 수많은 분기점과 구불구불한 경로를 포함하는 혈관 네트워크의 복잡한 위상은 구조적 일관성을 유지하고 혈관이 분기하거나 방향이 급격하게 바뀌는 영역에서 특히 단편화를 방지하기 어렵게 만듭니다.
- 비등방성 해상도: CT 스캔에서 평면 내 해상도와 슬라이스 두께 간의 상당한 차이는 비등방성 왜곡을 생성합니다. 이는 분기점에서의 단절 및 혈관 구조의 단편화를 초래하여 부드럽고 연속적인 표면을 재구성하기 어렵게 만듭니다.
계산 제약 조건:
- 데이터 희소성: 주요 입력인 희소 CT 스캔 슬라이스는 영상 평면 간에 본질적인 희소성을 나타냅니다. 이러한 제한된 평면 통과 해상도는 임상 환경에서 방사선량 감소 또는 실시간 지연 시간 요구 사항을 충족하기 위한 노력의 직접적인 결과이지만, 3D 재구성에 사용할 수 있는 정보를 심각하게 제한합니다.
- 고해상도에 대한 계산 복잡성: 희소 2D 슬라이스에서 고해상도 3D 재구성을 달성하려면 일반적으로 기하급수적으로 더 많은 계산 리소스가 필요하며, 이는 모델 복잡성과 추론 속도에 실질적인 제한을 가합니다.
데이터 기반 제약 조건:
- 주석 데이터 부족: 특히 얇은 혈관 구조에 대한 상세한 주석이 있는 고품질 의료 영상 데이터셋은 본질적으로 부족합니다. 이러한 데이터 부족은 종종 모델이 견고하고 일반화 가능한 기하학적 원리를 학습하기보다는 특정 혈관 구성을 암기하게 만듭니다.
- 높은 피험자 간 변동성: 혈관 해부학은 피험자 간 변동성이 높아 제한된 데이터셋으로 훈련된 모델이 다른 환자 및 해부학적 변형에 걸쳐 효과적으로 일반화하기 어렵게 만듭니다.

VesselSDF가 극복하고자 하는 이전 접근 방식의 실패 모드는 다음과 같습니다.
* 거친 표면 인공물: 복셀 기반 표현의 이산적 특성은 필연적으로 계단식 또는 거친 표면을 생성하며, 특히 표면 대 부피 비율이 높은 얇은 혈관에서 눈에 띕니다.
* 단편화되고 연결되지 않은 혈관: 희소 데이터와 비등방성 해상도로 인해 이전 방법은 종종 단편화되거나 해부학적으로 불가능한 재구성을 생성하며, 혈관이 분리되거나 불완전하게 나타납니다. 미세 혈관은 자주 감지되지 않거나 단편화됩니다.
* 부유 인공물: 연속적인 표현을 제공하는 기존 SDF 기반 방법조차도 종종 실제 혈관 네트워크의 일부가 아닌 분리된 표면 조각인 잘못된 "부유" 인공물을 생성하여 전반적인 재구성 품질을 저하시킵니다.
* 일반화 부족: 모델은 보편적인 기하학적 사전 정보를 학습하기보다는 제한된 훈련 데이터의 특정 패턴을 암기하는 경향이 있어 보이지 않는 데이터 또는 다른 혈관 구성에 대한 성능이 저하됩니다.

이 접근 방식이 선택된 이유

선택의 불가피성

VesselSDF로 구현된 연속 부호화 거리 필드(SDF) 회귀 접근 방식의 채택은 혈관 네트워크 재구성을 위한 전통적인 방법의 본질적인 한계를 고려할 때 단순한 개선이 아니라 필수적인 패러다임 전환이었습니다. 저자들은 특히 이진 복셀 분류(예: 표준 U-Net 변형)에 기반한 기존 딥러닝 접근 방식의 치명적인 단점을 자세히 설명함으로써 이 깨달음의 정확한 순간을 명시적으로 식별합니다.

이러한 전통적인 방법은 여러 가지 이유로 근본적으로 불충분한 것으로 밝혀졌습니다.

이산 표현 인공물: 이진 복셀 기반 표현은 본질적으로 거칠고 계단식 표면을 생성합니다. 이는 표면 대 부피 비율이 높은 섬세하고 복잡한 혈관 구조에 특히 문제가 되며, 기하학적 충실도의 상당한 손실과 해부학적으로 불가능한 재구성을 초래합니다.
비등방성 왜곡 및 단편화: 의료 영상 데이터, 특히 희소 CT 스캔 슬라이스는 종종 평면 내 해상도($\Delta x, \Delta y$)와 슬라이스 두께($\Delta z$) 사이에 상당한 차이를 보입니다. 이산적인 방법은 이러한 간격을 연결하는 데 어려움을 겪어 비등방성 왜곡과 특히 중요한 분기점에서 혈관 구조의 단편화를 초래합니다. 이는 단절과 중요한 기하학적 특징의 손실로 이어집니다.
구조적 일관성 및 일반화 부족: 강력하지만 기존 딥러닝 모델은 복잡한 혈관 위상에서 구조적 일관성을 유지하는 데 종종 실패합니다. 이들은 일반화 가능한 기하학적 원리를 학습하기보다는 제한된 훈련 데이터의 특정 혈관 구성을 암기하는 경향이 있어 보이지 않는 데이터에서 단편화되거나 연결되지 않은 혈관을 생성하기 쉽습니다.
단순 SDF에서의 부유 인공물: SDF는 유망한 연속 표현을 제공하지만, 기존 SDF 기반 방법조차도 재구성 품질을 저하시키는 분리된 표면 조각인 "부유 인공물"을 생성할 수 있습니다. 이는 단순히 SDF로 전환하는 것만으로는 충분하지 않았으며, 보다 강력하고 인공물 인식이 가능한 접근 방식이 필요했음을 의미합니다.

연속적인 표현을 제공하고 일관된 공간 관계를 포착하는 SDF의 연속적인 특성은 이산 표현이 단순히 해결할 수 없는 이러한 깊은 문제를 극복하기 위한 유일한 실행 가능한 해결책으로 부상했습니다. 희소 데이터에서 섬세하고 분기하는 구조의 부드럽고 연속적이며 위상적으로 일관된 재구성에 대한 문제의 요구 사항은 연속적인 기하학적 회귀 프레임워크로의 전환을 불가피하게 만들었습니다.

비교 우위

VesselSDF는 주로 구조 설계와 새로운 정규화 기술을 통해 단순한 성능 지표를 훨씬 뛰어넘는 질적 우수성을 보여줍니다. 그 장점은 SDF의 고유한 속성을 활용하면서도 일반적인 함정을 세심하게 해결하는 방식에서 비롯됩니다.

고유한 부드러움 및 기하학적 충실도: 이산 복셀 표현과 달리 SDF는 본질적으로 부드럽고 연속적인 표면을 인코딩합니다. VesselSDF는 혈관 분할을 연속적인 SDF 회귀 문제로 재구성함으로써 이를 활용합니다. 이를 통해 혈관의 부드러운 관형 기하학 및 복잡한 분기 패턴을 본질적으로 포착하여 우수한 기하학적 충실도와 구조적 일관성을 갖춘 재구성을 제공합니다.
적응형 노이즈 처리 및 세부 정보 보존: 주요 구조적 이점은 새로운 거리 가중 가우시안 정규화기(8번 식)입니다. 이 메커니즘은 적응적으로 평활화를 적용합니다. 혈관 표면에서 멀리 떨어진 영역(여기서 $|f_{SDF}(\mathbf{x})|$가 크고 노이즈가 더 만연함)에서는 SDF를 공격적으로 블러링하고 평활화하여 고차원 노이즈를 효과적으로 처리합니다. 중요한 것은 표면 경계 근처의 미세한 혈관 세부 정보(여기서 $|f_{SDF}(\mathbf{x})| \approx 0$)를 동시에 보존하여 중요한 해부학적 특징의 과도한 평활화를 방지한다는 것입니다. 이는 균일한 정규화를 적용하는 방법보다 상당한 질적 도약입니다.
기하학적 사전 정보를 통한 일반화 향상: 이 문제를 이산 분류가 아닌 연속 기하학 회귀로 프레임함으로써 VesselSDF는 특정 패턴을 암기하기보다는 보다 보편적인 기본 모양 원리를 학습합니다. 거리 가중 정규화는 혈관 연속성과 관련된 일반적인 기하학적 사전 정보를 인코딩하여 이를 더욱 강화합니다. 이를 통해 모델은 다른 혈관 구성 및 해부학적 변형에 걸쳐 지식을 보다 효과적으로 전송할 수 있습니다.
견고한 인공물 제거: 적응형 가우시안 정규화기와 표면 정규화 항(9번 식)의 조합은 부유 세그먼트와 같은 일반적인 SDF 인공물을 제거하기 위한 견고한 메커니즘을 제공합니다. 표면 정규화는 실제 표면의 강력한 증거 없이도 제로에 가까운 SDF 값을 구체적으로 페널티화하여 최종 모델의 품질과 사실성을 저하시키는 잘못된 또는 약한 경계를 효과적으로 억제합니다.
분리된 2단계 정제: 초기 이진 점유 예측과 후속 SDF 정제를 분리하는 2단계 아키텍처는 구조적 이점입니다. 초기 U-Net은 신뢰할 수 있는 시작점을 제공하며, 두 번째 단계인 추가 3D U-Net은 기하학적 정규화에 의해 안내되는 올바르게 스케일링된 SDF로 이를 정제하는 데만 집중합니다. 이러한 분리는 각 단계가 특정 작업에 대해 최적화되도록 하여 보다 견고하고 정확한 최종 재구성을 가능하게 합니다.

제약 조건과의 정렬

VesselSDF의 설계는 희소 CT 데이터에서 혈관 네트워크 재구성의 가혹한 요구 사항과 완벽하게 일치하며, 문제와 해결책 간의 "결혼"을 형성합니다.

제약 조건: 희소 CT 스캔 슬라이스 및 단절: 문제는 평면 통과 해상도가 제한되어 단절이 발생한다는 특징이 있습니다.
- 정렬: VesselSDF의 연속 SDF 표현은 희소 슬라이스 간을 본질적으로 보간합니다. 볼륨의 각 지점을 가장 가까운 혈관 표면까지의 부호화 거리로 표현함으로써, 이는 단절을 극복하는 부드럽고 연속적인 표면을 생성하여 희소성으로 인한 단편화를 극복합니다. SDF 표현은 "거리 필드 속성을 통해 이웃 예측을 본질적으로 결합합니다"(5페이지)라고 명시되어 있으며, 슬라이스 간의 일관성을 보장합니다.
제약 조건: 얇고 분기하는 혈관 및 거친 인공물: 섬세한 트리 모양 구조는 이산 복셀로 인해 거칠어지기 쉽습니다.
- 정렬: 부드럽고 관형인 기하학은 연속 SDF에 의해 자연스럽게 포착됩니다. 이는 복셀 기반 방법의 본질적인 거친 표면 인공물을 제거하여 얇은 혈관과 복잡한 분기 패턴에 대한 보다 정확하고 해부학적으로 가능한 표현을 제공합니다.
제약 조건: 구조적 연속성 및 기하학적 충실도 유지: 혈관이 연결되고 기하학적으로 정확하게 유지되도록 하는 것이 가장 중요합니다.
- 정렬: 오일러 정규화(7번 식)는 기울기 크기가 거의 1이 되도록 하여 기하학적 인공물을 초래할 수 있는 큰 편차를 방지하여 부드러운 거리 전환을 장려합니다. 또한 거리 가중 가우시안 정규화기는 전반적인 부드러움을 유지하면서 혈관 표면 근처의 정확한 기하학을 보장하여 연속성과 충실도 모두를 직접적으로 해결합니다.
제약 조건: 훈련 데이터 너머의 일반화: 주석 데이터 부족으로 인해 모델이 특정 패턴을 암기하게 됩니다.
- 정렬: 이 작업을 연속 기하학 회귀로 재구성함으로써 VesselSDF는 특정 복셀 패턴이 아닌 기본 모양 원리를 학습합니다. 거리 가중 정규화는 혈관 연속성과 관련된 보편적인 기하학적 사전 정보를 인코딩하여 이를 더욱 강화하여 모델이 다른 혈관 구성 및 해부학적 변형에 걸쳐 일반화할 수 있는 능력을 향상시킵니다.
제약 조건: 부유 인공물 제거: 기존 SDF 방법에서도 흔한 문제입니다.
- 정렬: 적응형 가우시안 정규화기와 표면 정규화 항(9번 식)은 이를 해결하기 위해 특별히 설계되었습니다. 가우시안 정규화기는 혈관 표면에서 멀리 떨어진 영역에서 평활화를 보장하는 반면, 표면 정규화는 분리된 구성 요소를 형성할 수 있는 약하고 노이즈가 많은 경계를 억제합니다.

대안의 거부

이 논문은 주로 이산 복셀 분류 방법의 한계와 SDF 기반 기술에서 견고한 정규화의 필요성에 초점을 맞춰 전통적이고 심지어 현대적인 접근 방식을 거부한 이유를 명확히 설명합니다.

표준 CNN(예: 3D U-Net [5], 3D SA-UNet [8], nnU-Net [9])과 같은 인기 있는 접근 방식에 대한 핵심 주장은 연속적이고 부드러운 표면을 표현하고 비등방성 데이터를 효과적으로 처리하는 고유한 능력 부족입니다. 명시된 바와 같이, "이진 복셀 분류에 기반한 기존 딥러닝 접근 방식은 종종 구조적 연속성과 기하학적 충실도로 어려움을 겪습니다." (초록). 구체적으로 이러한 방법은 다음과 같습니다.

거친 표면 인공물 생성: 복셀의 이산적 특성은 필연적으로 "표면 대 부피 비율이 높은 얇은 혈관에서 특히 두드러지는 거친 표면 인공물"을 생성합니다. (4페이지).
비등방성 왜곡으로 어려움: 영상 평면($\Delta x, \Delta y$ 대 $\Delta z$) 간의 상당한 차이는 "분기점에서 특히 혈관 구조를 단편화하는 비등방성 왜곡"을 초래합니다. (4페이지).
구조적 일관성으로 어려움: 종종 "단편화되거나 해부학적으로 불가능한 재구성"을 초래하여 섬세한 혈관 네트워크의 연결성을 유지하는 데 실패합니다. (2페이지).

이 논문은 다른 신경 암시적 표현 및 SDF 기반 방법(예: [1, 3, 11, 21])의 출현을 인정하지만, VesselSDF의 고유한 기여를 강조함으로써 그 불충분함을 암시합니다. 저자들은 "기존 SDF 기반 방법은 종종 재구성 품질을 저하시키는 분리된 표면 조각인 부유 인공물을 생성합니다." (4페이지)라고 말합니다. 이는 VesselSDF의 특정 적응형 가우시안 정규화 및 표면 정규화 기술 없이는 다른 SDF 접근 방식조차도 도전적인 혈관 데이터에 필요한 견고성과 인공물 억제 수준을 제공하지 못할 것임을 시사합니다. 이 논문은 이 특정 작업에 대한 생성적 적대 신경망(GAN) 또는 확산 모델과 같은 다른 인기 있는 딥러닝 패러다임의 특정 실패를 자세히 다루지는 않지만, 복셀 기반 출력을 사용하는 많은 유사한 방법에 대한 이산 표현에 대한 일반적인 비판이 적용됩니다.

수학적 및 논리적 메커니즘

마스터 방정식

VesselSDF 프레임워크의 핵심에는 두 단계에 걸쳐 학습 프로세스를 조정하는 포괄적인 손실 함수가 있습니다. 저자들이 훈련 중에 최소화하고자 하는 이 마스터 방정식은 직접적인 감독 학습 목표와 여러 기하학적 정규화 항을 우아하게 결합합니다. 이는 모델의 부드럽고 연속적이며 위상적으로 정확한 혈관 네트워크를 재구성하는 능력을 추진하는 중앙 수학적 엔진입니다.

총 손실 $\mathcal{L}$은 다음과 같이 정의됩니다.

$$ \mathcal{L} = \lambda_s \mathcal{L}_{sdf} + \lambda_o \mathcal{L}_{occ} + \lambda_e \mathcal{L}_{eik} + \lambda_g \mathcal{L}_{gauss} + \lambda_r \mathcal{L}_{sur} $$

이 방정식은 다섯 가지 개별 손실 구성 요소의 가중 합으로, 각 구성 요소는 예측된 부호화 거리 필드(SDF)를 형성하고 최종 혈관 재구성의 품질을 보장하는 데 중요한 역할을 합니다.

항별 분석

각 손실 구성 요소가 개별 기여와 포함된 이유를 이해하기 위해 마스터 방정식의 각 구성 요소를 분석해 보겠습니다.

$\mathcal{L}$ (총 손실): 이는 VesselSDF 모델이 최소화하려고 하는 전반적인 목표 함수입니다. 그 값은 모델의 예측이 실제와 얼마나 잘 일치하고 부과된 기하학적 제약 조건을 충족하는지를 반영합니다. 최적화 프로세스의 목표는 가장 낮은 $\mathcal{L}$ 값을 생성하는 모델 매개변수를 찾는 것입니다.
$\lambda_s, \lambda_o, \lambda_e, \lambda_g, \lambda_r$ (손실 가중치): 이들은 각 개별 손실 항의 상대적 중요성을 결정하는 스칼라 하이퍼파라미터입니다. 예를 들어, 저자들은 실험에서 $\lambda_s = 0.1$, $\lambda_o = 0.01$, $\lambda_e = 0.01$, $\lambda_g = 0.1$, $\lambda_r = 0.1$로 설정했습니다. 이러한 가중치를 조정함으로써 직접적인 감독과 기하학적 정규화 간의 균형을 미세 조정하여 특정 측면을 다른 측면보다 강조할 수 있습니다. 여기서 덧셈의 선택은 다중 작업 학습 설정에서 여러 목표를 결합하는 표준이며, 각 항이 전반적인 기울기에 독립적으로 기여할 수 있도록 합니다.
$\mathcal{L}_{sdf}$ (SDF 감독 손실):
$$ \mathcal{L}_{sdf} = E_{x \in \Omega} |f_{SDF}(x) - f^*_{SDF}(x)| $$
1. 수학적 정의: 이 항은 3D 공간 좌표 $x$에서의 예측된 부호화 거리 필드 $f_{SDF}(x)$와 해당 실제 SDF $f^*_{SDF}(x)$ 간의 L1 절대 차이를 계산합니다. $E_{x \in \Omega}$의 기대값은 3D 훈련 볼륨 $\Omega$ 내의 모든 샘플링된 지점 $x$에 대해 이 차이가 평균화됨을 의미합니다.
2. 물리적/논리적 역할: 이는 SDF 정제 단계에 대한 직접적인 감독 항입니다. 이는 모델이 실제 부호화 거리 값을 학습하도록 강제하여 예측된 표면(여기서 $f_{SDF}(x) = 0$)이 실제 혈관 경계와 정확하게 일치하도록 합니다. L1 노름(절대 차이)은 회귀 작업에서 이상값에 대한 견고한 페널티가 필요할 때 L2(제곱 차이)보다 선호되는 경우가 많으며, 이는 큰 오차에 덜 민감하기 때문입니다. 이는 오류에 대한 희소성을 장려합니다.
3. L1을 사용하는 이유? L1 노름은 오류에 대해 선형 페널티를 제공하여 오류를 제곱하는 L2 노름에 비해 이상값에 더 견고하며, 이는 큰 편차에 의해 크게 영향을 받을 수 있습니다. 이는 모델이 노이즈가 있는 실제 SDF 값에 과도하게 영향을 받지 않도록 하는 데 도움이 됩니다.
$\mathcal{L}_{occ}$ (점유 감독 손실):
$$ \mathcal{L}_{occ} = -E_{x \in \Omega} [y \log(f_o(x)) + (1 - y) \log(1 - f_o(x))] $$
1. 수학적 정의: 이는 이진 교차 엔트로피 손실입니다. 여기서 $y \in \{0, 1\}$은 지점 $x$에 대한 이진 실제 레이블(혈관의 경우 1, 배경의 경우 0)이고 $f_o(x)$는 지점 $x$가 혈관에 속할 확률에 대한 예측 점유 확률입니다.
2. 물리적/논리적 역할: 이 항은 네트워크의 첫 번째 단계인 이진 점유 예측기를 감독합니다. 이는 모델이 각 복셀을 혈관에 속하는지 또는 속하지 않는지로 올바르게 분류하도록 장려합니다. 이 손실을 최소화함으로써 모델은 혈관 복셀에 대해 높은 확률을, 배경 복셀에 대해 낮은 확률을 출력하도록 학습합니다.
3. 이진 교차 엔트로피를 사용하는 이유? BCE는 이진 분류 문제에 대한 표준 손실 함수입니다. 이는 예측된 확률 분포와 실제 이진 분포 간의 불일치를 효과적으로 측정하여 모델의 예측을 올바른 레이블로 푸시합니다.
$\mathcal{L}_{eik}$ (오일러 정규화 손실):
$$ \mathcal{L}_{eik} = E_{x \in \Omega} [(\partial_x f_{SDF}(x))^2 + (\partial_y f_{SDF}(x))^2 + (\gamma \partial_z f_{SDF}(x))^2 - 1]^2 $$
1. 수학적 정의: 이 항은 실제 SDF의 기울기 크기가 거의 모든 곳에서 1이어야 한다고 명시하는 이상적인 오일러 방정식에서 벗어나는 것을 페널티화합니다. 예측된 SDF의 제곱 기울기 크기와 1 사이의 제곱 차이를 계산합니다. $\partial_x, \partial_y, \partial_z$는 x, y, z 좌표에 대한 편미분을 나타냅니다. $\gamma = \frac{\Delta x}{\Delta z}$는 평면 내(x, y) 치수와 비교하여 축(z) 차원을 따라 잠재적인 복셀 간격 차이를 설명하는 비등방성 스케일링 인수입니다.
2. 물리적/논리적 역할: 이는 중요한 기하학적 정규화 항입니다. 이는 예측된 $f_{SDF}(x)$가 표면에서 멀어질 때 거리가 균일하게 변하는 실제 거리 함수처럼 동작하도록 강제하여 SDF가 너무 가파르거나 너무 평평해지는 것을 방지하고 부드러운 거리 전환을 보장하며 기하학적 인공물(예: "축소된" 또는 "팽창된" 표면)을 방지합니다. 비등방성 스케일링 $\gamma$는 의료 영상에서 일반적인 비균일 복셀 해상도 문제를 처리하기 위한 영리한 터치입니다.
3. 1에서 제곱 차이를 사용하는 이유? 실제 부호화 거리 함수의 기본 속성은 기울기 크기가 1이라는 것입니다. 1에서 제곱 차이를 페널티화함으로써 손실은 모델이 이 속성을 학습하도록 장려하여 SDF를 기하학적으로 일관되게 만듭니다.
$\mathcal{L}_{gauss}$ (거리 가중 가우시안 정규화 손실):
$$ \mathcal{L}_{gauss} = E_{x \in \Omega} |f_{SDF}(x)| \cdot ||f_{SDF}(x) - G_\sigma(f_{SDF}(x))||_2^2 $$
1. 수학적 정의: 이 항은 거리 가중 평활화 제약 조건을 적용합니다. 이는 예측된 SDF $f_{SDF}(x)$와 해당 가우시안 블러 버전 $G_\sigma(f_{SDF}(x))$(여기서 $G_\sigma$는 표준 편차 $\sigma$를 갖는 3D 가우시안 블러 연산자임) 간의 차이의 제곱 L2 노름을 계산합니다. 이 차이는 예측된 SDF의 절대값 $|f_{SDF}(x)|$로 가중됩니다.
2. 물리적/논리적 역할: 이는 고주파 노이즈와 부유 인공물을 줄이기 위해 설계된 적응형 평활화 항으로, 특히 혈관 표면에서 멀리 떨어진 영역에서 그렇습니다. 가중치 인수 $|f_{SDF}(x)|$는 $x$가 혈관 표면에서 멀리 떨어져 있을 때(여기서 $|f_{SDF}(x)|$가 큼) 평활화 효과가 더 강하고 $x$가 표면에 가까울 때(여기서 $|f_{SDF}(x)| \approx 0$) 약하다는 것을 의미합니다. 이를 통해 모델은 중요한 미세 혈관 세부 정보를 경계 근처에 보존하면서 전역적인 평활화를 달성할 수 있습니다.
3. 거리 가중 가우시안 블러를 사용하는 이유? 가우시안 블러는 평활화를 위한 표준 이미지 처리 기술입니다. 거리 가중이 여기서 핵심 혁신입니다. 이는 적응형 평활화를 가능하게 합니다. 이것이 없으면 전역적인 평활화 항이 중요한 미세 혈관 구조를 흐리게 할 수 있습니다. 평활화 강도를 표면까지의 거리에 따라 달라지게 함으로써, 저자들은 가장 중요한 곳에서 세부 정보를 보존하도록 보장합니다.
$\mathcal{L}_{sur}$ (표면 정규화 손실):
$$ \mathcal{L}_{sur} = E_{x \in \Omega} \exp(-\beta |f_{SDF}(x)|) $$
1. 수학적 정의: 이 항은 양수 하이퍼파라미터 $\beta > 0$로 가중된 음수 절대 예측 SDF의 지수 함수의 역함수를 사용합니다.
2. 물리적/논리적 역할: 이 항은 잘못된 또는 "부유하는" 혈관 구성 요소를 억제하기 위해 특별히 설계되었습니다. 실제 표면의 강력한 증거 없이 제로에 가까운 예측된 SDF 값에 대해 높은 페널티를 부과합니다. 더 큰 $\beta$는 이 페널티를 더 공격적으로 만들어 약하고 노이즈가 많은 경계를 효과적으로 제로 레벨 집합에서 멀리 밀어내어 재구성을 정리합니다.
3. 지수 함수를 사용하는 이유? 지수 함수 $\exp(-z)$는 $z$가 증가함에 따라 매우 빠르게 감소합니다. $z = \beta |f_{SDF}(x)|$일 때, 이는 $|f_{SDF}(x)|$가 작을 때(즉, 표면에 가까울 때) 손실이 매우 높고 $|f_{SDF}(x)|$가 증가함에 따라 빠르게 감소한다는 것을 의미합니다. 이는 모호한 표면 근처 예측을 하는 것에 대해 강력한 "반발" 효과를 생성하여, 이를 명확한 표면으로 만들거나 멀리 이동하도록 장려합니다.

단계별 흐름

훈련 중에 우리의 입자가 VesselSDF 파이프라인을 통과하는 것처럼, 단일 추상 3D 공간 좌표를 상상해 봅시다. 이는 정교한 조립 라인을 통과하는 작은 입자와 같습니다.

초기 입력: 우리의 입자 $x$는 원시 체적 CT 스캔 $V$ 내의 좌표로 여정을 시작합니다. 시스템은 또한 CT 스캔 주변의 로컬 이미지 특징에 액세스할 수 있습니다.
1단계: 점유 예측 ("거친 스케치" 단계):
- 좌표 $x$(또는 오히려 $x$ 및 주변에서 CT 스캔에서 추출된 특징)는 먼저 이진 점유 예측을 위한 3D U-Net으로 들어갑니다. 이를 $f_o(\cdot; \theta_o)$라고 부릅니다.
- 이 U-Net 내부에서 입력 특징은 인코더-디코더 구조를 통해 처리됩니다. 다양한 수준에서 3D 어텐션 게이트(2번 식에서 설명한 대로)는 지능형 필터처럼 작동합니다. 이들은 수신 특징 맵 $g_e$ 및 $h_e$를 분석하고 어텐션 가중치 $a_e$를 생성합니다. 이러한 가중치는 스킵 연결 특징을 변조하여 네트워크가 관련 혈관 영역에 계산 노력을 집중하고 손실될 수 있는 미세한 세부 정보를 보존하도록 합니다.
- 이 U-Net을 통과한 후, 우리의 입자 $x$는 점유 확률 $f_o(x)$를 할당받습니다. 이 값은 일반적으로 0과 1 사이이며, $x$가 혈관(예: $f_o(x) \approx 1$) 또는 배경(예: $f_o(x) \approx 0$)에 속하는지에 대한 네트워크의 초기 "추측"을 나타냅니다. 이는 혈관의 거친 이진 스케치를 얻는 것과 같습니다.
2단계: SDF 정제 ("정밀 조각" 단계):
- 1단계의 점유 확률 $f_o(x)$는 SDF 정제기 네트워크 $f_r(\cdot; \theta_r)$로 전달됩니다. 중요한 것은 이 단계의 기울기가 첫 번째 단계의 매개변수(detach(fo(x;θo)))에서 분리된다는 것입니다. 이는 SDF 정제기가 점유 예측을 고정된 입력으로 사용하여 복잡한 기하학적 제약 조건이 초기 분할 작업에 영향을 미치지 않도록 합니다.
- 또 다른 3D U-Net인 SDF 정제기는 이 점유 정보를 받아 다중 해상도 처리를 통해 연속 부호화 거리 값 $f_{SDF}(x)$로 변환합니다. 이 값은 더 이상 확률이 아니라 실수입니다. $x$가 혈관 내부에 있으면 음수, 외부에 있으면 양수, 이상적으로는 정확히 혈관 표면에 있으면 0입니다. 이것이 거친 스케치가 정밀하고 연속적인 기하학적 표현으로 변환되는 곳입니다.
손실 계산 ("품질 관리" 단계):
- 이제 $f_o(x)$와 $f_{SDF}(x)$ 모두 해당 실제 값($y$는 점유, $f^*_{SDF}(x)$는 SDF)과 비교됩니다.
- $\mathcal{L}_{occ}$ 항은 $f_o(x)$가 실제 이진 레이블 $y$와 얼마나 잘 일치하는지 확인합니다.
- $\mathcal{L}_{sdf}$ 항은 $f_{SDF}(x)$와 실제 SDF $f^*_{SDF}(x)$ 간의 절대 차이를 측정합니다.
- $\mathcal{L}_{eik}$ 항은 $f_{SDF}(x)$의 기울기를 면밀히 조사하여 1에 가깝도록 보장하여 $f_{SDF}(x)$가 올바른 거리 필드처럼 작동하는지 확인합니다.
- $\mathcal{L}_{gauss}$ 항은 $f_{SDF}(x)$에 거리 가중 평활화 검사를 적용하여 표면 근처의 날카로운 세부 정보를 보존하면서 원거리 영역을 평활화하도록 보장합니다.
- 마지막으로 $\mathcal{L}_{sur}$ 항은 잠재적인 부유 인공물을 정리하기 위해 모호한 제로에 가까운 SDF 값을 페널티화합니다.
- 이러한 모든 개별 검사는 모델의 성능에 대한 단일 지표를 제공하는 총 손실 $\mathcal{L}$로 결합됩니다.
매개변수 업데이트 ("학습" 단계):
- 총 손실 $\mathcal{L}$을 기반으로 기울기가 계산되고 Adam 옵티마이저를 사용하여 두 U-Net의 매개변수($\theta_o$ 및 $\theta_r$)를 조정하는 데 사용됩니다. 이 반복적인 조정은 많은 입자와 에포크에 걸쳐 반복되어 전체 시스템이 학습하고 예측을 개선할 수 있도록 합니다.
최종 출력 ("재구성된 혈관"):
- 훈련 후, 추론을 위해 시스템은 새로운 CT 스캔 데이터를 가져오고, 모든 지점 $x$에 대해 예측된 $f_{SDF}(x)$를 출력합니다. 혈관 표면은 단순히 $f_{SDF}(x) = 0$인 모든 지점의 모음으로 정의됩니다. 그런 다음 이 제로 레벨 집합은 Marching Cubes와 같은 알고리즘을 사용하여 3D 메시로 변환되어 최종 고품질 재구성 혈관을 생성할 수 있습니다.

최적화 역학

VesselSDF 모델은 Adam 옵티마이저를 사용하여 총 손실 함수 $\mathcal{L}$을 반복적으로 최소화함으로써 학습하고 수렴합니다. 이 프로세스에는 다양한 손실 항에 의해 안내되는 기울기와 손실 지형 조각의 정교한 상호 작용이 포함됩니다.

기울기 동작:
- 각 훈련 반복 중에 Adam 옵티마이저는 총 손실 $\mathcal{L}$의 기울기를 모든 학습 가능한 매개변수($\theta_o$는 점유 U-Net용, $\theta_r$은 SDF 정제기 U-Net용)에 대해 계산합니다.
- 식 3의 detach 작업은 기울기 흐름의 중요한 측면입니다. 이는 SDF 관련 손실 항($\mathcal{L}_{sdf}$, $\mathcal{L}_{eik}$, $\mathcal{L}_{gauss}$, $\mathcal{L}_{sur}$)의 기울기가 초기 점유 예측 네트워크의 매개변수 $\theta_o$를 업데이트하도록 전파되지 않도록 합니다. 이 설계 선택은 초기 분할 작업을 분리하여 SDF의 더 복잡한 기하학적 제약 조건에 의해 방해받지 않고 안정적이고 신뢰할 수 있는 시작점을 제공합니다. $\mathcal{L}_{occ}$ 항만 $\theta_o$를 업데이트하는 데 기여합니다.
- 반대로, 모든 다섯 가지 손실 항이 $\theta_r$, 즉 SDF 정제기의 매개변수를 업데이트하는 데 기여합니다. 이는 SDF 정제기가 실제 SDF와 일치하도록 학습하고, 오일러 속성을 강제하고, 원거리 영역을 평활화하고, 부유 인공물을 억제하는 동시에 초기 점유 예측을 기반으로 한다는 것을 의미합니다.
손실 지형 조각: 마스터 방정식의 각 항은 특정 방식으로 다차원 손실 지형을 조각하여 최적화를 바람직한 솔루션으로 안내합니다.
- $\mathcal{L}_{sdf}$ (L1 손실): 이 항은 실제 SDF 값 주위에 "V자 모양"의 계곡을 생성합니다. 선형 페널티는 기울기 크기(정확한 최소값 제외)를 일정하게 유지하여 옵티마이저가 실제 SDF 값으로 효율적으로 이동하도록 돕습니다. 이상값에 대한 견고성은 가끔 노이즈가 있는 실제 레이블이 극도로 가파른 기울기로 지형을 크게 왜곡하지 않도록 합니다.
- $\mathcal{L}_{occ}$ (이진 교차 엔트로피): 점유 네트워크의 경우, 이 항은 잘못된 분류를 강력하게 페널티화하는 지형을 형성합니다. 이는 예측 확률을 배경의 경우 0, 혈관의 경우 1로 밀어내는 가파른 경사를 생성하여 모델이 명확하고 자신감 있는 이진 결정을 내리는 것이 "에너지적으로 유리"하도록 만듭니다.
- $\mathcal{L}_{eik}$ (오일러 정규화): 이는 강력한 기하학적 제약 조건입니다. 기울기 크기가 1에 가까운 예측을 선호하는 지형을 생성하여 이상적인 SDF 다양체(manifold)를 따라 "골짜기"를 형성합니다. 이 단위 기울기에서 벗어나는 것은 가파른 페널티를 초래하여 모델 예측을 실제 거리 함수의 속성에 맞추도록 효과적으로 "밀어냅니다". 이는 SDF가 비정상적으로 축소되거나 팽창하는 것을 방지합니다.
- $\mathcal{L}_{gauss}$ (거리 가중 가우시안 정규화): 이 항은 손실 지형에 적응형 평활화 효과를 도입합니다. 혈관 표면에서 멀리 떨어진 영역(여기서 $|f_{SDF}(x)|$가 큼)에서는 이 항이 더 부드럽고 평평한 지형을 생성하여 모델이 고주파 노이즈를 줄이도록 장려합니다. 그러나 혈관 표면 근처(여기서 $|f_{SDF}(x)| \approx 0$)에서는 영향력이 감소하여 지형이 날카로운 특징을 유지할 수 있도록 합니다. 이는 전역적인 부드러움을 지역적인 정밀도와 균형을 맞추는 영리한 방법입니다.
- $\mathcal{L}_{sur}$ (표면 정규화): 이 항의 지수적 특성은 $f_{SDF}(x) = 0$ 주위에 매우 가파른 "절벽"을 생성합니다. 모델이 약하고 지원되지 않는 표면(즉, $f_{SDF}(x)$가 0에 가깝지만 강력하게 확인되지 않음)을 예측하면 이 항이 강력한 기울기를 생성하여 $f_{SDF}(x)$를 0에서 멀리 밀어냅니다. 이는 모호한 표면 근처 예측을 하는 것이 매우 불리하도록 만들어 잘못된 부유 인공물을 효과적으로 "지웁니다".
반복적 상태 업데이트 및 수렴:
- Adam 옵티마이저는 각 매개변수에 대한 적응형 학습률을 사용하여 이 복잡한 손실 지형을 효율적으로 탐색합니다. 각 매개변수에 대한 단계 크기를 조정하기 위해 기울기의 첫 번째 및 두 번째 모멘트 추정치를 사용하여 관련 방향에서 더 빠른 수렴과 노이즈가 많거나 평평한 영역에서 더 느린 업데이트를 가능하게 합니다.
- 100 에포크에 걸쳐 모델은 매개변수를 반복적으로 업데이트합니다. 처음에는 예측이 거칠 수 있지만, 훈련이 진행됨에 따라 감독 항의 결합된 영향은 예측을 실제 값으로 끌어들이고, 정규화 항은 기하학을 정제하여 부드러움, 올바른 거리 필드 속성 및 인공물 억제를 보장합니다. 분리된 기울기 흐름을 갖춘 공동 훈련을 통해 모델은 먼저 강력한 점유 맵을 설정한 다음 이를 고품질의 연속적인 SDF로 세심하게 정제하여 정확하고 위상적으로 일관된 혈관 재구성을 가능하게 합니다. $5 \times 10^{-4}$의 학습률은 Adam에 대한 일반적인 선택으로, 속도와 안정성 간의 좋은 균형을 제공합니다.

Figure 1. Overview of VesselSDF, our two-stage approach for vessel segmentation and reconstruction from CT scans. In the first stage, a 3D U-Net predicts a binary occupancy map. The second stage refines this occupancy into a signed distance field (SDF) using an additional 3D U-Net, guided by geometric regularization terms. The output 3D SDF, converted into a mesh, contains high-quality reconstructed vessels

결과, 한계 및 결론

실험 설계 및 기준선

저자들은 혈관 네트워크 재구성을 위한 2단계 프레임워크인 VesselSDF의 효능을 검증하기 위해 신중하게 실험을 설계했습니다. 첫 번째 단계인 이진 점유 맵을 예측하는 단계에서는 멀티스케일 혈관 특징을 포착하기 위해 어텐션 게이트로 향상된 3D U-Net 아키텍처를 사용했습니다. 이 점유를 연속 부호화 거리 필드(SDF)로 정제하는 두 번째 단계에서는 2개의 인코더-디코더 레벨을 갖춘 더 가벼운 3D U-Net을 사용했습니다. 두 단계 모두 $5 \times 10^{-4}$의 학습률로 Adam 옵티마이저를 사용하여 100 에포크 동안 공동으로 훈련되었습니다. 특히, SDF 값의 정확성을 보존하기 위해 훈련 중에 데이터 증강은 적용되지 않았습니다. 훈련은 $512 \times 512 \times 16$ 크기의 전체 볼륨 입력과 배치 크기 16으로 수행되었습니다. 재구성 후, 최종 혈관 메쉬를 추출하기 위해 512 해상도로 Marching Cubes를 적용했습니다. 총 손실 함수 $\mathcal{L} = \lambda_s \mathcal{L}_{sdf} + \lambda_o \mathcal{L}_{occ} + \lambda_e \mathcal{L}_{eik} + \lambda_g \mathcal{L}_{gauss} + \lambda_{sur} \mathcal{L}_{sur}$는 여러 항을 포함했습니다. 감독 SDF 및 점유 손실, 부드러운 거리 전환을 위한 오일러 정규화, 적응형 평활화를 위한 거리 가중 가우시안 정규화, 부유 인공물을 억제하기 위한 표면 정규화입니다. 이러한 항의 가중치는 $\lambda_s = 0.1$, $\lambda_o = 0.01$, $\lambda_e = 0.01$, $\lambda_g = 0.1$, $\lambda_{sur} = 0.1$로 설정되었습니다.

이진 복셀 분류를 수행하는 세 가지 최첨단 체적 분할 아키텍처인 세 가지 상태-최신 아키텍처를 상대로 VesselSDF의 성능을 엄격하게 테스트했습니다.
1. 3D-UNet [5]: 의료 영상 분할에 널리 사용되는 기초적인 인코더-디코더 아키텍처입니다.
2. 3D SA-UNet [8]: 공간 어텐션 모듈을 통합한 3D-UNet의 확장으로, 특히 얇은 혈관에 유익한 특징 응답을 적응적으로 가중하도록 설계되었습니다.
3. nnU-Net [9]: 의료 영상 분할을 위한 견고한 결과를 달성하기 위해 저해상도 및 고해상도 처리를 위한 두 개의 U-Net을 사용하는 자체 구성 방법입니다.

VesselSDF의 성능은 두 개의 공개 간 혈관 분할 데이터셋에서 평가되었습니다.
- 간 혈관 데이터셋 (Medical Segmentation Decathlon - Task 08) [2]: 반자동 주석이 있는 간 정맥의 CT 스캔 303개를 포함합니다.
- IRCADb 데이터셋 [19]: 간 혈관 구조의 완전 수동 분할이 포함된 20개의 조영 증강 복부 CT 스캔을 포함합니다.
실제 SDF는 훈련을 위해 이진 실제에서 계산되었습니다.

수학적 주장을 확실하게 증명하기 위해 저자들은 3D 혈관 재구성을 위한 다섯 가지 포괄적인 지표를 사용했습니다.
- 체적 중첩: Dice 점수 및 Volume IoU (Intersection over Union).
- 위상 유사성: Jaccard 거리 (JD).
- 기하학적 정확도: Chamfer 거리 (CD) 및 Hausdorff 거리 (HD), 이는 각각 평균 및 최대 표면 거리를 측정합니다.

증거가 증명하는 것

표 1과 그림 2에 제시된 증거는 복잡한 혈관 네트워크의 기하학적 충실도와 연결성을 보존하는 데 있어 VesselSDF의 우수한 성능을 명백히 보여줍니다.

까다로운 간 혈관 데이터셋에서 VesselSDF는 모든 지표에서 모든 기준선 모델을 능가했습니다. 예를 들어, Dice 점수는 nnU-Net의 0.69에 비해 0.72였고, Chamfer 거리(값이 낮을수록 성능이 좋음)는 nnU-Net의 0.82보다 훨씬 나은 0.68이었습니다. 이는 VesselSDF의 핵심 메커니즘, 즉 연속 SDF 및 기하학적 정규화를 활용하는 것이 전통적인 이진 복셀 분류보다 더 정확한 체적 및 표면 재구성을 제공한다는 확실하고 부인할 수 없는 증거입니다.

IRCADb 데이터셋의 경우, VesselSDF는 체적 기반 지표(Dice, IoU, JD)에서 기준선과 유사한 성능을 달성하여 유사한 전반적인 분할 정확도를 나타냅니다. 그러나 표면 기반 지표(CD 및 HD)에서 기준선을 훨씬 능가했습니다. 예를 들어, VesselSDF의 CD는 0.60이었던 반면 nnU-Net은 0.75였고, HD는 3.5로 nnU-Net의 4.2와 비교되었습니다. 이는 전체 체적이 유사하더라도 VesselSDF가 훨씬 더 기하학적으로 정확하고 부드러운 혈관 표면을 생성한다는 것을 강조하며, 이는 임상 분석에 매우 중요합니다.

그림 2의 질적 결과는 이러한 결과를 더욱 강화합니다. 시각적 비교는 VesselSDF가 얇은 혈관과 복잡한 분기 패턴을 더 효과적으로 보존하여 더 완전하고 해부학적으로 일관된 재구성을 초래한다는 것을 명확하게 보여줍니다. 이 방법은 이진 복셀 분류 접근 방식에 문제를 일으키는 부유 기하학 및 분리된 구조와 같은 일반적인 인공물을 입증적으로 줄입니다.

표 2의 축소 연구는 VesselSDF의 각 구성 요소의 기여에 대한 중요한 통찰력을 제공합니다. SDF 정제 단계를 제거하면(w/o SDF refinement) Dice 점수가 0.72에서 0.69로 떨어지고 CD가 0.68에서 0.70으로 증가하여 두 번째 단계가 기하학적 정확성에 필수적임을 증명합니다. 초기 이진 점유 예측을 우회하고 SDF를 직접 예측하면(w/o Binary Occupancy) 성능이 훨씬 더 크게 저하되어(Dice 0.65, CD 0.75) 혈관 감지와 기하학적 정제 분리에서 2단계 접근 방식의 이점을 검증합니다. 마지막으로, 적응형 가우시안 정규화를 제거하면(w/o Gaussian Loss) 유사한 Dice 점수가 유지되지만 표면 인공물이 도입되어 중요한 혈관 가장자리의 과도한 평활화를 방지하는 데 있어 그 역할이 확인됩니다. 완전한 VesselSDF는 모든 지표에서 최고의 성능을 달성하며, 특히 개선된 재구성 메트릭에서 표시된 혈관 연속성을 향상시키는 SDF 정제입니다.

한계 및 향후 방향

VesselSDF는 특히 희소 CT 데이터에 대한 혈관 네트워크 재구성에서 상당한 발전을 제시하지만, 이 논문은 암묵적으로 추가 개발 영역을 지적합니다. 결론에서는 VesselSDF가 "부유 기하학 및 분리된 구조와 같은 문제가 적다"고 명시하여 이러한 과제가 완화되었지만 완전히 제거되지 않을 수 있음을 시사합니다. 간 혈관 및 희소 CT 슬라이스에 대한 초점은 또한 일반화에 잠재적인 한계가 있음을 시사합니다.

다음은 이러한 발견을 더욱 발전시키고 진화시키기 위한 논의 주제입니다.

해부학 및 양식 전반의 일반화: 현재 작업은 CT 스캔의 간 혈관에 초점을 맞춥니다. VesselSDF가 다른 복잡한 혈관 네트워크(예: 관상 동맥, 뇌 혈관, 신장 혈관)에 적용될 때 얼마나 견고한가? 이는 다른 기하학적 특성과 병리를 가질 수 있습니다. 또한, 다양한 해상도와 노이즈 프로파일을 가진 MRA 또는 CTA와 같은 다른 영상 양식에서는 어떻게 수행될까요? 다양한 데이터셋과 도메인 적응 기술을 통합하여 혈관 재구성을 위한 보다 일반화된 "기초 모델"을 개발할 수 있을까요?
계산 효율성 및 실시간 응용: SDF는 높은 기하학적 충실도를 제공하지만, 그 계산 및 재구성은 리소스 집약적일 수 있습니다. 실시간 수술 안내 또는 실시간 진단 지원과 같은 빠른 피드백이 필요한 임상 응용 분야의 경우 VesselSDF의 추론 속도가 병목 현상이 될 수 있습니다. 향후 연구에서는 보다 효율적인 신경 암시적 표현, 희소 SDF 기술 또는 최적화된 하드웨어 가속을 탐색하여 혈관 네트워크의 실시간 3D 재구성을 가능하게 할 수 있습니다.
고급 임상 워크플로우와의 통합: VesselSDF가 생성한 고품질 3D 혈관 모델은 보다 고급 임상 워크플로우에 어떻게 통합될 수 있습니까? 여기에는 혈류 역학 분석을 위한 혈류 시뮬레이션, 증강 현실 오버레이를 사용한 정밀 수술 계획 또는 환자별 장치 설계가 포함될 수 있습니다. 임상의가 이러한 연속적인 3D 표현과 상호 작용하고 분석할 수 있도록 하는 사용자 친화적인 인터페이스 및 도구를 개발하는 것이 중요할 것입니다.
병리학적 변형 및 이상에 대한 견고성: 사용된 데이터셋은 주로 일반적인 혈관 구조를 나타냅니다. 실제 임상 데이터는 종종 심각한 협착, 동맥류, 동정맥 기형 또는 종양 혈관 신생과 같은 혈관 형태를 크게 변경할 수 있는 상당한 병리학적 변형을 포함합니다. VesselSDF는 이러한 일반적인 해부학적 구조에서 벗어난 극단적인 편차에 얼마나 견고합니까? 향후 연구에서는 보다 다양한 병리학적 데이터셋을 통합하고, 특정 병리학적 특징에 민감한 손실 함수를 개발하거나, 이상 구조에 대한 견고성을 개선하기 위해 적대적 훈련을 탐색하는 데 초점을 맞출 수 있습니다.
재구성의 불확실성 정량화: 의료 영상에서 모델 예측의 신뢰도를 아는 것은 종종 예측 자체만큼 중요합니다. VesselSDF의 경우, 특히 희소성이나 노이즈가 많은 영역에서는 재구성된 SDF의 불확실성을 정량화하는 것이 임상의에게 귀중한 정보를 제공할 수 있습니다. 베이지안 신경망 또는 앙상블 방법을 탐색하여 SDF 예측의 불확실성을 추정하면 재구성의 임상 유용성과 신뢰성을 향상시킬 수 있습니다.
정적 3D를 넘어: 4D 재구성으로: 많은 혈관 병리는 혈관 맥동, 혈류 변화 또는 시간 경과에 따른 변형과 같은 동적 과정과 관련이 있습니다. VesselSDF는 동적 영상 시퀀스에서 4D(3D + 시간) 혈관 네트워크를 재구성하도록 확장될 수 있습니까? 이는 혈관 역학, 혈류 패턴 및 질병 진행을 보다 포괄적인 방식으로 연구할 수 있는 길을 열어줄 것입니다.

Table 1. Quantitative Results on the Hepatic Vessels and IRCADb datasets. Comparison of vessel reconstruction performance using different baselines. We report volume metrics (Dice Coefficient, Intersection over Union (IoU), and Jaccard similarity (JD)) and surface metrics (Chamfer distance (CD) ×100 and Hausdorff Distance (HD))

Table 2. Ablations on the Hepatic Vessels dataset

Figure 2. Qualitative 3D reconstruction results on the Hepatic Vessels dataset. The bottom row displays 2D slices highlighting the segmentation results