वेसलएसडीएफ: संवहनी नेटवर्क पुनर्निर्माण के लिए दूरी क्षेत्र पूर्वज्ञान (Distance Field Priors)
पृष्ठभूमि और अकादमिक वंश
उत्पत्ति और अकादमिक वंश
चिकित्सा इमेजिंग डेटा, विशेष रूप से विरल सीटी स्कैन स्लाइस से संवहनी नेटवर्क (vascular networks) का सटीक पुनर्निर्माण, नैदानिक निदान (clinical diagnostics) और सर्जिकल योजना (surgical planning) में लंबे समय से एक मौलिक चुनौती रही है। यह समस्या पहली बार तब उभरी और प्रमुखता प्राप्त की जब कंप्यूटेड टोमोग्राफी (CT) जैसी चिकित्सा इमेजिंग प्रौद्योगिकियां कोरोनरी धमनी रोग से लेकर ट्यूमर मूल्यांकन तक की स्थितियों के निदान के लिए अनिवार्य हो गईं। इन जटिल, वृक्ष-जैसी संरचनाओं को खंडित (segmenting) करने के शुरुआती दृष्टिकोण अक्सर पारंपरिक छवि प्रसंस्करण तकनीकों पर निर्भर करते थे। हालांकि, जैसे-जैसे सर्जिकल नेविगेशन, रक्त प्रवाह गतिशीलता विश्लेषण (blood flow dynamics analysis) और असामान्यताओं का शीघ्र पता लगाने के लिए वाहिकाओं के अधिक सटीक 3डी मॉडल की मांग बढ़ी, इन विधियों की सीमाएं तेजी से स्पष्ट हो गईं। डीप लर्निंग के आगमन ने चिकित्सा छवि विभाजन में महत्वपूर्ण प्रगति की, लेकिन यहां तक कि इन परिष्कृत मॉडलों को भी संवहनी नेटवर्क की अनूठी विशेषताओं के साथ संघर्ष करना पड़ा।
लेखकों को वेसलएसडीएफ (VesselSDF) विकसित करने के लिए मजबूर करने वाले मौलिक "दर्द बिंदु" पिछले दृष्टिकोणों की तीन महत्वपूर्ण सीमाओं से उत्पन्न होते हैं:
- खुरदरी सतह कलाकृतियाँ (Jagged Surface Artifacts): पारंपरिक बाइनरी वोक्सेल वर्गीकरण विधियाँ वाहिकाओं को असतत 3डी क्यूब्स के रूप में दर्शाती हैं। यह असतत प्रकृति अक्सर पुनर्निर्मित वाहिकाओं में खुरदरी, ब्लॉक जैसी सतहों की ओर ले जाती है, जो विशेष रूप से पतली वाहिकाओं के लिए समस्याग्रस्त होती है जहां सतह-से-आयतन अनुपात (surface-to-volume ratio) अधिक होता है। यह चिकनाई की कमी मॉडल को नैदानिक अनुप्रयोगों के लिए कम सटीक बनाती है।
- विषम विरूपण और विखंडन (Anisotropic Distortions and Fragmentation): चिकित्सा सीटी स्कैन में अक्सर प्रत्येक स्लाइस (इन-प्लेन, $\Delta x, \Delta y$) के भीतर स्लाइस (स्लाइस मोटाई, $\Delta z$) के बीच की दूरी की तुलना में बहुत अधिक रिज़ॉल्यूशन होता है। यह महत्वपूर्ण अंतर विषम विरूपण (anisotropic distortions) पैदा करता है, जिससे वाहिकाएं खंडित या डिस्कनेक्टेड दिखाई देती हैं, खासकर शाखा बिंदुओं पर या जहां वे तेजी से दिशा बदलती हैं।
- एसडीएफ में फ्लोटिंग कलाकृतियाँ (Floating Artifacts in SDFs): जबकि साइन्ड डिस्टेंस फील्ड (SDF) निरंतर सतहों का प्रतिनिधित्व करने का एक आशाजनक तरीका प्रदान करते हैं, मौजूदा एसडीएफ-आधारित विधियां अक्सर "फ्लोटिंग कलाकृतियाँ" उत्पन्न करती हैं - छोटी, डिस्कनेक्टेड सतह के टुकड़े जो पुनर्निर्माण में दिखाई देते हैं लेकिन वास्तविक संवहनी संरचनाओं के अनुरूप नहीं होते हैं, जिससे 3डी मॉडल की समग्र गुणवत्ता और विश्वसनीयता कम हो जाती है।
सहज डोमेन शब्द (Intuitive Domain Terms)
- साइन्ड डिस्टेंस फील्ड (SDF): कल्पना कीजिए कि आपके पास एक शहर का 3डी नक्शा है, और आप जानना चाहते हैं कि शहर में हर बिंदु निकटतम नदी से कितनी दूर है। एक एसडीएफ उस नक्शे की तरह है, लेकिन एक वाहिका के लिए। किसी भी बिंदु के लिए, यह आपको वाहिका की सतह से सबसे छोटी दूरी बताता है। यदि बिंदु वाहिका के अंदर है, तो दूरी ऋणात्मक है; यदि यह बाहर है, तो यह धनात्मक है; और यदि यह बिल्कुल सतह पर है, तो दूरी शून्य है। यह निरंतर प्रतिनिधित्व चिकनी आकृतियों को पकड़ने में मदद करता है।
- बाइनरी वोक्सेल वर्गीकरण (Binary Voxel Classification): एक 3डी छवि को छोटे लेगो ईंटों (वोक्सेल) से बना हुआ समझें। बाइनरी वोक्सेल वर्गीकरण प्रत्येक व्यक्तिगत लेगो ईंट के लिए यह तय करने जैसा है कि क्या यह एक वाहिका का हिस्सा है (आप इसे लाल रंग देते हैं) या वाहिका का हिस्सा नहीं है (आप इसे स्पष्ट छोड़ देते हैं)। यह प्रत्येक छोटी क्यूब के लिए एक साधारण "हाँ" या "नहीं" निर्णय है, जो ब्लॉक जैसी या खंडित परिणाम दे सकता है।
- विरल सीटी स्कैन स्लाइस (Sparse CT Scan Slices): कल्पना कीजिए कि आप केवल उसके तने और शाखाओं के कुछ बहुत पतले, व्यापक रूप से दूरी वाले क्रॉस-सेक्शन को देखकर एक जटिल पेड़ के पूर्ण 3डी आकार को समझने की कोशिश कर रहे हैं। एक विरल सीटी स्कैन समान है: आपको शरीर के सीमित "स्लाइस" मिलते हैं, और उनके बीच महत्वपूर्ण अंतराल होते हैं। इन कुछ, दूर के स्लाइस से निरंतर संरचनाओं जैसे रक्त वाहिकाओं का पुनर्निर्माण एक बड़ी चुनौती है।
- संरचनात्मक निरंतरता / ज्यामितीय निष्ठा (Structural Continuity / Geometric Fidelity): यह इस बात को संदर्भित करता है कि पुनर्निर्मित वाहिका अपने प्राकृतिक, अटूट प्रवाह और सटीक आकार को कितनी अच्छी तरह बनाए रखती है। यदि एक वाहिका एक निरंतर ट्यूब होनी चाहिए, तो "संरचनात्मक निरंतरता" का अर्थ है कि इसमें कोई अंतराल या ब्रेक नहीं है। "ज्यामितीय निष्ठा" का अर्थ है कि इसके वक्र, शाखाएं और व्यास वास्तविक वाहिका से सटीक रूप से मेल खाते हैं, बजाय इसके कि वे खुरदरी, विकृत या सरलीकृत हों।
- फ्लोटिंग कलाकृतियाँ (Floating Artifacts): एक मूर्तिकार की कल्पना करें जो एक विस्तृत मूर्ति को तराशने की कोशिश कर रहा है, लेकिन गलती से मुख्य मूर्ति के चारों ओर पत्थर के छोटे, अवांछित टुकड़े तैरते हुए छोड़ देता है। 3डी वाहिका पुनर्निर्माण में, फ्लोटिंग कलाकृतियाँ ज्यामिति के छोटे, डिस्कनेक्टेड टुकड़े होते हैं जो अंतिम मॉडल में दिखाई देते हैं लेकिन वास्तविक संवहनी नेटवर्क से संबंधित नहीं होते हैं। वे नकली तत्व हैं जो पुनर्निर्माण की गुणवत्ता और यथार्थवाद को कम करते हैं।
संकेतन तालिका (Notation Table)
| संकेतन (Notation) | विवरण (Description) |
|---|---|
| $V$ | इनपुट वॉल्यूमेट्रिक सीटी स्कैन |
| $D, H, W$ | सीटी स्कैन के आयाम (गहराई, ऊंचाई, चौड़ाई) |
| $\mathbf{x}$ | $\mathbb{R}^3$ में एक 3डी स्थानिक निर्देशांक |
| $f_{SDF}(\mathbf{x}; \theta_r)$ | $\mathbf{x}$ पर अनुमानित साइन्ड डिस्टेंस फील्ड (SDF), $\theta_r$ द्वारा पैरामीट्रिज्ड |
| $S$ | वाहिका सतह, $f_{SDF}$ के शून्य-स्तरीय सेट के रूप में परिभाषित |
| $f_o(\mathbf{x}; \theta_o)$ | $\mathbf{x}$ पर अनुमानित बाइनरी ऑक्यूपेंसी संभावना, $\theta_o$ द्वारा पैरामीट्रिज्ड |
| $f^*_{SDF}(\mathbf{x})$ | ग्राउंड-ट्रुथ SDF $\mathbf{x}$ पर |
| $y$ | $\mathbf{x}$ पर ऑक्यूपेंसी के लिए ग्राउंड-ट्रुथ बाइनरी लेबल (वाहक के लिए 1, पृष्ठभूमि के लिए 0) |
| $\mathcal{L}$ | कुल हानि फलन (Total loss function) |
| $\mathcal{L}_{sdf}$ | SDF पर्यवेक्षण हानि (L1 नॉर्म) |
| $\mathcal{L}_{occ}$ | ऑक्यूपेंसी पर्यवेक्षण हानि (बाइनरी क्रॉस-एंट्रॉपी) |
| $\mathcal{L}_{eik}$ | आइकोनल रेगुलराइज़ेशन हानि (Eikonal regularization loss) |
| $\mathcal{L}_{gauss}$ | दूरी-भारित गॉसियन रेगुलराइज़ेशन हानि (Distance-weighted Gaussian regularization loss) |
| $\mathcal{L}_{sur}$ | सतह रेगुलराइज़ेशन हानि (Surface regularization loss) |
| $\lambda_s, \lambda_o, \lambda_e, \lambda_g, \lambda_r$ | संबंधित हानि पदों के लिए भार (weights) |
| $\partial_x, \partial_y, \partial_z$ | x, y, z निर्देशांकों के संबंध में आंशिक डेरिवेटिव |
| $\gamma$ | आइकोनल हानि में z-आयाम ग्रेडिएंट के लिए विषम स्केलिंग कारक |
| $G_\sigma(\cdot)$ | मानक विचलन $\sigma$ के साथ 3डी गॉसियन ब्लर ऑपरेटर |
| $\beta$ | सतह रेगुलराइज़ेशन के लिए हाइपरपैरामीटर |
| $\Omega$ | 3डी प्रशिक्षण वॉल्यूम |
| $\theta_o$ | बाइनरी ऑक्यूपेंसी यू-नेट के पैरामीटर |
| $\theta_r$ | SDF रिफाइनर यू-नेट के पैरामीटर |
| $g_e, h_e$ | अटेंशन गेट्स में गेटिंग और स्किप-कनेक्शन फीचर मैप्स |
| $a_e$ | अटेंशन वेट्स |
| $\mathcal{A}(\cdot)$ | सीखा हुआ अटेंशन फलन |
| $W_g, W_h$ | अटेंशन गेट्स के लिए ट्रेनेबल वेट मैट्रिक्स |
समस्या परिभाषा और बाधाएँ
मुख्य समस्या सूत्रीकरण और दुविधा (Core Problem Formulation & The Dilemma)
इस पत्र द्वारा संबोधित मुख्य समस्या विरल चिकित्सा इमेजिंग डेटा, विशेष रूप से सीटी स्कैन स्लाइस से जटिल संवहनी नेटवर्क का सटीक और मजबूत 3डी पुनर्निर्माण है।
प्रस्तावित वेसलएसडीएफ फ्रेमवर्क के लिए शुरुआती बिंदु (इनपुट/वर्तमान स्थिति) एक वॉल्यूमेट्रिक सीटी स्कैन है, जिसे $V \in \mathbb{R}^{D \times H \times W}$ के रूप में दर्शाया गया है, जहाँ $D$ अक्षीय स्लाइस की संख्या को दर्शाता है, और $H, W$ इन-प्लेन आयाम हैं। यह इनपुट डेटा अपनी अंतर्निहित विरलता की विशेषता है, विशेष रूप से इमेजिंग प्लेन के बीच, और अक्सर विकिरण खुराक में कमी या समय की बाधाओं जैसे कारकों के कारण थ्रू-प्लेन रिज़ॉल्यूशन की कमी से ग्रस्त होता है।
वांछित अंतिम बिंदु (आउटपुट/लक्ष्य स्थिति) एक निरंतर साइन्ड डिस्टेंस फील्ड (SDF), $f_{SDF}(\mathbf{x}; \theta_r)$ है, जो अपने शून्य-स्तरीय सेट के रूप में वाहिका सतह को अप्रत्यक्ष रूप से परिभाषित करता है: $S := \{\mathbf{x} \in \mathbb{R}^3 \mid f_{SDF}(\mathbf{x}; \theta_r) = 0\}$। यह एसडीएफ उच्च-गुणवत्ता वाली पुनर्निर्मित वाहिकाओं को उत्पन्न करने में सक्षम होना चाहिए जो रक्त वाहिकाओं की चिकनी, ट्यूबलर ज्यामिति, उनके जटिल शाखा पैटर्न को सटीक रूप से कैप्चर करती हैं, और संरचनात्मक निरंतरता और ज्यामितीय निष्ठा बनाए रखती हैं। अंतिम लक्ष्य नैदानिक सेटिंग्स के लिए अधिक विश्वसनीय संवहनी विश्लेषण प्रदान करना है।
सटीक लुप्त कड़ी या गणितीय अंतर जिसे वेसलएसडीएफ पाटने का प्रयास करता है, वह वास्तव में सटीक और टोपोलॉजिकल रूप से सुसंगत निरंतर वाहिका सतह प्राप्त करने के लिए असतत, वोक्सेल-आधारित अभ्यावेदन और दोषपूर्ण निरंतर एसडीएफ विधियों से परे जाना है। पारंपरिक बाइनरी वोक्सेल वर्गीकरण दृष्टिकोण, हालांकि मौलिक हैं, स्वाभाविक रूप से खुरदरी सतह कलाकृतियाँ उत्पन्न करते हैं, जो विशेष रूप से पतली वाहिकाओं में स्पष्ट होती हैं। इसके अलावा, सीटी स्कैन में इन-प्लेन रिज़ॉल्यूशन ($\Delta x, \Delta y$) और स्लाइस मोटाई ($\Delta z$) के बीच महत्वपूर्ण विषमता महत्वपूर्ण शाखा बिंदुओं पर खंडित वाहिका संरचनाओं की ओर ले जाती है। जबकि साइन्ड डिस्टेंस फील्ड निरंतर सतह प्रतिनिधित्व के लिए एक आशाजनक दिशा प्रदान करते हैं, मौजूदा एसडीएफ-आधारित विधियां अक्सर अवांछनीय "फ्लोटिंग कलाकृतियाँ" उत्पन्न करती हैं - डिस्कनेक्टेड सतह के टुकड़े जो पुनर्निर्माण गुणवत्ता को गंभीर रूप से कम करते हैं। यह पत्र वाहिका विभाजन को एक निरंतर एसडीएफ प्रतिगमन समस्या के रूप में पुन: तैयार करता है, जो सीधे इन सीमाओं को संबोधित करता है, एक निरंतर प्रतिनिधित्व सीखकर जो स्वाभाविक रूप से वाहिका ज्यामिति और कनेक्टिविटी को कैप्चर करता है।
ऐतिहासिक रूप से शोधकर्ताओं को इस क्षेत्र में फंसाए रखने वाला दर्दनाक समझौता या दुविधा महीन वाहिका कनेक्टिविटी को संरक्षित करने और सटीक सीमाओं को बनाए रखने के बीच मौलिक तनाव है, खासकर पतली, वृक्ष-जैसी संरचनाओं के लिए। एक पहलू में सुधार अक्सर दूसरे से समझौता करता है। उदाहरण के लिए, निरंतरता सुनिश्चित करने के लिए आक्रामक स्मूथिंग से ओवर-स्मूथिंग और महीन विवरणों का नुकसान हो सकता है, जबकि सटीक सीमाओं पर ध्यान केंद्रित करने से खंडित या डिस्कनेक्टेड वाहिका खंड हो सकते हैं। पिछले डीप लर्निंग दृष्टिकोण, जो अक्सर बाइनरी वोक्सेल वर्गीकरण पर आधारित होते हैं, इस दुविधा से जूझते हैं, जिससे ऐसे मॉडल बनते हैं जो या तो संरचनात्मक सुसंगतता की कमी रखते हैं या विशिष्ट प्रशिक्षण डेटा से परे सामान्यीकरण करने में विफल रहते हैं, इसके बजाय सामान्यीकरण योग्य ज्यामितीय सिद्धांतों को सीखने के बजाय विन्यासों को याद करते हैं।
बाधाएँ और विफलता मोड (Constraints & Failure Modes)
सटीक संवहनी नेटवर्क पुनर्निर्माण की समस्या शोधकर्ताओं द्वारा सामना की जाने वाली कई कठोर, यथार्थवादी दीवारों के कारण अविश्वसनीय रूप से कठिन है:
-
भौतिक/ज्यामितीय बाधाएँ (Physical/Geometric Constraints):
- पतली, शाखाओं वाली संरचनाएँ (Thin, Branching Structures): रक्त वाहिकाओं में जटिल शाखाओं के पैटर्न और विभिन्न व्यास होते हैं, जो अक्सर बहुत पतले होते हैं। विरल डेटा से इन नाजुक, वृक्ष-जैसी संरचनाओं का सटीक पुनर्निर्माण एक महत्वपूर्ण चुनौती है।
- जटिल टोपोलॉजी (Complex Topology): संवहनी नेटवर्क की जटिल टोपोलॉजी, जिसमें कई द्विभाजन (bifurcations) और घुमावदार पथ होते हैं, संरचनात्मक सुसंगतता बनाए रखना और विखंडन को रोकना मुश्किल बनाते हैं, खासकर उन क्षेत्रों में जहां वाहिकाएं शाखाओं में बंटती हैं या तेजी से दिशा बदलती हैं।
- विषम रिज़ॉल्यूशन (Anisotropic Resolution): सीटी स्कैन में इन-प्लेन रिज़ॉल्यूशन और स्लाइस मोटाई के बीच महत्वपूर्ण अंतर विषम विरूपण पैदा करता है। इससे वाहिका संरचनाओं में असंतोष और विखंडन होता है, खासकर शाखा बिंदुओं पर, जिससे एक चिकनी, निरंतर सतह का पुनर्निर्माण करना मुश्किल हो जाता है।
-
कम्प्यूटेशनल बाधाएँ (Computational Constraints):
- डेटा विरलता (Data Sparsity): प्राथमिक इनपुट, विरल सीटी स्कैन स्लाइस, इमेजिंग प्लेन के बीच एक अंतर्निहित विरलता प्रस्तुत करता है। यह सीमित थ्रू-प्लेन रिज़ॉल्यूशन विकिरण खुराक को कम करने या नैदानिक सेटिंग्स में वास्तविक समय विलंबता आवश्यकताओं को पूरा करने के प्रयासों का सीधा परिणाम है, लेकिन यह 3डी पुनर्निर्माण के लिए उपलब्ध जानकारी को गंभीर रूप से सीमित करता है।
- उच्च रिज़ॉल्यूशन के लिए कम्प्यूटेशनल जटिलता (Computational Complexity for High Resolution): विरल 2डी स्लाइस से उच्च-रिज़ॉल्यूशन 3डी पुनर्निर्माण प्राप्त करने के लिए आम तौर पर घातीय रूप से अधिक कम्प्यूटेशनल संसाधनों की आवश्यकता होती है, जो मॉडल जटिलता और अनुमान गति पर एक व्यावहारिक सीमा प्रस्तुत करता है।
-
डेटा-संचालित बाधाएँ (Data-driven Constraints):
- एनोटेटेड डेटा की कमी (Scarcity of Annotated Data): उच्च-गुणवत्ता वाले चिकित्सा इमेजिंग डेटासेट की एक अंतर्निहित कमी है, विशेष रूप से पतली संवहनी संरचनाओं के लिए विस्तृत एनोटेशन वाले। यह डेटा कमी अक्सर मॉडल को मजबूत, सामान्यीकरण योग्य ज्यामितीय सिद्धांतों को सीखने के बजाय विशिष्ट वाहिका विन्यासों को याद करने की ओर ले जाती है।
- उच्च अंतर-विषय भिन्नता (High Inter-Subject Variation): संवहनी एनाटॉमी उच्च अंतर-विषय भिन्नता प्रदर्शित करती है, जिससे सीमित डेटासेट पर प्रशिक्षित मॉडल के लिए विभिन्न रोगियों और शारीरिक विविधताओं में प्रभावी ढंग से सामान्यीकरण करना चुनौतीपूर्ण हो जाता है।
विफलता मोड (Failure Modes) पिछले दृष्टिकोणों के जिन्हें वेसलएसडीएफ दूर करने का लक्ष्य रखता है, उनमें शामिल हैं:
* खुरदरी सतह कलाकृतियाँ (Jagged Surface Artifacts): वोक्सेल-आधारित अभ्यावेदन की असतत प्रकृति अनिवार्य रूप से सीढ़ी-जैसी या खुरदरी सतहों की ओर ले जाती है, जो विशेष रूप से पतली वाहिकाओं में ध्यान देने योग्य होती हैं जहां सतह-से-आयतन अनुपात अधिक होता है।
* खंडित और डिस्कनेक्टेड वाहिकाएँ (Fragmented and Disconnected Vessels): विरल डेटा और विषम रिज़ॉल्यूशन के कारण, पिछले तरीके अक्सर खंडित या शारीरिक रूप से असंभव पुनर्निर्माण उत्पन्न करते हैं, जिसमें वाहिकाएं डिस्कनेक्टेड या अधूरी दिखाई देती हैं। छोटी वाहिकाएं अक्सर अनडिटेक्टेड या खंडित होती हैं।
* फ्लोटिंग कलाकृतियाँ (Floating Artifacts): मौजूदा एसडीएफ-आधारित विधियां, निरंतर प्रतिनिधित्व की पेशकश करते हुए भी, अक्सर नकली "फ्लोटिंग" कलाकृतियाँ उत्पन्न करती हैं - डिस्कनेक्टेड सतह के टुकड़े जो वास्तविक संवहनी नेटवर्क का हिस्सा नहीं होते हैं, समग्र पुनर्निर्माण गुणवत्ता को कम करते हैं।
* सामान्यीकरण की कमी (Lack of Generalization): मॉडल सार्वभौमिक ज्यामितीय पूर्वज्ञान (universal geometric priors) सीखने के बजाय सीमित प्रशिक्षण डेटा से विशिष्ट पैटर्न याद करते हैं, जिससे अनदेखे डेटा या विभिन्न वाहिका विन्यासों पर खराब प्रदर्शन होता है।
यह दृष्टिकोण क्यों (Why This Approach)
चुनाव की अनिवार्यता (The Inevitability of the Choice)
वेसलएसडीएफ द्वारा सन्निहित निरंतर साइन्ड डिस्टेंस फील्ड (SDF) प्रतिगमन दृष्टिकोण को अपनाना संवहनी नेटवर्क पुनर्निर्माण के लिए पारंपरिक विधियों की अंतर्निहित सीमाओं को देखते हुए केवल एक सुधार नहीं था, बल्कि एक आवश्यक प्रतिमान बदलाव था। लेखकों ने विशेष रूप से मौजूदा डीप लर्निंग दृष्टिकोणों की महत्वपूर्ण कमियों का विवरण देकर इस अहसास के क्षण को स्पष्ट रूप से पहचाना है, विशेष रूप से बाइनरी वोक्सेल वर्गीकरण (जैसे, मानक सीएनएन जैसे यू-नेट वेरिएंट) पर आधारित।
ये पारंपरिक विधियाँ कई कारणों से मौलिक रूप से अपर्याप्त पाई गईं:
- असतत प्रतिनिधित्व कलाकृतियाँ (Discrete Representation Artifacts): बाइनरी वोक्सेल-आधारित अभ्यावेदन, अपनी प्रकृति से, खुरदरी, सीढ़ी-जैसी सतहें उत्पन्न करते हैं। यह विशेष रूप से पतली, जटिल संवहनी संरचनाओं के लिए समस्याग्रस्त है जहां सतह-से-आयतन अनुपात अधिक होता है, जिससे ज्यामितीय निष्ठा का महत्वपूर्ण नुकसान और शारीरिक रूप से असंभव पुनर्निर्माण होता है।
- विषम विरूपण और विखंडन (Anisotropic Distortion and Fragmentation): चिकित्सा इमेजिंग डेटा, विशेष रूप से विरल सीटी स्कैन स्लाइस, अक्सर इन-प्लेन रिज़ॉल्यूशन ($\Delta x, \Delta y$) और स्लाइस मोटाई ($\Delta z$) के बीच एक महत्वपूर्ण अंतर प्रदर्शित करता है। असतत विधियों को इन अंतरालों को पाटने में कठिनाई होती है, जिसके परिणामस्वरूप विषम विरूपण और खंडित वाहिका संरचनाएं होती हैं, खासकर महत्वपूर्ण शाखा बिंदुओं पर। इससे असंतोष और महत्वपूर्ण ज्यामितीय विशेषताओं का नुकसान होता है।
- संरचनात्मक सुसंगतता और सामान्यीकरण की कमी (Lack of Structural Coherence and Generalization): मौजूदा डीप लर्निंग मॉडल, शक्तिशाली होने के बावजूद, अक्सर जटिल संवहनी टोपोलॉजी में संरचनात्मक सुसंगतता बनाए रखने में विफल रहते हैं। वे सीमित प्रशिक्षण डेटा से विशिष्ट वाहिका विन्यासों को याद करते हैं बजाय सामान्यीकरण योग्य ज्यामितीय सिद्धांतों को सीखने के, जिससे वे अनदेखे डेटा में खंडित या डिस्कनेक्टेड वाहिकाओं का उत्पादन करने की संभावना रखते हैं।
- भोले एसडीएफ में फ्लोटिंग कलाकृतियाँ (Floating Artifacts in Naive SDFs): जबकि एसडीएफ एक आशाजनक निरंतर प्रतिनिधित्व प्रदान करते हैं, यहां तक कि मौजूदा एसडीएफ-आधारित विधियां भी "फ्लोटिंग कलाकृतियाँ" उत्पन्न कर सकती हैं - डिस्कनेक्टेड सतह के टुकड़े जो पुनर्निर्माण गुणवत्ता को कम करते हैं। इसका मतलब था कि एसडीएफ पर एक साधारण स्विच पर्याप्त नहीं था; एक अधिक मजबूत, कलाकृति-जागरूक दृष्टिकोण की आवश्यकता थी।
एसडीएफ की निरंतर प्रकृति, जो स्वाभाविक रूप से सतहों को सुचारू रूप से दर्शाती है और सुसंगत स्थानिक संबंधों को कैप्चर करती है, इन गहरी समस्याओं को दूर करने के लिए एकमात्र व्यवहार्य समाधान के रूप में उभरी, जिन्हें असतत अभ्यावेदन बस हल नहीं कर सकते। विरल डेटा से नाजुक, शाखाओं वाली संरचनाओं के चिकने, निरंतर और टोपोलॉजिकल रूप से सुसंगत पुनर्निर्माण की समस्या की मांगों ने एक निरंतर ज्यामितीय प्रतिगमन ढांचे में जाने को अनिवार्य बना दिया।
तुलनात्मक श्रेष्ठता (Comparative Superiority)
वेसलएसडीएफ, अपने संरचनात्मक डिजाइन और नवीन रेगुलराइज़ेशन तकनीकों के माध्यम से, प्रदर्शन मेट्रिक्स से कहीं अधिक गुणात्मक श्रेष्ठता प्रदर्शित करता है। इसके फायदे इस बात से उत्पन्न होते हैं कि यह एसडीएफ के अंतर्निहित गुणों का लाभ कैसे उठाता है, जबकि सावधानीपूर्वक उनके सामान्य नुकसानों को संबोधित करता है:
- अंतर्निहित चिकनाई और ज्यामितीय निष्ठा (Inherent Smoothness and Geometric Fidelity): असतत वोक्सेल अभ्यावेदन के विपरीत, एसडीएफ स्वाभाविक रूप से चिकनी, निरंतर सतहों को एन्कोड करते हैं। वेसलएसडीएफ इसे वाहिका विभाजन को एक निरंतर एसडीएफ प्रतिगमन समस्या के रूप में पुन: तैयार करके पूंजीकृत करता है। यह इसे रक्त वाहिकाओं की चिकनी, ट्यूबलर ज्यामिति और उनके जटिल शाखा पैटर्न को स्वाभाविक रूप से कैप्चर करने की अनुमति देता है, जिससे बेहतर ज्यामितीय निष्ठा और संरचनात्मक सुसंगतता वाले पुनर्निर्माण प्राप्त होते हैं।
- अनुकूली शोर प्रबंधन और विवरण संरक्षण (Adaptive Noise Handling and Detail Preservation): एक प्रमुख संरचनात्मक लाभ नवीन दूरी-भारित गॉसियन रेगुलराइज़र (समीकरण 8) है। यह तंत्र अनुकूली रूप से स्मूथनेस को लागू करता है: यह वाहिका सतह से दूर के क्षेत्रों में एसडीएफ को आक्रामक रूप से धुंधला और चिकना करता है (जहां $|f_{SDF}(\mathbf{x})|$ बड़ा है और शोर अधिक प्रचलित है), प्रभावी ढंग से उच्च-आयामी शोर को संभालता है। महत्वपूर्ण रूप से, यह सतह की सीमाओं के पास महीन वाहिका विवरणों को संरक्षित करता है (जहां $|f_{SDF}(\mathbf{x})| \approx 0$), महत्वपूर्ण शारीरिक विशेषताओं के ओवर-स्मूथिंग को रोकता है। यह उन विधियों पर एक महत्वपूर्ण गुणात्मक छलांग है जो समान रेगुलराइज़ेशन लागू करती हैं।
- ज्यामितीय पूर्वज्ञान के माध्यम से बढ़ी हुई सामान्यीकरण (Enhanced Generalization through Geometric Priors): असतत वर्गीकरण के बजाय निरंतर ज्यामितीय प्रतिगमन के रूप में समस्या को फ्रेम करके, वेसलएसडीएफ अंतर्निहित आकार सिद्धांतों को सीखता है जो अधिक सार्वभौमिक हैं। दूरी-भारित रेगुलराइज़ेशन वाहिका निरंतरता से संबंधित सामान्य ज्यामितीय पूर्वज्ञान को एन्कोड करके इसे और मजबूत करता है, बजाय विशिष्ट पैटर्न को याद करने के। यह मॉडल को विभिन्न वाहिका विन्यासों और शारीरिक विविधताओं में ज्ञान को अधिक प्रभावी ढंग से स्थानांतरित करने की अनुमति देता है।
- मजबूत कलाकृति उन्मूलन (Robust Artifact Elimination): अनुकूली गॉसियन रेगुलराइज़र और सतह रेगुलराइज़ेशन शब्द (समीकरण 9) का संयोजन फ्लोटिंग सेगमेंट जैसी सामान्य एसडीएफ कलाकृतियों को खत्म करने के लिए एक मजबूत तंत्र प्रदान करता है। सतह रेगुलराइज़ेशन विशेष रूप से वास्तविक सतह के मजबूत सबूत के बिना शून्य-करीब एसडीएफ मानों को दंडित करता है, प्रभावी ढंग से नकली या कमजोर सीमाओं को दबाता है जो अन्यथा डिस्कनेक्टेड टुकड़ों के रूप में दिखाई दे सकते हैं।
- अलग दो-चरणीय शोधन (Decoupled Two-Stage Refinement): प्रारंभिक बाइनरी ऑक्यूपेंसी भविष्यवाणी को बाद के एसडीएफ शोधन से अलग करने वाला दो-चरणीय आर्किटेक्चर एक संरचनात्मक लाभ है। प्रारंभिक यू-नेट एक विश्वसनीय प्रारंभिक बिंदु प्रदान करता है, और दूसरा चरण, एक अतिरिक्त 3डी यू-नेट, ज्यामितीय रेगुलराइज़ेशन द्वारा निर्देशित इस प्रारंभिक बिंदु को सही ढंग से स्केल किए गए एसडीएफ में परिष्कृत करने पर पूरी तरह से ध्यान केंद्रित करता है। यह अलगाव प्रत्येक चरण को उसके विशिष्ट कार्य के लिए अनुकूलित करने की अनुमति देता है, जिससे अधिक मजबूत और सटीक अंतिम पुनर्निर्माण होता है।
बाधाओं के साथ संरेखण (Alignment with Constraints)
वेसलएसडीएफ का डिजाइन विरल सीटी डेटा से संवहनी नेटवर्क पुनर्निर्माण की कठोर आवश्यकताओं के साथ पूरी तरह से संरेखित होता है, जो समस्या और समाधान के बीच एक "विवाह" बनाता है:
- बाधा: विरल सीटी स्कैन स्लाइस और असंतोष (Constraint: Sparse CT Scan Slices & Discontinuities): समस्या सीमित थ्रू-प्लेन रिज़ॉल्यूशन की विशेषता है, जिससे असंतोष होता है।
- संरेखण: वेसलएसडीएफ का निरंतर एसडीएफ प्रतिनिधित्व स्वाभाविक रूप से विरल स्लाइस के बीच इंटरपोलेट करता है। वॉल्यूम में प्रत्येक बिंदु को निकटतम वाहिका सतह से उसकी हस्ताक्षरित दूरी द्वारा दर्शाकर, यह एक चिकनी, निरंतर सतह बनाता है जो अंतराल को पाटती है, विरलता के कारण होने वाले विखंडन को दूर करती है। एसडीएफ प्रतिनिधित्व "दूरी-क्षेत्र गुणों के माध्यम से पड़ोसी भविष्यवाणियों को स्वाभाविक रूप से जोड़ता है" (पृष्ठ 5), स्लाइस में स्थिरता सुनिश्चित करता है।
- बाधा: पतली, शाखाओं वाली वाहिकाएँ और खुरदरी कलाकृतियाँ (Constraint: Thin, Branching Vessels & Jagged Artifacts): नाजुक, वृक्ष-जैसी संरचनाएं वोक्सेल के साथ खुरदरीपन के प्रति संवेदनशील होती हैं।
- संरेखण: चिकनी, ट्यूबलर ज्यामिति स्वाभाविक रूप से निरंतर एसडीएफ द्वारा कैप्चर की जाती है। यह वोक्सेल-आधारित विधियों की अंतर्निहित खुरदरी कलाकृतियों को समाप्त करता है, जिससे महीन वाहिकाओं और जटिल शाखा पैटर्न का अधिक सटीक और शारीरिक रूप से प्रशंसनीय प्रतिनिधित्व प्राप्त होता है।
- बाधा: संरचनात्मक निरंतरता और ज्यामितीय निष्ठा बनाए रखना (Constraint: Maintaining Structural Continuity & Geometric Fidelity): वाहिकाओं को जुड़े रहने और ज्यामितीय रूप से सटीक बने रहने को सुनिश्चित करना सर्वोपरि है।
- संरेखण: आइकोनल रेगुलराइज़ेशन (समीकरण 7) ग्रेडिएंट्स के लगभग इकाई होने को लागू करके चिकनी दूरी संक्रमण को प्रोत्साहित करता है, जिससे ज्यामितीय कलाकृतियों को जन्म देने वाले बड़े विचलन को रोका जा सके। इसके अलावा, दूरी-भारित गॉसियन रेगुलराइज़र समग्र चिकनाई बनाए रखते हुए वाहिका सतहों के पास सटीक ज्यामिति सुनिश्चित करता है, सीधे निरंतरता और निष्ठा दोनों को संबोधित करता है।
- बाधा: प्रशिक्षण डेटा से परे सामान्यीकरण (Constraint: Generalization Beyond Training Data): एनोटेटेड डेटा की कमी मॉडल को विशिष्ट पैटर्न याद करने की ओर ले जाती है।
- संरेखण: कार्य को निरंतर ज्यामितीय प्रतिगमन के रूप में पुन: तैयार करके, वेसलएसडीएफ विशिष्ट वोक्सेल पैटर्न के बजाय अंतर्निहित आकार सिद्धांतों को सीखता है। दूरी-भारित रेगुलराइज़ेशन वाहिका निरंतरता से संबंधित सार्वभौमिक ज्यामितीय पूर्वज्ञान को एन्कोड करके इसे और बढ़ाता है, जिससे विभिन्न वाहिका विन्यासों और शारीरिक विविधताओं में मॉडल की सामान्यीकरण करने की क्षमता में सुधार होता है।
- बाधा: फ्लोटिंग कलाकृतियों को समाप्त करना (Constraint: Eliminating Floating Artifacts): मौजूदा एसडीएफ विधियों के साथ भी एक सामान्य मुद्दा।
- संरेखण: अनुकूली गॉसियन रेगुलराइज़र और सतह रेगुलराइज़ेशन शब्द (समीकरण 9) विशेष रूप से इसे संबोधित करने के लिए डिज़ाइन किए गए हैं। गॉसियन रेगुलराइज़र वाहिका सतह से दूर के क्षेत्रों में चिकनाई सुनिश्चित करता है, जबकि सतह रेगुलराइज़ेशन कमजोर, शोर वाली सीमाओं को दबाता है जो अन्यथा नकली, डिस्कनेक्टेड वाहिका घटकों का निर्माण कर सकती हैं।
विकल्पों का अस्वीकरण (Rejection of Alternatives)
पत्र स्पष्ट रूप से पारंपरिक और यहां तक कि कुछ समकालीन दृष्टिकोणों को अस्वीकार करने के कारणों को बताता है, मुख्य रूप से असतत वोक्सेल वर्गीकरण विधियों की सीमाओं और एसडीएफ-आधारित तकनीकों में मजबूत रेगुलराइज़ेशन की आवश्यकता पर ध्यान केंद्रित करता है।
लोकप्रिय दृष्टिकोणों जैसे मानक सीएनएन (जैसे, 3डी यू-नेट [5], 3डी एसए-यूनेट [8], एनएनयू-नेट [9]) के खिलाफ मुख्य तर्क निरंतर, चिकनी सतहों का प्रतिनिधित्व करने और विषम डेटा को प्रभावी ढंग से संभालने में उनकी अंतर्निहित अक्षमता है। जैसा कि कहा गया है, "बाइनरी वोक्सेल वर्गीकरण पर आधारित मौजूदा डीप लर्निंग दृष्टिकोण, अक्सर संरचनात्मक निरंतरता और ज्यामितीय निष्ठा के साथ संघर्ष करते हैं।" (सार)। विशेष रूप से, ये विधियाँ:
- खुरदरी सतह कलाकृतियाँ उत्पन्न करती हैं: वोक्सेल की असतत प्रकृति अनिवार्य रूप से "खुरदरी सतह कलाकृतियाँ" उत्पन्न करती है, जो विशेष रूप से पतली वाहिकाओं में स्पष्ट होती हैं जहां सतह-से-आयतन अनुपात अधिक होता है।" (पृष्ठ 4)।
- विषम विरूपण से ग्रस्त हैं: इमेजिंग प्लेन ($\Delta x, \Delta y$ बनाम $\Delta z$) के बीच रिज़ॉल्यूशन में महत्वपूर्ण अंतर "विषम विरूपण का कारण बनता है जो वाहिका संरचनाओं को खंडित करता है, खासकर शाखा बिंदुओं पर।" (पृष्ठ 4)।
- संरचनात्मक सुसंगतता के साथ संघर्ष करते हैं: वे अक्सर "खंडित या शारीरिक रूप से असंभव पुनर्निर्माण" (पृष्ठ 2) का परिणाम देते हैं, संवहनी नेटवर्क की नाजुक कनेक्टिविटी को बनाए रखने में विफल रहते हैं।
जबकि पत्र अन्य अंतर्निहित तंत्रिका अभ्यावेदन (implicit neural representations) और एसडीएफ-आधारित विधियों (जैसे, [1, 3, 11, 21]) के उद्भव को स्वीकार करता है, यह वेसलएसडीएफ के अद्वितीय योगदानों को उजागर करके उनकी अपर्याप्तता का अर्थ बताता है। लेखकों का कहना है, "मौजूदा एसडीएफ-आधारित विधियां अक्सर फ्लोटिंग कलाकृतियाँ उत्पन्न करती हैं, यानी, डिस्कनेक्टेड सतह के टुकड़े जो पुनर्निर्माण गुणवत्ता को कम करते हैं।" (पृष्ठ 4)। यह बताता है कि वेसलएसडीएफ की विशिष्ट अनुकूली गॉसियन रेगुलराइज़ेशन और सतह रेगुलराइज़ेशन तकनीकों के बिना, अन्य एसडीएफ दृष्टिकोण भी चुनौतीपूर्ण संवहनी डेटा के लिए आवश्यक मजबूती और कलाकृति दमन का स्तर प्रदान करने में विफल होंगे। पत्र इस विशेष कार्य के लिए अन्य लोकप्रिय डीप लर्निंग प्रतिमानों जैसे जनरेटिव एडवरसैरियल नेटवर्क (GANs) या डिफ्यूजन मॉडल की विशिष्ट विफलताओं में विस्तार से नहीं बताता है, लेकिन असतत अभ्यावेदन की सामान्य आलोचना व्यापक रूप से ऐसे कई तरीकों पर लागू होती है यदि वे वोक्सेल-आधारित आउटपुट पर निर्भर करते हैं।
गणितीय और तार्किक तंत्र (Mathematical & Logical Mechanism)
मास्टर समीकरण (The Master Equation)
वेसलएसडीएफ फ्रेमवर्क के मूल में एक व्यापक हानि फलन (loss function) है जो इसके दो चरणों में सीखने की प्रक्रिया को व्यवस्थित करता है। यह मास्टर समीकरण, जिसे लेखक प्रशिक्षण के दौरान कम करने का लक्ष्य रखते हैं, पर्यवेक्षित सीखने के उद्देश्यों को कई ज्यामितीय रेगुलराइज़ेशन शब्दों के साथ सुरुचिपूर्ण ढंग से जोड़ता है। यह मॉडल की चिकनी, निरंतर और टोपोलॉजिकल रूप से सटीक संवहनी नेटवर्क को पुनर्निर्मित करने की क्षमता को चलाने वाला केंद्रीय गणितीय इंजन है।
कुल हानि $\mathcal{L}$ को इस प्रकार परिभाषित किया गया है:
$$ \mathcal{L} = \lambda_s \mathcal{L}_{sdf} + \lambda_o \mathcal{L}_{occ} + \lambda_e \mathcal{L}_{eik} + \lambda_g \mathcal{L}_{gauss} + \lambda_r \mathcal{L}_{sur} $$
यह समीकरण पांच अलग-अलग हानि घटकों का भारित योग है, जिनमें से प्रत्येक अंतिम वाहिका पुनर्निर्माण की गुणवत्ता सुनिश्चित करने और अनुमानित साइन्ड डिस्टेंस फील्ड (SDF) को आकार देने में एक महत्वपूर्ण भूमिका निभाता है।
पद-दर-पद विश्लेषण (Term-by-Term Autopsy)
आइए मास्टर समीकरण के प्रत्येक घटक को उसके व्यक्तिगत योगदान और उसके समावेश के पीछे के तर्क को समझने के लिए विच्छेदित करें।
-
$\mathcal{L}$ (कुल हानि - Total Loss): यह समग्र उद्देश्य फलन है जिसे वेसलएसडीएफ मॉडल कम करने का प्रयास करता है। इसका मान दर्शाता है कि मॉडल की भविष्यवाणियां ग्राउंड-ट्रुथ के साथ कितनी अच्छी तरह संरेखित होती हैं और लगाए गए ज्यामितीय बाधाओं को कितनी अच्छी तरह संतुष्ट करती हैं। अनुकूलन प्रक्रिया का लक्ष्य उन मॉडल मापदंडों को खोजना है जो सबसे कम संभव $\mathcal{L}$ प्रदान करते हैं।
-
$\lambda_s, \lambda_o, \lambda_e, \lambda_g, \lambda_r$ (हानि भार - Loss Weights): ये स्केलर हाइपरपैरामीटर हैं जो प्रत्येक व्यक्तिगत हानि पद के सापेक्ष महत्व को निर्धारित करते हैं। उदाहरण के लिए, लेखकों ने अपने प्रयोगों में $\lambda_s = 0.1$, $\lambda_o = 0.01$, $\lambda_e = 0.01$, $\lambda_g = 0.1$, और $\lambda_r = 0.1$ निर्धारित किया। इन भारों को समायोजित करके, कोई प्रत्यक्ष पर्यवेक्षण और ज्यामितीय रेगुलराइज़ेशन के बीच संतुलन को ठीक कर सकता है, जो दूसरों पर कुछ पहलुओं पर जोर देता है। यहाँ जोड़ का विकल्प एक बहु-कार्य सीखने की सेटिंग में कई उद्देश्यों को संयोजित करने के लिए मानक है, जिससे प्रत्येक पद समग्र ग्रेडिएंट में स्वतंत्र रूप से योगदान कर सके।
-
$\mathcal{L}_{sdf}$ (एसडीएफ पर्यवेक्षण हानि - SDF Supervision Loss):
$$ \mathcal{L}_{sdf} = E_{x \in \Omega} |f_{SDF}(x) - f^*_{SDF}(x)| $$- गणितीय परिभाषा: यह पद 3डी स्थानिक निर्देशांक $x$ पर अनुमानित साइन्ड डिस्टेंस फील्ड $f_{SDF}(x)$ और संबंधित ग्राउंड-ट्रुथ SDF $f^*_{SDF}(x)$ के बीच L1 निरपेक्ष अंतर की गणना करता है। अपेक्षा $E_{x \in \Omega}$ का अर्थ है कि यह अंतर 3डी प्रशिक्षण वॉल्यूम $\Omega$ के भीतर सभी नमूना बिंदुओं $x$ पर औसत किया जाता है।
- भौतिक/तार्किक भूमिका: यह एसडीएफ शोधन चरण के लिए एक प्रत्यक्ष पर्यवेक्षण पद है। यह मॉडल को वास्तविक हस्ताक्षरित दूरी मानों को सीखने के लिए मजबूर करता है, यह सुनिश्चित करता है कि अनुमानित सतह (जहां $f_{SDF}(x) = 0$) ग्राउंड-ट्रुथ वाहिका सीमाओं से सटीक रूप से मेल खाती है। L1 नॉर्म (निरपेक्ष अंतर) को अक्सर L2 (वर्ग अंतर) की तुलना में प्रतिगमन कार्यों में पसंद किया जाता है जब संभावित आउटलायर्स से निपटना हो या जब त्रुटियों के लिए एक मजबूत दंड वांछित हो, क्योंकि यह बड़े त्रुटियों के प्रति कम संवेदनशील होता है। यह त्रुटियों में विरलता को प्रोत्साहित करता है।
- L1 क्यों? L1 नॉर्म त्रुटियों के लिए एक रैखिक दंड प्रदान करता है, जिससे यह L2 नॉर्म की तुलना में आउटलायर्स के प्रति अधिक मजबूत होता है, जो त्रुटियों को वर्ग करता है और बड़े विचलन से बहुत अधिक प्रभावित हो सकता है। यह मॉडल को शोर वाले ग्राउंड-ट्रुथ एसडीएफ मानों से अत्यधिक प्रभावित होने से रोकने में मदद करता है।
-
$\mathcal{L}_{occ}$ (ऑक्यूपेंसी पर्यवेक्षण हानि - Occupancy Supervision Loss):
$$ \mathcal{L}_{occ} = -E_{x \in \Omega} [y \log(f_o(x)) + (1 - y) \log(1 - f_o(x))] $$- गणितीय परिभाषा: यह बाइनरी क्रॉस-एंट्रॉपी हानि है। यहाँ, $y \in \{0, 1\}$ बिंदु $x$ के लिए बाइनरी ग्राउंड-ट्रुथ लेबल है (वाहक के लिए 1, पृष्ठभूमि के लिए 0), और $f_o(x)$ अनुमानित ऑक्यूपेंसी संभावना है कि बिंदु $x$ एक वाहिका से संबंधित है।
- भौतिक/तार्किक भूमिका: यह पद नेटवर्क के पहले चरण, बाइनरी ऑक्यूपेंसी भविष्यवक्ता को पर्यवेक्षित करता है। यह मॉडल को प्रत्येक वोक्सेल को वाहिका से संबंधित या नहीं के रूप में सही ढंग से वर्गीकृत करने के लिए प्रोत्साहित करता है। इस हानि को कम करके, मॉडल वाहिका वोक्सेल के लिए उच्च संभावनाओं और पृष्ठभूमि वोक्सेल के लिए कम संभावनाओं को आउटपुट करना सीखता है।
- बाइनरी क्रॉस-एंट्रॉपी क्यों? BCE बाइनरी वर्गीकरण समस्याओं के लिए मानक हानि फलन है। यह अनुमानित संभाव्यता वितरण और वास्तविक बाइनरी वितरण के बीच असमानता को प्रभावी ढंग से मापता है, मॉडल की भविष्यवाणियों को सही लेबल की ओर धकेलता है।
-
$\mathcal{L}_{eik}$ (आइकोनल रेगुलराइज़ेशन हानि - Eikonal Regularization Loss):
$$ \mathcal{L}_{eik} = E_{x \in \Omega} [(\partial_x f_{SDF}(x))^2 + (\partial_y f_{SDF}(x))^2 + (\gamma \partial_z f_{SDF}(x))^2 - 1]^2 $$- गणितीय परिभाषा: यह पद आदर्श आइकोनल समीकरण से विचलन को दंडित करता है, जो कहता है कि एक वास्तविक एसडीएफ के ग्रेडिएंट परिमाण लगभग हर जगह 1 होना चाहिए। यह अनुमानित एसडीएफ के वर्ग ग्रेडिएंट परिमाण और 1 के बीच वर्ग अंतर की गणना करता है। $\partial_x, \partial_y, \partial_z$ x, y, और z निर्देशांकों के संबंध में आंशिक डेरिवेटिव का प्रतिनिधित्व करते हैं। $\gamma = \frac{\Delta x}{\Delta z}$ एक विषम स्केलिंग कारक है जो अक्षीय (z) आयाम के साथ वोक्सेल रिक्ति में संभावित अंतरों को ध्यान में रखता है, जो इन-प्लेन (x, y) आयामों की तुलना में होता है।
- भौतिक/तार्किक भूमिका: यह एक महत्वपूर्ण ज्यामितीय रेगुलराइज़ेशन पद है। यह लागू करता है कि अनुमानित $f_{SDF}(x)$ एक वास्तविक दूरी फ़ंक्शन की तरह व्यवहार करता है, जहां सतह से दूर जाने पर दूरी समान रूप से बदलती है। यह एसडीएफ को बहुत अधिक खड़ी या बहुत सपाट होने से रोकता है, जिससे चिकनी दूरी संक्रमण सुनिश्चित होता है और ज्यामितीय कलाकृतियों जैसे "ढह गई" या "सूजी हुई" सतहों को रोका जा सके। विषम स्केलिंग $\gamma$ चिकित्सा छवियों में गैर-समान वोक्सेल रिज़ॉल्यूशन के सामान्य मुद्दे को संभालने के लिए एक चतुर स्पर्श है।
- 1 से वर्ग अंतर क्यों? एक वास्तविक साइन्ड डिस्टेंस फ़ंक्शन की एक मौलिक संपत्ति यह है कि उसका ग्रेडिएंट परिमाण 1 होता है। 1 से वर्ग अंतर को दंडित करके, हानि मॉडल को इस संपत्ति को सीखने के लिए प्रोत्साहित करती है, जिससे एसडीएफ ज्यामितीय रूप से सुसंगत हो जाता है।
-
$\mathcal{L}_{gauss}$ (दूरी-भारित गॉसियन रेगुलराइज़ेशन हानि - Distance-weighted Gaussian Regularization Loss):
$$ \mathcal{L}_{gauss} = E_{x \in \Omega} |f_{SDF}(x)| \cdot ||f_{SDF}(x) - G_\sigma(f_{SDF}(x))||_2^2 $$- गणितीय परिभाषा: यह पद एक दूरी-भारित स्मूथिंग बाधा लागू करता है। यह अनुमानित एसडीएफ $f_{SDF}(x)$ और इसके गॉसियन-ब्लर संस्करण $G_\sigma(f_{SDF}(x))$ के बीच अंतर के वर्ग L2 नॉर्म की गणना करता है, जहां $G_\sigma$ मानक विचलन $\sigma$ के साथ एक 3डी गॉसियन ब्लर ऑपरेटर है। इस अंतर को फिर अनुमानित एसडीएफ के निरपेक्ष मान, $|f_{SDF}(x)|$ से भारित किया जाता है।
- भौतिक/तार्किक भूमिका: यह एक अनुकूली स्मूथिंग पद है जिसे उच्च-आवृत्ति शोर और फ्लोटिंग कलाकृतियों को कम करने के लिए डिज़ाइन किया गया है, विशेष रूप से वाहिका सतह से दूर के क्षेत्रों में। भारित कारक $|f_{SDF}(x)|$ का मतलब है कि स्मूथिंग प्रभाव तब मजबूत होता है जब $x$ वाहिका सतह से दूर होता है (जहां $|f_{SDF}(x)|$ बड़ा होता है) और जब $x$ सतह के करीब होता है (जहां $|f_{SDF}(x)| \approx 0$) तब कमजोर होता है। यह मॉडल को महत्वपूर्ण शारीरिक विशेषताओं के ओवर-स्मूथिंग के बिना वैश्विक चिकनाई प्राप्त करने की अनुमति देता है।
- दूरी-भारित गॉसियन ब्लर क्यों? गॉसियन ब्लर स्मूथिंग के लिए एक मानक छवि प्रसंस्करण तकनीक है। दूरी-भारितता यहाँ मुख्य नवाचार है: यह अनुकूली स्मूथिंग की अनुमति देता है। इसके बिना, एक वैश्विक स्मूथिंग पद महत्वपूर्ण महीन वाहिका संरचनाओं को धुंधला कर सकता है। स्मूथिंग शक्ति को सतह से दूरी पर निर्भर बनाकर, लेखक यह सुनिश्चित करते हैं कि विवरण जहां सबसे अधिक मायने रखता है वहां संरक्षित रहें।
-
$\mathcal{L}_{sur}$ (सतह रेगुलराइज़ेशन हानि - Surface Regularization Loss):
$$ \mathcal{L}_{sur} = E_{x \in \Omega} \exp(-\beta |f_{SDF}(x)|) $$- गणितीय परिभाषा: यह पद एक हाइपरपैरामीटर $\beta > 0$ द्वारा भारित, नकारात्मक अनुमानित एसडीएफ के घातीय फलन का उपयोग करता है।
- भौतिक/तार्किक भूमिका: यह पद विशेष रूप से नकली या "फ्लोटिंग" वाहिका घटकों को दबाने के लिए डिज़ाइन किया गया है। यह अनुमानित एसडीएफ मानों को दंडित करता है जो शून्य के करीब हैं लेकिन एक वास्तविक सतह के मजबूत सबूत के बिना। एक बड़ा $\beta$ इस दंड को अधिक आक्रामक बनाता है, प्रभावी ढंग से कमजोर, शोर वाली सीमाओं को शून्य-स्तरीय सेट से दूर धकेलता है, जिससे पुनर्निर्माण साफ हो जाता है।
- घातीय क्यों? घातीय फलन $\exp(-z)$ जैसे ही $z$ बढ़ता है, तेजी से घटता है। जब $z = \beta |f_{SDF}(x)|$ होता है, तो इसका मतलब है कि जब $|f_{SDF}(x)|$ छोटा होता है (यानी, सतह के करीब) तो हानि बहुत अधिक होती है और $|f_{SDF}(x)|$ बढ़ने पर तेजी से गिर जाती है। यह कमजोर रूप से समर्थित निकट-सतह भविष्यवाणियों के लिए एक मजबूत "प्रतिकर्षण" प्रभाव बनाता है, उन्हें एक निश्चित सतह बनने या दूर जाने के लिए प्रोत्साहित करता है।
चरण-दर-चरण प्रवाह (Step-by-Step Flow)
आइए प्रशिक्षण के दौरान वेसलएसडीएफ पाइपलाइन से गुजरने वाले एक एकल, अमूर्त 3डी स्थानिक निर्देशांक, मान लीजिए $x$, की कल्पना करें। इसे एक परिष्कृत असेंबली लाइन के माध्यम से चलने वाले एक छोटे कण की तरह सोचें।
-
प्रारंभिक इनपुट (Initial Input): हमारा कण $x$ एक कच्चे वॉल्यूमेट्रिक सीटी स्कैन $V$ के भीतर एक निर्देशांक के रूप में अपनी यात्रा शुरू करता है। सिस्टम के पास सीटी स्कैन में $x$ के आसपास के स्थानीय छवि सुविधाओं तक भी पहुंच है।
-
चरण 1: ऑक्यूपेंसी भविष्यवाणी (The "Rough Sketch" Phase):
- निर्देशांक $x$ (या बल्कि, $x$ पर और उसके आसपास सीटी स्कैन से निकाली गई सुविधाएँ) पहले बाइनरी ऑक्यूपेंसी भविष्यवाणी के लिए 3डी यू-नेट में प्रवेश करती है, जिसे हम $f_o(\cdot; \theta_o)$ कहते हैं।
- इस यू-नेट के अंदर, इनपुट सुविधाओं को एक एनकोडर-डिकोडर संरचना के माध्यम से संसाधित किया जाता है। विभिन्न स्तरों पर, 3डी अटेंशन गेट्स (समीकरण 2 में वर्णित) बुद्धिमान फिल्टर की तरह कार्य करते हैं। वे आने वाली फीचर मैप्स, $g_e$ और $h_e$ का विश्लेषण करते हैं और अटेंशन वेट्स $a_e$ उत्पन्न करते हैं। ये वेट्स फिर स्किप-कनेक्शन सुविधाओं को संशोधित करते हैं, यह सुनिश्चित करते हुए कि नेटवर्क अपनी कम्प्यूटेशनल प्रयास को प्रमुख वाहिका क्षेत्रों पर केंद्रित करता है और महीन विवरणों को संरक्षित करता है जो अन्यथा खो सकते हैं।
- इस यू-नेट से गुजरने के बाद, हमारे कण $x$ को एक ऑक्यूपेंसी संभावना, $f_o(x)$ सौंपी जाती है। यह मान, आमतौर पर 0 और 1 के बीच, नेटवर्क का प्रारंभिक "अनुमान" है कि क्या $x$ एक वाहिका (जैसे, $f_o(x) \approx 1$) या पृष्ठभूमि (जैसे, $f_o(x) \approx 0$) से संबंधित है। यह वाहिका के एक मोटे, बाइनरी स्केच की तरह है।
-
चरण 2: एसडीएफ शोधन (The "Precision Sculpting" Phase):
- चरण 1 से ऑक्यूपेंसी संभावना $f_o(x)$ को फिर एसडीएफ रिफाइनर नेटवर्क, $f_r(\cdot; \theta_r)$ को पास किया जाता है। महत्वपूर्ण रूप से, इस चरण से ग्रेडिएंट्स को प्रारंभिक चरण के मापदंडों (
detach(fo(x;θo))) से अलग किया जाता है। इसका मतलब है कि एसडीएफ रिफाइनर ऑक्यूपेंसी भविष्यवाणी को एक निश्चित इनपुट के रूप में उपयोग करता है, जिससे इसकी अपनी ज्यामितीय बाधाएं प्रारंभिक विभाजन कार्य में हस्तक्षेप करने से रोकती हैं। - एसडीएफ रिफाइनर, एक और 3डी यू-नेट, इस ऑक्यूपेंसी जानकारी को लेता है और, अपने स्वयं के बहु-रिज़ॉल्यूशन प्रसंस्करण के माध्यम से, इसे एक निरंतर साइन्ड डिस्टेंस मान, $f_{SDF}(x)$ में बदल देता है। यह मान अब एक संभावना नहीं है बल्कि एक वास्तविक संख्या है: यदि $x$ एक वाहिका के अंदर है तो ऋणात्मक, यदि बाहर है तो धनात्मक, और आदर्श रूप से यदि बिल्कुल वाहिका सतह पर है तो शून्य। यहीं पर मोटा स्केच एक सटीक, निरंतर ज्यामितीय प्रतिनिधित्व में बदल जाता है।
- चरण 1 से ऑक्यूपेंसी संभावना $f_o(x)$ को फिर एसडीएफ रिफाइनर नेटवर्क, $f_r(\cdot; \theta_r)$ को पास किया जाता है। महत्वपूर्ण रूप से, इस चरण से ग्रेडिएंट्स को प्रारंभिक चरण के मापदंडों (
-
हानि गणना (The "Quality Control" Phase):
- अब, $f_o(x)$ और $f_{SDF}(x)$ दोनों की तुलना उनके संबंधित ग्राउंड-ट्रुथ मानों ($y$ ऑक्यूपेंसी के लिए, $f^*_{SDF}(x)$ एसडीएफ के लिए) से की जाती है।
- $\mathcal{L}_{occ}$ पद जांचता है कि $f_o(x)$ वास्तविक बाइनरी लेबल $y$ से कितनी अच्छी तरह मेल खाता है।
- $\mathcal{L}_{sdf}$ पद $f_{SDF}(x)$ और वास्तविक एसडीएफ $f^*_{SDF}(x)$ के बीच निरपेक्ष अंतर को मापता है।
- $\mathcal{L}_{eik}$ पद $f_{SDF}(x)$ के ग्रेडिएंट की जांच करता है, यह सुनिश्चित करता है कि यह 1 के करीब है, इस प्रकार यह सत्यापित करता है कि $f_{SDF}(x)$ एक उचित दूरी क्षेत्र की तरह व्यवहार करता है।
- $\mathcal{L}_{gauss}$ पद $f_{SDF}(x)$ पर दूरी-भारित स्मूथिंग जांच लागू करता है, यह सुनिश्चित करता है कि दूर के क्षेत्र चिकने हों जबकि सतह के पास के महत्वपूर्ण विवरण संरक्षित रहें।
- अंत में, $\mathcal{L}_{sur}$ पद किसी भी कमजोर, अस्पष्ट निकट-शून्य एसडीएफ मानों को दंडित करता है, प्रभावी ढंग से संभावित फ्लोटिंग कलाकृतियों को "साफ" करता है।
- इन सभी व्यक्तिगत जांचों को कुल हानि $\mathcal{L}$ में संयोजित किया जाता है, जो हमारे कण $x$ के लिए मॉडल के प्रदर्शन का एक एकल मीट्रिक प्रदान करता है।
-
पैरामीटर अद्यतन (The "Learning" Phase):
- कुल हानि $\mathcal{L}$ के आधार पर, ग्रेडिएंट्स की गणना की जाती है और अनुकूलक (इस मामले में एडम) द्वारा दोनों यू-नेट के मापदंडों ($\theta_o$ और $\theta_r$) को समायोजित करने के लिए उपयोग किया जाता है। यह पुनरावृत्त समायोजन, कई कणों और युगों में दोहराया जाता है, जिससे पूरे सिस्टम को सीखने और अपने भविष्यवाणियों में सुधार करने की अनुमति मिलती है।
-
अंतिम आउटपुट (The "Reconstructed Vessel"):
- प्रशिक्षण के बाद, अनुमान के लिए, सिस्टम नए सीटी स्कैन डेटा लेता है, और किसी भी बिंदु $x$ के लिए, यह अपने अनुमानित $f_{SDF}(x)$ को आउटपुट करता है। वाहिका सतह को तब केवल उन सभी बिंदुओं के संग्रह के रूप में परिभाषित किया जाता है जहां $f_{SDF}(x) = 0$ होता है। इस शून्य-स्तरीय सेट को मार्चिंग क्यूब्स जैसे एल्गोरिदम का उपयोग करके एक 3डी मेश में परिवर्तित किया जा सकता है, जिससे अंतिम, उच्च-गुणवत्ता वाली पुनर्निर्मित वाहिका प्राप्त होती है।
अनुकूलन गतिशीलता (Optimization Dynamics)
वेसलएसडीएफ मॉडल एडम ऑप्टिमाइज़र का उपयोग करके कुल हानि फलन $\mathcal{L}$ को पुनरावृत्त रूप से कम करके सीखता है और अभिसरण करता है। इस प्रक्रिया में मास्टर समीकरण में विभिन्न शब्दों द्वारा निर्देशित ग्रेडिएंट्स और हानि परिदृश्य आकार (loss landscape shaping) का एक परिष्कृत अंतःक्रिया शामिल है।
-
ग्रेडिएंट व्यवहार (Gradient Behavior):
- प्रत्येक प्रशिक्षण पुनरावृत्ति के दौरान, एडम ऑप्टिमाइज़र कुल हानि $\mathcal{L}$ के ग्रेडिएंट्स की गणना करता है, जो सभी ट्रेनेबल मापदंडों ($\theta_o$ ऑक्यूपेंसी यू-नेट के लिए और $\theta_r$ एसडीएफ रिफाइनर यू-नेट के लिए) के संबंध में होते हैं।
- समीकरण 3 में
detachऑपरेशन ग्रेडिएंट प्रवाह का एक महत्वपूर्ण पहलू है। यह सुनिश्चित करता है कि एसडीएफ-विशिष्ट हानि शब्दों ($\mathcal{L}_{sdf}$, $\mathcal{L}_{eik}$, $\mathcal{L}_{gauss}$, $\mathcal{L}_{sur}$) से ग्रेडिएंट्स प्रारंभिक ऑक्यूपेंसी भविष्यवाणी नेटवर्क के मापदंडों $\theta_o$ को अद्यतन करने के लिए वापस प्रचारित नहीं होते हैं। यह डिजाइन विकल्प प्रारंभिक विभाजन कार्य को अलग करता है, जिससे यह एसडीएफ की अधिक जटिल ज्यामितीय बाधाओं से परेशान हुए बिना एक स्थिर, विश्वसनीय प्रारंभिक बिंदु प्रदान कर सके। केवल $\mathcal{L}_{occ}$ पद $\theta_o$ को अद्यतन करने में योगदान देता है। - इसके विपरीत, सभी पांच हानि पद $\theta_r$, एसडीएफ रिफाइनर के मापदंडों को अद्यतन करने में योगदान करते हैं। इसका मतलब है कि एसडीएफ रिफाइनर एक साथ ग्राउंड-ट्रुथ एसडीएफ से मेल खाना, आइकोनल गुणों को लागू करना, दूर के क्षेत्रों को चिकना करना और फ्लोटिंग कलाकृतियों को दबाना सीख रहा है, यह सब प्रारंभिक ऑक्यूपेंसी भविष्यवाणी पर निर्माण करते हुए।
-
हानि परिदृश्य आकार (Loss Landscape Shaping): मास्टर समीकरण में प्रत्येक पद विशिष्ट तरीके से बहु-आयामी हानि परिदृश्य को आकार देता है, अनुकूलन को एक वांछनीय समाधान की ओर निर्देशित करता है:
- $\mathcal{L}_{sdf}$ (L1 हानि): यह पद ग्राउंड-ट्रुथ एसडीएफ मानों के आसपास केंद्रित हानि परिदृश्य में एक "V-आकार" घाटी बनाता है। रैखिक दंड सटीक न्यूनतम को छोड़कर, एक सुसंगत ग्रेडिएंट परिमाण सुनिश्चित करता है, जो अनुकूलक को वास्तविक एसडीएफ मानों की ओर कुशलतापूर्वक बढ़ने में मदद करता है। आउटलायर्स के प्रति इसकी मजबूती का मतलब है कि कभी-कभी शोर वाले ग्राउंड-ट्रुथ लेबल अत्यधिक खड़ी ग्रेडिएंट्स के साथ परिदृश्य को विकृत नहीं करेंगे।
- $\mathcal{L}_{occ}$ (बाइनरी क्रॉस-एंट्रॉपी): ऑक्यूपेंसी नेटवर्क के लिए, यह पद एक परिदृश्य को आकार देता है जो गलत वर्गीकरणों को दृढ़ता से दंडित करता है। यह खड़ी ढलानों का निर्माण करता है जो अनुमानित संभावनाओं को पृष्ठभूमि के लिए 0 और वाहिका के लिए 1 की ओर धकेलते हैं, जिससे मॉडल के लिए स्पष्ट, आत्मविश्वास से भरे बाइनरी निर्णय लेना "ऊर्जावान रूप से अनुकूल" हो जाता है।
- $\mathcal{L}_{eik}$ (आइकोनल रेगुलराइज़ेशन): यह एक शक्तिशाली ज्यामितीय बाधा है। यह एक ऐसा परिदृश्य बनाता है जहां ग्रेडिएंट परिमाण 1 के करीब वाले भविष्यवाणियों को प्राथमिकता दी जाती है, जिससे एक वास्तविक दूरी फ़ंक्शन के गुणों के अनुरूप मॉडल की भविष्यवाणियों को "धकेलने" के लिए प्रभावी ढंग से दंडित किया जाता है। यह एसडीएफ को स्वाभाविक रूप से ढहने या फूलने से रोकता है।
- $\mathcal{L}_{gauss}$ (दूरी-भारित गॉसियन रेगुलराइज़ेशन): यह पद हानि परिदृश्य पर एक अनुकूली स्मूथिंग प्रभाव पेश करता है। वाहिका सतह से दूर के क्षेत्रों में (जहां $|f_{SDF}(x)|$ बड़ा है), यह पद एक चिकना, सपाट परिदृश्य बनाता है, जिससे मॉडल को उच्च-आवृत्ति शोर को कम करने के लिए प्रोत्साहित किया जाता है। हालांकि, वाहिका सतह के पास (जहां $|f_{SDF}(x)| \approx 0$), इसका प्रभाव कम हो जाता है, जिससे परिदृश्य महीन वाहिका विवरणों के अनुरूप तेज विशेषताओं को बनाए रख सकता है। यह स्थानीय परिशुद्धता के साथ वैश्विक चिकनाई को संतुलित करने का एक चतुर तरीका है।
- $\mathcal{L}_{sur}$ (सतह रेगुलराइज़ेशन): इस पद का घातीय प्रकृति $f_{SDF}(x) = 0$ के आसपास हानि परिदृश्य में एक बहुत खड़ी "चट्टान" बनाती है। यदि मॉडल एक कमजोर, असमर्थित सतह की भविष्यवाणी करता है (यानी, $f_{SDF}(x)$ शून्य के करीब है लेकिन अन्य शब्दों द्वारा दृढ़ता से पुष्टि नहीं की गई है), तो यह पद एक मजबूत ग्रेडिएंट उत्पन्न करता है जो $f_{SDF}(x)$ को शून्य से दूर धकेलता है। यह प्रभावी ढंग से अस्पष्ट फ्लोटिंग कलाकृतियों को "मिटा देता है" जिससे मॉडल के लिए संदिग्ध निकट-सतह मानों की भविष्यवाणी करना अत्यधिक प्रतिकूल हो जाता है।
-
पुनरावृत्त स्थिति अद्यतन और अभिसरण (Iterative State Updates and Convergence):
- एडम ऑप्टिमाइज़र, प्रत्येक पैरामीटर के लिए अपने अनुकूली सीखने की दरों के साथ, इस जटिल हानि परिदृश्य को कुशलतापूर्वक नेविगेट करता है। यह ग्रेडिएंट्स के पहले और दूसरे क्षणों के अनुमानों का उपयोग करता है ताकि प्रत्येक पैरामीटर के लिए चरण आकार को समायोजित किया जा सके, जिससे प्रासंगिक दिशाओं में तेजी से अभिसरण और शोर वाले या सपाट क्षेत्रों में धीमी गति से अपडेट हो सके।
- 100 युगों में, मॉडल पुनरावृत्त रूप से अपने मापदंडों को अद्यतन करता है। प्रारंभ में, भविष्यवाणियां कच्ची हो सकती हैं, लेकिन जैसे-जैसे प्रशिक्षण आगे बढ़ता है, पर्यवेक्षित शब्दों के संयुक्त प्रभाव भविष्यवाणियों को ग्राउंड-ट्रुथ की ओर खींचते हैं, जबकि रेगुलराइज़ेशन शब्द ज्यामिति को परिष्कृत करते हैं, चिकनाई, उचित दूरी क्षेत्र गुणों और कलाकृतियों के दमन को सुनिश्चित करते हैं। अलग ग्रेडिएंट प्रवाह के साथ संयुक्त प्रशिक्षण, मॉडल को पहले एक मजबूत ऑक्यूपेंसी मानचित्र स्थापित करने और फिर इसे सावधानीपूर्वक एक उच्च-गुणवत्ता, निरंतर एसडीएफ में परिष्कृत करने की अनुमति देता है, जिससे सटीक और टोपोलॉजिकल रूप से सुसंगत संवहनी पुनर्निर्माण होते हैं। $5 \times 10^{-4}$ की सीखने की दर एडम के लिए एक सामान्य विकल्प है, जो गति और स्थिरता के बीच एक अच्छा संतुलन प्रदान करती है।
Figure 1. Overview of VesselSDF, our two-stage approach for vessel segmentation and reconstruction from CT scans. In the first stage, a 3D U-Net predicts a binary occupancy map. The second stage refines this occupancy into a signed distance field (SDF) using an additional 3D U-Net, guided by geometric regularization terms. The output 3D SDF, converted into a mesh, contains high-quality reconstructed vessels
परिणाम, सीमाएँ और निष्कर्ष (Results, Limitations & Conclusion)
प्रयोगात्मक डिजाइन और आधार रेखाएँ (Experimental Design & Baselines)
लेखकों ने संवहनी नेटवर्क पुनर्निर्माण के लिए एक दो-चरणीय फ्रेमवर्क, वेसलएसडीएफ की प्रभावकारिता को मान्य करने के लिए सावधानीपूर्वक अपने प्रयोगों को डिजाइन किया। पहले चरण के लिए, जो एक बाइनरी ऑक्यूपेंसी मैप की भविष्यवाणी करता है, उन्होंने बहु-पैमाने पर वाहिका सुविधाओं को पकड़ने के लिए अटेंशन गेट्स के साथ संवर्धित एक 3डी यू-नेट आर्किटेक्चर का उपयोग किया। दूसरे चरण, जो इस ऑक्यूपेंसी को एक निरंतर साइन्ड डिस्टेंस फील्ड (एसडीएफ) में परिष्कृत करने के लिए जिम्मेदार है, ने दो एनकोडर-डिकोडर स्तरों के साथ एक हल्के 3डी यू-नेट का उपयोग किया। दोनों चरणों को एडम ऑप्टिमाइज़र का उपयोग करके 100 युगों के लिए संयुक्त रूप से प्रशिक्षित किया गया था, जिसमें $5 \times 10^{-4}$ की सीखने की दर थी। विशेष रूप से, एसडीएफ मानों की सटीकता को बनाए रखने के लिए प्रशिक्षण के दौरान कोई डेटा वृद्धि लागू नहीं की गई थी। प्रशिक्षण $512 \times 512 \times 16$ के इनपुट आकार और 16 के बैच आकार के साथ किया गया था। पुनर्निर्माण के बाद, अंतिम वाहिका मेश निकालने के लिए मार्चिंग क्यूब्स को 512 के रिज़ॉल्यूशन पर लागू किया गया था। कुल हानि फलन, $\mathcal{L} = \lambda_s \mathcal{L}_{sdf} + \lambda_o \mathcal{L}_{occ} + \lambda_e \mathcal{L}_{eik} + \lambda_g \mathcal{L}_{gauss} + \lambda_{sur} \mathcal{L}_{sur}$, में कई पद शामिल थे: पर्यवेक्षित एसडीएफ और ऑक्यूपेंसी हानि, चिकनी दूरी संक्रमण के लिए आइकोनल रेगुलराइज़ेशन, अनुकूली चिकनाई के लिए दूरी-भारित गॉसियन रेगुलराइज़र, और फ्लोटिंग कलाकृतियों को दबाने के लिए सतह रेगुलराइज़ेशन। इन पदों के लिए भार $\lambda_s = 0.1$, $\lambda_o = 0.01$, $\lambda_e = 0.01$, $\lambda_g = 0.1$, और $\lambda_{sur} = 0.1$ पर सेट किए गए थे।
वेसलएसडीएफ के खिलाफ कठोरता से परीक्षण किए गए तीन अत्याधुनिक वॉल्यूमेट्रिक सेगमेंटेशन आर्किटेक्चर थे जो बाइनरी वोक्सेल वर्गीकरण करते हैं:
1. 3डी-यूनेट [5]: चिकित्सा छवि विभाजन में व्यापक रूप से उपयोग किया जाने वाला एक मौलिक एनकोडर-डिकोडर आर्किटेक्चर।
2. 3डी एसए-यूनेट [8]: 3डी-यूनेट का एक विस्तार जिसमें स्थानिक अटेंशन मॉड्यूल शामिल हैं, जो विशेष रूप से पतली वाहिकाओं के लिए फायदेमंद, सुविधा प्रतिक्रियाओं को अनुकूली रूप से भारित करने के लिए डिज़ाइन किया गया है।
3. एनएनयू-नेट [9]: एक स्व-विन्यास विधि जो चिकित्सा छवि विभाजन में मजबूती प्राप्त करने के लिए दो यू-नेट (कम-रिज़ॉल्यूशन और उच्च-रिज़ॉल्यूशन प्रसंस्करण के लिए एक) का उपयोग करती है।
वेसलएसडीएफ के प्रदर्शन का मूल्यांकन दो सार्वजनिक यकृत वाहिका विभाजन डेटासेट पर किया गया था:
- यकृत वाहिका डेटासेट (मेडिकल सेगमेंटेशन डेकाथलॉन - टास्क 08) [2]: अर्ध-स्वचालित एनोटेशन के साथ यकृत नसों के 303 सीटी स्कैन शामिल हैं।
- आईआरसीएडीबी डेटासेट [19]: यकृत संवहनी संरचनाओं के पूरी तरह से मैनुअल सेगमेंटेशन के साथ 20 कंट्रास्ट-एन्हांस्ड एब्डोमिनल सीटी स्कैन शामिल हैं।
ग्राउंड-ट्रुथ एसडीएफ को प्रशिक्षण के लिए बाइनरी ग्राउंड-ट्रुथ से गणना की गई थी।
अपने गणितीय दावों को निश्चित रूप से साबित करने के लिए, लेखकों ने 3डी वाहिका पुनर्निर्माण के लिए पांच मेट्रिक्स का एक व्यापक सेट का उपयोग किया:
- वॉल्यूमेट्रिक ओवरलैप: डाइस स्कोर और वॉल्यूम आईओयू (इंटरसेक्शन ओवर यूनियन)।
- टोपोलॉजिकल समानता: जैकार्ड दूरी (जेडी)।
- ज्यामितीय सटीकता: चैम्फर दूरी (सीडी) और हॉसडॉर्फ दूरी (एचडी), जो क्रमशः औसत और अधिकतम सतह दूरी को मापते हैं।
साक्ष्य क्या साबित करते हैं (What the Evidence Proves)
तालिका 1 और चित्र 2 में प्रस्तुत साक्ष्य निर्विवाद रूप से वेसलएसडीएफ के बेहतर प्रदर्शन को प्रदर्शित करते हैं, विशेष रूप से जटिल संवहनी नेटवर्क की ज्यामितीय निष्ठा और कनेक्टिविटी को संरक्षित करने में।
चुनौतीपूर्ण यकृत वाहिका डेटासेट पर, वेसलएसडीएफ ने हर एक मीट्रिक पर सभी आधार रेखा मॉडलों को बेहतर प्रदर्शन किया। उदाहरण के लिए, इसका डाइस स्कोर एनएनयू-नेट के 0.69 की तुलना में 0.72 था, और इसका चैम्फर दूरी (एक निचला मान बेहतर प्रदर्शन इंगित करता है) 0.68 था, जो एनएनयू-नेट के 0.82 से काफी बेहतर था। यह निश्चित, निर्विवाद प्रमाण है कि वेसलएसडीएफ का मुख्य तंत्र, निरंतर एसडीएफ और ज्यामितीय रेगुलराइज़ेशन का लाभ उठाना, पारंपरिक बाइनरी वोक्सेल वर्गीकरण की तुलना में अधिक सटीक वॉल्यूमेट्रिक और सतह पुनर्निर्माण उत्पन्न करता है।
आईआरसीएडीबी डेटासेट के लिए, वेसलएसडीएफ ने वॉल्यूम-आधारित मेट्रिक्स (डाइस, आईओयू, जेडी) पर आधार रेखाओं के तुलनीय प्रदर्शन प्राप्त किया, जो समान समग्र विभाजन सटीकता का संकेत देता है। हालांकि, इसने सतह-आधारित मेट्रिक्स (सीडी और एचडी) पर आधार रेखाओं को काफी बेहतर प्रदर्शन किया। उदाहरण के लिए, वेसलएसडीएफ का सीडी 0.60 था, जबकि एनएनयू-नेट का 0.75 था, और इसका एचडी 3.5 था जो एनएनयू-नेट के 4.2 की तुलना में था। यह इस बात पर प्रकाश डालता है कि जबकि समग्र मात्रा समान हो सकती है, वेसलएसडीएफ एक बहुत अधिक ज्यामितीय रूप से सटीक और चिकनी वाहिका सतह उत्पन्न करता है, जो नैदानिक विश्लेषण के लिए महत्वपूर्ण है।
चित्र 2 में गुणात्मक परिणाम इन निष्कर्षों को और मजबूत करते हैं। दृश्य तुलना स्पष्ट रूप से दिखाती है कि वेसलएसडीएफ पतली वाहिकाओं और जटिल शाखा पैटर्न को अधिक प्रभावी ढंग से संरक्षित करता है, जिससे अधिक पूर्ण और शारीरिक रूप से सुसंगत पुनर्निर्माण होते हैं। विधि स्पष्ट रूप से फ्लोटिंग ज्यामिति और डिस्कनेक्टेड संरचनाओं जैसे सामान्य कलाकृतियों को कम करती है, जो बाइनरी वोक्सेल वर्गीकरण दृष्टिकोणों को प्रभावित करते हैं।
तालिका 2 में एब्लेशन अध्ययन वेसलएसडीएफ के प्रत्येक घटक के योगदान में महत्वपूर्ण अंतर्दृष्टि प्रदान करता है। एसडीएफ शोधन चरण को हटाने (w/o SDF refinement) से डाइस स्कोर में 0.72 से 0.69 तक की गिरावट आई और सीडी में 0.68 से 0.70 तक की वृद्धि हुई, यह साबित करते हुए कि दूसरा चरण ज्यामितीय सटीकता के लिए महत्वपूर्ण है। प्रारंभिक बाइनरी ऑक्यूपेंसी भविष्यवाणी को बायपास करके और सीधे एसडीएफ की भविष्यवाणी करके (w/o Binary Occupancy), एक और भी अधिक महत्वपूर्ण प्रदर्शन गिरावट (डाइस 0.65, सीडी 0.75) हुई, जो ज्यामितीय शोधन से वाहिका पहचान को अलग करने में दो-चरणीय दृष्टिकोण के लाभ को मान्य करता है। अंत में, अनुकूली गॉसियन रेगुलराइज़ेशन (w/o Gaussian Loss) को हटाने से समान डाइस स्कोर बनाए रखा गया लेकिन सतह कलाकृतियाँ पेश की गईं, जो वाहिका किनारों को ओवर-स्मूथिंग के बिना वैश्विक चिकनाई सुनिश्चित करने में इसकी भूमिका की पुष्टि करता है। पूर्ण वेसलएसडीएफ सभी मेट्रिक्स पर सर्वश्रेष्ठ प्रदर्शन प्राप्त करता है, जिसमें एसडीएफ शोधन विशेष रूप से बेहतर पुनर्निर्माण मेट्रिक्स द्वारा दिखाए गए वाहिका निरंतरता को बढ़ाता है।
सीमाएँ और भविष्य की दिशाएँ (Limitations & Future Directions)
जबकि वेसलएसडीएफ संवहनी नेटवर्क पुनर्निर्माण में एक महत्वपूर्ण प्रगति प्रस्तुत करता है, विशेष रूप से विरल सीटी डेटा के लिए, पत्र परोक्ष रूप से आगे के विकास के लिए क्षेत्रों की ओर इशारा करता है। निष्कर्ष बताता है कि वेसलएसडीएफ "फ्लोटिंग ज्यामिति और डिस्कनेक्टेड संरचनाओं जैसे कम मुद्दों" को प्रदर्शित करता है, जिसका अर्थ है कि ये चुनौतियां, हालांकि कम हो गई हैं, पूरी तरह से समाप्त नहीं हो सकती हैं। यकृत वाहिकाओं और विरल सीटी स्लाइस पर ध्यान भी सामान्यीकरण में संभावित सीमाओं का सुझाव देता है।
यहां कुछ चर्चा विषय दिए गए हैं कि हम इन निष्कर्षों को कैसे आगे विकसित और विकसित कर सकते हैं:
-
शारीरिक रचनाओं और तौर-तरीकों में सामान्यीकरण (Generalization Across Anatomies and Modalities): वर्तमान कार्य सीटी स्कैन से यकृत वाहिकाओं पर केंद्रित है। वेसलएसडीएफ अन्य जटिल संवहनी नेटवर्क, जैसे कोरोनरी धमनियों, सेरेब्रल वैस्क्युलेचर, या गुर्दे की वाहिकाओं पर लागू होने पर कितना मजबूत है, जिनमें अलग-अलग ज्यामितीय विशेषताएं और विकृति हो सकती हैं? इसके अलावा, विभिन्न रिज़ॉल्यूशन और शोर प्रोफाइल वाले एमआरए या सीटीए जैसे विभिन्न इमेजिंग तौर-तरीकों पर यह कैसा प्रदर्शन करेगा? क्या विविध डेटासेट और डोमेन अनुकूलन तकनीकों को शामिल करके संवहनी पुनर्निर्माण के लिए एक अधिक सामान्यीकृत "नींव मॉडल" विकसित किया जा सकता है?
-
कम्प्यूटेशनल दक्षता और वास्तविक समय अनुप्रयोग (Computational Efficiency and Real-time Applications): जबकि एसडीएफ उच्च ज्यामितीय निष्ठा प्रदान करते हैं, उनकी गणना और पुनर्निर्माण संसाधन-गहन हो सकता है। नैदानिक अनुप्रयोगों के लिए जिन्हें तीव्र प्रतिक्रिया की आवश्यकता होती है, जैसे कि इंट्राऑपरेटिव मार्गदर्शन या वास्तविक समय नैदानिक समर्थन, वेसलएसडीएफ की अनुमान गति एक बाधा हो सकती है। भविष्य के काम में अधिक कुशल तंत्रिका अंतर्निहित अभ्यावेदन, विरल एसडीएफ तकनीकों, या अनुकूलित हार्डवेयर त्वरण का पता लगाया जा सकता है ताकि संवहनी नेटवर्क के वास्तविक समय के 3डी पुनर्निर्माण को सक्षम किया जा सके।
-
उन्नत नैदानिक कार्यप्रवाहों के साथ एकीकरण (Integration with Advanced Clinical Workflows): स्थिर पुनर्निर्माण से परे, वेसलएसडीएफ द्वारा उत्पन्न उच्च-गुणवत्ता वाले 3डी वाहिका मॉडल को अधिक उन्नत नैदानिक कार्यप्रवाहों में कैसे एकीकृत किया जा सकता है? इसमें हेमोडायनामिक विश्लेषण के लिए रक्त प्रवाह गतिशीलता का अनुकरण करना, संवर्धित वास्तविकता ओवरले के साथ सटीक सर्जिकल योजना, या रोगी-विशिष्ट उपकरण डिजाइन शामिल हो सकता है। ऐसे उपयोगकर्ता-अनुकूल इंटरफेस और उपकरण विकसित करना जो चिकित्सकों को इन निरंतर 3डी अभ्यावेदन के साथ बातचीत करने और उनका विश्लेषण करने की अनुमति देते हैं, महत्वपूर्ण होगा।
-
रोग संबंधी विविधताओं और विसंगतियों के प्रति मजबूती (Robustness to Pathological Variations and Anomalies): उपयोग किए गए डेटासेट मुख्य रूप से विशिष्ट वाहिका संरचनाओं का प्रतिनिधित्व करते हैं। वास्तविक दुनिया के नैदानिक डेटा में अक्सर गंभीर स्टेनोसिस, एन्यूरिज्म, धमनीशिरा विकृतियां, या ट्यूमर एंजियोजेनेसिस जैसी महत्वपूर्ण रोग संबंधी विविधताएं शामिल होती हैं, जो वाहिका आकृति विज्ञान को नाटकीय रूप से बदल सकती हैं। वेसलएसडीएफ इन चरम शारीरिक विचलनों के प्रति कितना मजबूत है? भविष्य के शोध में अधिक विविध रोग संबंधी डेटासेट को शामिल करने, विशिष्ट रोग संबंधी विशेषताओं के प्रति संवेदनशील हानि कार्यों को विकसित करने, या विसंगत संरचनाओं के खिलाफ मजबूती में सुधार के लिए प्रतिकूल प्रशिक्षण का उपयोग करने पर ध्यान केंद्रित किया जा सकता है।
-
पुनर्निर्माण में अनिश्चितता का परिमाणीकरण (Uncertainty Quantification in Reconstruction): चिकित्सा इमेजिंग में, किसी मॉडल की भविष्यवाणी के आत्मविश्वास को जानना अक्सर भविष्यवाणी जितना ही महत्वपूर्ण होता है। वेसलएसडीएफ के लिए, विशेष रूप से उच्च विरलता या शोर वाले क्षेत्रों में, पुनर्निर्मित एसडीएफ की अनिश्चितता का परिमाणीकरण चिकित्सकों को मूल्यवान जानकारी प्रदान कर सकता है। एसडीएफ भविष्यवाणी में अनिश्चितता का अनुमान लगाने के लिए बायेसियन तंत्रिका नेटवर्क या एनसेंबल विधियों का पता लगाने से पुनर्निर्माण की नैदानिक उपयोगिता और विश्वसनीयता बढ़ सकती है।
-
स्थैतिक 3डी से परे: 4डी पुनर्निर्माण की ओर (Beyond Static 3D: Towards 4D Reconstruction): कई संवहनी विकृतियों में गतिशील प्रक्रियाएं शामिल होती हैं, जैसे वाहिका स्पंदन, रक्त प्रवाह परिवर्तन, या समय के साथ विरूपण। क्या वेसलएसडीएफ को गतिशील इमेजिंग अनुक्रमों से 4डी (3डी + समय) संवहनी नेटवर्क का पुनर्निर्माण करने के लिए बढ़ाया जा सकता है? यह वाहिका यांत्रिकी, रक्त प्रवाह पैटर्न और बीमारियों की प्रगति का अधिक व्यापक तरीके से अध्ययन करने के लिए रास्ते खोलेगा।
Table 1. Quantitative Results on the Hepatic Vessels and IRCADb datasets. Comparison of vessel reconstruction performance using different baselines. We report volume metrics (Dice Coefficient, Intersection over Union (IoU), and Jaccard similarity (JD)) and surface metrics (Chamfer distance (CD) ×100 and Hausdorff Distance (HD))
Table 2. Ablations on the Hepatic Vessels dataset
Figure 2. Qualitative 3D reconstruction results on the Hepatic Vessels dataset. The bottom row displays 2D slices highlighting the segmentation results
अन्य क्षेत्रों के साथ समरूपता (Isomorphisms with other fields)
संरचनात्मक कंकाल (Structural Skeleton)
यह पत्र विरल 2डी अवलोकनों से निरंतर 3डी सतहों को पुनर्निर्मित करने के लिए एक तंत्र प्रस्तुत करता है, जो सीमाओं के पास महीन विवरणों को संरक्षित करने और अन्यत्र चिकनाई लागू करने के लिए रेगुलराइज़्ड साइन्ड डिस्टेंस फील्ड का प्रतिगमन करता है।
दूर के चचेरे भाई (Distant Cousins)
-
लक्ष्य क्षेत्र: भूभौतिकी (सबसरफेस मॉडलिंग) (Target Field: Geophysics (Subsurface Modeling))
- संबंध: भूभौतिकी में, एक लंबे समय से चली आ रही समस्या में विरल और अक्सर शोर वाले 2डी भूकंपीय क्रॉस-सेक्शन या बोरहोल डेटा से निरंतर 3डी भूवैज्ञानिक संरचनाओं, जैसे तेल भंडार, जलभृत, या फॉल्ट लाइनों का पुनर्निर्माण शामिल है। यह वेसलएसडीएफ द्वारा संबोधित चुनौती का एक दर्पण प्रतिबिंब है: सीमित 2डी स्लाइस से एक सुसंगत 3डी आकार का अनुमान लगाना। संरचनात्मक निरंतरता (जैसे, एक भूवैज्ञानिक परत का चिकनाई से विस्तार) और महीन विवरणों (जैसे, एक फॉल्ट या पतले भंडार का सटीक स्थान) को संरक्षित करने की आवश्यकता, जबकि शोर को दबाना और "फ्लोटिंग" या डिस्कनेक्टेड भूवैज्ञानिक विशेषताओं से बचना, वेसलएसडीएफ के निरंतर, शाखाओं वाली संवहनी नेटवर्क को कलाकृतियों के बिना पुनर्निर्मित करने के लक्ष्य के सीधे समान है। वेसलएसडीएफ में अनुकूली रेगुलराइज़ेशन, जो सतहों से दूर चिकनाई करता है लेकिन उनके पास विवरण संरक्षित करता है, जटिल सबसरफेस इंटरफेस के मॉडलिंग के लिए अमूल्य होगा।
-
लक्ष्य क्षेत्र: वित्तीय इंजीनियरिंग (निहित अस्थिरता सतह निर्माण) (Target Field: Financial Engineering (Implied Volatility Surface Construction))
- संबंध: वित्तीय इंजीनियरों को असतत, देखे गए विकल्प कीमतों से एक चिकनी, मध्यस्थता-मुक्त निहित अस्थिरता सतह के निर्माण की निरंतर चुनौती का सामना करना पड़ता है। यह सतह एक 3डी प्रतिनिधित्व है जहां दो आयाम स्ट्राइक मूल्य और समाप्ति के लिए समय हैं, और तीसरा निहित अस्थिरता है। समस्या विरल, अक्सर शोर वाले बाजार डेटा बिंदुओं से एक निरंतर, अच्छी तरह से व्यवहार करने वाली सतह का अनुमान लगाना है। पत्र में वाहिकाओं की "पतली, शाखाओं वाली संरचनाएं" अस्थिरता सतह में जटिल, गैर-रैखिक विशेषताओं के समान देखी जा सकती हैं, जैसे अस्थिरता मुस्कान या तिरछापन, जिन्हें सटीक कैप्चर की आवश्यकता होती है। वेसलएसडीएफ का निरंतर क्षेत्र का प्रतिगमन करने और कलाकृतियों (जैसे, डिस्कनेक्टेड खंड) को रोकने के लिए रेगुलराइज़ेशन लागू करने का दृष्टिकोण सीधे एक सुसंगत और मध्यस्थता-मुक्त अस्थिरता सतह बनाने की आवश्यकता को दर्शाता है, जिससे नकली या असंतत मूल्य भविष्यवाणियों से बचा जा सके जो गलत मूल्य निर्धारण का कारण बन सकते हैं।
क्या होगा यदि परिदृश्य (What If Scenario)
कल्पना कीजिए कि एक प्रमुख निवेश बैंक में एक मात्रात्मक विश्लेषक कल वेसलएसडीएफ के सटीक समीकरण को "चोरी" करता है और इसे निहित अस्थिरता सतह के निर्माण पर लागू करता है। पारंपरिक इंटरपोलेशन विधियों या पैरामीट्रिक मॉडल पर भरोसा करने के बजाय, वे असतत विकल्प कीमतों से एक निरंतर निहित अस्थिरता साइन्ड डिस्टेंस फील्ड (एसडीएफ) का प्रतिगमन करने के लिए एक तंत्रिका नेटवर्क को प्रशिक्षित करेंगे। अनुकूली गॉसियन रेगुलराइज़ेशन (समीकरण 8) विशेष रूप से क्रांतिकारी होगा: यह सक्रिय रूप से कारोबार वाले विकल्पों से दूर सतह के क्षेत्रों में शोर और असंगतियों को आक्रामक रूप से चिकना करेगा (जहां डेटा विरल है), जबकि तरल विकल्पों के पास तेज "मुस्कान" और "तिरछापन" (महीन वाहिका विवरणों के समान) को सावधानीपूर्वक संरक्षित करेगा। आइकोनल रेगुलराइज़ेशन (समीकरण 7) यह सुनिश्चित करेगा कि निहित अस्थिरता सतह एक वास्तविक दूरी क्षेत्र की तरह व्यवहार करे, चिकनी संक्रमण लागू करे और, महत्वपूर्ण रूप से, सतह के ग्रेडिएंट गुणों के अच्छी तरह से व्यवहार करने को सुनिश्चित करके मध्यस्थता के अवसरों को रोकने में मदद करे। इससे अधिक मजबूत, मध्यस्थता-मुक्त विकल्प मूल्य निर्धारण, अधिक सटीक जोखिम प्रबंधन, और बेहतर हेजिंग रणनीतियों में एक सफलता मिल सकती है, खासकर विदेशी विकल्पों या अतरल बाजारों के लिए जहां डेटा विरलता एक महत्वपूर्ण बाधा है।
संरचनाओं की सार्वभौमिक लाइब्रेरी (Universal Library of Structures)
विरल डेटा से जटिल संवहनी नेटवर्क के पुनर्निर्माण के लिए इस पत्र का सुरुचिपूर्ण समाधान निरंतर क्षेत्र अभ्यावेदन और अनुकूली रेगुलराइज़ेशन की सार्वभौमिक प्रयोज्यता का एक प्रमाण है, जो विविध वैज्ञानिक जांचों को रेखांकित करने वाली संरचनाओं की सार्वभौमिक लाइब्रेरी में एक महत्वपूर्ण अध्याय जोड़ता है।