MICCAI

Multi-Level Gated U-Net for Denoising TMR Sensor-Based MCG Signals

Magnetocardiography (MCG) हृदय की विद्युत सक्रियता को मापने के लिए एक गैर आक्रामक (non invasive) तकनीक है। ऐतिहासिक रूप से, इसके लिए Superconducting Quantum Interference Device (SQUID) को "gold standard" माना जाता रहा...

अनुसंधान क्षेत्र Medical Image Analysis

Article Type Research analysis

Authors Xing et al.

Original Paper Published 2026

ISOM Posted 2026-03-12 22:20 UTC

Read Time 2M

Open PDF Open Source Page

Editorial Disclosure

ISOM follows an editorial workflow that structures the source paper into a readable analysis, then publishes the summary, source links, and metadata shown on this page so readers can verify the original work.

The goal of this page is to help readers understand the paper's core question, method, evidence, and implications before opening the original publication.

Background & Academic Lineage

The Origin & Academic Lineage

Magnetocardiography (MCG) हृदय की विद्युत सक्रियता को मापने के लिए एक गैर-आक्रामक (non-invasive) तकनीक है। ऐतिहासिक रूप से, इसके लिए Superconducting Quantum Interference Device (SQUID) को "gold standard" माना जाता रहा है। यद्यपि SQUID असाधारण संवेदनशीलता प्रदान करते हैं, लेकिन उन्हें लिक्विड हीलियम कूलिंग की आवश्यकता होती है और उनकी लागत लगभग 1 मिलियन USD होती है, जो उन्हें व्यापक नैदानिक उपयोग के लिए अव्यावहारिक बनाती है। Optically Pumped Magnetometers (OPMs) एक नया विकल्प हैं, लेकिन इनमें जटिल ऑप्टिकल सेटअप और सख्त चुंबकीय परिरक्षण (magnetic shielding) की आवश्यकता होती है, जिससे रखरखाव की लागत बढ़ जाती है।

Tunnel Magnetoresistance (TMR) सेंसर एक लागत प्रभावी, कमरे के तापमान पर काम करने वाले विकल्प के रूप में उभरे हैं। हालाँकि, वे एक महत्वपूर्ण "pain point" से ग्रस्त हैं: वे उच्च स्तर के $1/f$ इलेक्ट्रिकल शोर (0.1–100 Hz) प्रदर्शित करते हैं और पर्यावरणीय हस्तक्षेप के प्रति अत्यधिक संवेदनशील होते हैं। पिछले Denoising तरीके, जैसे कि डिजिटल फिल्टर या Empirical Mode Decomposition (EMD), इस गैर-स्थिर (non-stationary) शोर को संभालने में संघर्ष करते हैं, जबकि हृदय चक्र (जैसे P-waves और T-waves) की सूक्ष्म, कम-आयाम वाली विशेषताओं को संरक्षित करना चुनौतीपूर्ण होता है। इसके अतिरिक्त, ECG (electrocardiogram) के लिए डिज़ाइन किए गए मौजूदा डीप लर्निंग मॉडल अक्सर MCG के लिए उप-इष्टतम (suboptimal) होते हैं क्योंकि MCG शोर प्रोफाइल—विशेष रूप से $1/f$ शोर—ECG डेटा में पाए जाने वाले बेसलाइन ड्रिफ्ट और मसल आर्टिफैक्ट्स से मौलिक रूप से भिन्न होते हैं। लेखकों ने अनियमित शोर को दबाने के लिए हृदय संकेतों की आवधिक प्रकृति (periodic nature) का लाभ उठाकर इस अंतर को पाटने के लिए MGU-Net विकसित किया है।

Intuitive Domain Terms

Tunnel Magnetoresistance (TMR) Sensor: इसे एक अत्यधिक संवेदनशील "चुंबकीय माइक्रोफोन" के रूप में समझें। जैसे एक माइक्रोफोन ध्वनि तरंगों को पकड़ता है, यह सेंसर हृदय की सूक्ष्म चुंबकीय "फुसफुसाहट" को पकड़ता है।
Gated Linear Unit (GLU): इसे एक स्मार्ट फिल्टर या किसी इमारत में "गेटकीपर" के रूप में सोचें। यह आने वाले डेटा को देखता है और तय करता है कि कौन से हिस्से महत्वपूर्ण हैं (हृदय की लय) और कौन से हिस्से केवल कष्टप्रद पृष्ठभूमि शोर (noise) हैं, जिससे केवल महत्वपूर्ण संकेत ही आगे बढ़ पाते हैं।
QRS Complex: यह हृदय गति संकेत में सबसे प्रमुख "स्पाइक" है। यदि हृदय गति एक पर्वत श्रृंखला होती, तो QRS complex सबसे ऊँची, सबसे नुकीली चोटी होती, जो हृदय के मुख्य विद्युत संकुचन का प्रतिनिधित्व करती है।
$1/f$ Noise: इसे एक निरंतर, कम-आवृत्ति वाली गूंज या "स्टैटिक" के रूप में सोचें जो सुनने में जितनी धीमी होती है, उतनी ही तेज होती जाती है। यह इलेक्ट्रॉनिक सेंसर में हस्तक्षेप का एक सामान्य प्रकार है जिसे फिल्टर करना विशेष रूप से कठिन है क्योंकि यह जैविक संकेतों की धीमी, लयबद्ध प्रकृति की नकल करता है।

Notation Table

Variable	Description
$T$	MCG सिग्नल नमूने की लंबाई (समय बिंदुओं की संख्या)।
$D$	MCG सिग्नल का फीचर आयाम।
$X_{\text{in}}$	इनपुट MCG फीचर अनुक्रम, जहाँ $X_{\text{in}} \in \mathbb{R}^{T \times D}$।
$X_{\text{out}}$	मॉडल द्वारा उत्पादित Denoised आउटपुट सिग्नल।
$f_1, f_2$	GLU मॉड्यूल के भीतर सीखने योग्य रैखिक मैपिंग फ़ंक्शन।
$\theta_W, \theta_V$	रैखिक मैपिंग $f_1$ और $f_2$ के लिए पैरामीटर (weights)।
$\sigma$	गेटिंग के लिए उपयोग किया जाने वाला एक्टिवेशन फ़ंक्शन (जैसे, sigmoid या softmax)।
$\odot$	गेटिंग तंत्र में उपयोग किया जाने वाला एलिमेंट-वाइज मल्टीप्लिकेशन ऑपरेटर।

Mathematical Interpretation

लेखक मानक self-attention (SA) तंत्र—जो उनके तर्क के अनुसार अनावश्यक पैरामीटर पेश करता है—को Gated Linear Unit (GLU) से बदलकर Denoising समस्या का समाधान करते हैं।

मानक self-attention में, मॉडल गणना करता है:
$$X_{\text{out}} = \text{softmax} \left( \frac{QK^\top}{\sqrt{d_k}} \right) V$$
इसके लिए Query ($Q$) और Key ($K$) के लिए अलग-अलग प्रोजेक्शन की आवश्यकता होती है, जो लेखकों के अनुसार आवधिक MCG संकेतों के लिए उप-इष्टतम अभिसरण (convergence) की ओर ले जाता है। इसके बजाय, वे GLU-आधारित दृष्टिकोण का प्रस्ताव करते हैं:
$$X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$$

यहाँ, मॉडल इनपुट को संसाधित करने के लिए दो समानांतर पाइपलाइनों ($f_1$ और $f_2$) का उपयोग करता है। $\sigma$ द्वारा नियंत्रित गेटिंग तंत्र एक अनुकूली फिल्टर (adaptive filter) के रूप में कार्य करता है। Competitive Gating (CG) मॉड्यूल (जहाँ $\sigma$ एक softmax फ़ंक्शन है) का उपयोग करके, मॉडल पूरी अनुक्रम में वैश्विक आवधिक विशेषताओं—जैसे QRS complex—को अधिक महत्व देना सीखता है। Noise Gating (NG) मॉड्यूल (जहाँ $\sigma$ एक sigmoid फ़ंक्शन है) का उपयोग करके, मॉडल यादृच्छिक शोर का प्रारंभिक दमन करता है। यह दोहरी-गेटिंग दृष्टिकोण नेटवर्क को आवर्ती हृदय पैटर्न को प्रवर्धित करके और साथ ही TMR सेंसर डेटा को प्रभावित करने वाले अनियमित, गैर-आवधिक शोर घटकों को कम करके सिग्नल को प्रभावी ढंग से "साफ" करने की अनुमति देता है। मॉडल को mean squared error (MSE) लॉस का उपयोग करके प्रशिक्षित किया जाता है, जो शोर वाले इनपुट और ग्राउंड-ट्रुथ सिग्नल के बीच के अंतर को कम करता है, जिससे नेटवर्क शोर वाले कच्चे डेटा से "सत्य" हृदय तरंग को पुनर्गठित करना सीखता है। परिणाम एक मजबूत प्रणाली है जो P-waves और T-waves जैसी सूक्ष्म विशेषताओं को पुनर्प्राप्त करती है जो पहले सेंसर शोर के कारण अस्पष्ट थीं।

Problem Definition & Constraints

Core Problem Formulation & The Dilemma

प्रारंभिक बिंदु और लक्ष्य:
इनपुट Tunnel Magnetoresistance (TMR) सेंसर द्वारा कैप्चर किया गया एक कच्चा, लंबी-अनुक्रम वाला मैग्नेटोकार्डियोग्राफी (MCG) सिग्नल है। ये संकेत उच्च-स्तरीय शोर, विशेष रूप से $1/f$ इलेक्ट्रिकल शोर ($0.1-100$ Hz) और थर्मल हलचल से भारी रूप से दूषित होते हैं। वांछित आउटपुट एक साफ, Denoised सिग्नल है जहाँ सूक्ष्म, नैदानिक रूप से महत्वपूर्ण विशेषताएं—विशेष रूप से P-wave और T-wave—शोर के स्तर से स्पष्ट रूप से पुनर्प्राप्त की जाती हैं, जबकि QRS complex की अखंडता बनी रहती है।

दुविधा:
मौलिक ट्रेड-ऑफ शोर दमन (noise suppression) और फीचर संरक्षण (feature preservation) के बीच संघर्ष में निहित है। पारंपरिक सिग्नल प्रोसेसिंग विधियाँ (जैसे डिजिटल फिल्टर या EMD) अक्सर गैर-स्थिर शोर के साथ संघर्ष करती हैं; वे या तो शोर को प्रभावी ढंग से हटाने में विफल रहती हैं या, स्मूथिंग की प्रक्रिया में, अनजाने में P और T तरंगों को "धो" देती हैं, जो हृदय संबंधी असामान्यताओं के निदान के लिए आवश्यक हैं। इसके अलावा, जबकि डीप लर्निंग मॉडल ECG Denoising में सफल रहे हैं, वे विभिन्न शोर प्रोफाइल (जैसे बेसलाइन ड्रिफ्ट या इलेक्ट्रोड मोशन) के लिए अनुकूलित हैं। इन्हें TMR-आधारित MCG संकेतों पर लागू करने से उप-इष्टतम प्रदर्शन मिलता है क्योंकि शोर की विशेषताएं और सेंसर-विशिष्ट आर्टिफैक्ट्स मौलिक रूप से भिन्न होते हैं।

कठोर बाधाएं:
1. गैर-स्थिर शोर (Non-Stationary Noise): शोर स्थिर नहीं है; यह अनियमित आयाम और आवृत्ति भिन्नता प्रदर्शित करता है, जिससे सरल थ्रेशोल्डिंग या स्टेटिक फिल्टरिंग अप्रभावी हो जाती है।
2. विशेषताओं की डेटा विरलता (Data Sparsity of Features): कच्चे TMR-आधारित MCG में, P और T तरंगें अक्सर शोर से पूरी तरह अस्पष्ट होती हैं, केवल R-peak दिखाई देता है। मॉडल को केवल इनपुट को फिल्टर करने के बजाय सीखे गए आवधिक पैटर्न के आधार पर इन विशेषताओं को "hallucinate" या पुनर्गठित करना होगा।
3. कम्प्यूटेशनल जटिलता: लंबी-अनुक्रम संकेतों (जिसमें कई हृदय चक्र होते हैं) को संसाधित करना एक विशाल कम्प्यूटेशनल बोझ पैदा करता है। लेखकों को उच्च-रिज़ॉल्यूशन फीचर निष्कर्षण की आवश्यकता और वास्तविक समय के अनुमान (real-time inference) की व्यावहारिक आवश्यकता (जैसे, RTX 4090 पर प्रति नमूना $5.06$ ms) के बीच संतुलन बनाना पड़ा।
4. आर्किटेक्चरल बेमेल: मानक self-attention तंत्र, हालांकि लंबी दूरी की निर्भरता के लिए शक्तिशाली हैं, अनावश्यक पैरामीटर (जैसे अलग Query और Key प्रोजेक्शन) पेश करते हैं जो हृदय संकेतों की विशिष्ट आवधिक प्रकृति से निपटने के दौरान खराब अभिसरण (convergence) का कारण बन सकते हैं।

Mathematical Interpretation of the Solution

लेखक मानक self-attention तंत्र को Gated Linear Unit (GLU) से बदलकर शोर वाले इनपुट और साफ सिग्नल के बीच के अंतर को पाटते हैं।

मानक self-attention तंत्र में, आउटपुट की गणना इस प्रकार की जाती है:
$$X_{\text{out}} = \text{softmax} \left( \frac{QK^\top}{\sqrt{d_k}} \right) V$$
जहाँ $Q, K, V$ इनपुट $X_{\text{in}}$ के प्रोजेक्शन हैं। लेखक तर्क देते हैं कि यह आवधिक MCG संकेतों के लिए अक्षम है। इसके बजाय, वे GLU का उपयोग करते हैं, जो दो रैखिक प्रोजेक्शन के एलिमेंट-वाइज मल्टीप्लिकेशन के माध्यम से गेटिंग करता है:
$$X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$$

यहाँ, $\sigma$ गेटिंग फ़ंक्शन के रूप में कार्य करता है। Competitive Gating (CG) मॉड्यूल (जहाँ $\sigma$ एक softmax फ़ंक्शन है) का उपयोग करके, मॉडल वैश्विक आवधिक विशेषताओं को महत्व देना सीखता है, जिससे नेटवर्क को आवर्ती QRS complexes को प्राथमिकता देने की अनुमति मिलती है। Noise Gating (NG) मॉड्यूल (जहाँ $\sigma$ एक sigmoid फ़ंक्शन है) का उपयोग करके, मॉडल यादृच्छिक शोर का प्रारंभिक दमन करता है।

यह पदानुक्रमित U-Net आर्किटेक्चर मॉडल को बहु-स्तरीय अभ्यावेदन (multi-scale representations) सीखने की अनुमति देता है, जो उच्च-स्तरीय विशेषताओं को निकालने के लिए सिग्नल को प्रभावी ढंग से संकुचित करता है और फिर सूक्ष्म हृदय तरंगों को बहाल करने के लिए इसे पुनर्गठित करता है। इन गेटिंग तंत्रों का संयोजन मॉडल को व्यवस्थित रूप से आवधिक हृदय हस्ताक्षरों को प्रवर्धित करने और अनियमित शोर को कम करने की अनुमति देता है, जो मानक कन्वेन्शनल या अटेंशन-आधारित दृष्टिकोणों की सीमाओं को दरकिनार करने का एक चतुर तरीका है।

Why This Approach

इस शोध पत्र के लेखकों ने मौजूदा डीप लर्निंग समाधानों और Tunnel Magnetoresistance (TMR) सेंसर की विशिष्ट शोर विशेषताओं के बीच एक मौलिक बेमेल का सामना किया। जबकि Transformers या Diffusion मॉडल (जैसे DeScoD) जैसे मानक तरीके ECG Denoising में उत्कृष्ट हैं—जो आमतौर पर बेसलाइन ड्रिफ्ट और मसल आर्टिफैक्ट्स से निपटते हैं—वे TMR-आधारित मैग्नेटोकार्डियोग्राफी (MCG) में निहित $1/f$ इलेक्ट्रिकल शोर और गैर-समान स्पेक्ट्रल क्षय (spectral decay) के साथ संघर्ष करते हैं।

The Logic of the Approach

लेखकों ने पहचाना कि पारंपरिक "SOTA" तरीके अपर्याप्त थे क्योंकि वे अक्सर सिग्नल Denoising को एक सामान्य sequence-to-sequence कार्य के रूप में मानते हैं, जो हृदय QRS complex की मजबूत, अंतर्निहित आवधिकता का लाभ उठाने में विफल रहते हैं। अहसास का "सटीक क्षण" तब आया जब उन्होंने देखा कि मानक Self-Attention (SA) तंत्र ने अनावश्यक पैरामीटर (अलग Query और Key प्रोजेक्शन के माध्यम से) पेश किए, जो MCG संकेतों की विशिष्ट, दोहराव वाली संरचना पर लागू होने पर उप-इष्टतम अभिसरण की ओर ले गए।

Comparative Superiority and Structural Advantages

MGU-Net कई कारणों से पिछले gold standards की तुलना में गुणात्मक रूप से बेहतर है:

Gating vs. Attention: मानक SA तंत्र को Gated Linear Unit (GLU) से बदलकर, लेखक एक कम्प्यूटेशनल रूप से महंगे, पैरामीटर-भारी अटेंशन मॉडल से एक अधिक कुशल गेटिंग तंत्र की ओर बढ़े। GLU, जिसे $X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$ के रूप में परिभाषित किया गया है, एक अनुकूली फिल्टर के रूप में कार्य करने के लिए एलिमेंट-वाइज मल्टीप्लिकेशन का उपयोग करता है। यह मॉडल को आवधिक हृदय हस्ताक्षरों को प्रवर्धित करते हुए अनियमित शोर को "गेट आउट" करने की अनुमति देता है।
Hierarchical Feature Extraction: U-Net आर्किटेक्चर बहु-स्तरीय फीचर लर्निंग को सक्षम करके एक संरचनात्मक लाभ प्रदान करता है। यह मानक Transformers में पूर्ण-अनुक्रम self-attention से जुड़ी $O(N^2)$ मेमोरी जटिलता बाधा के बिना स्थानीय तरंग विवरण (जैसे सूक्ष्म P और T तरंगें) और वैश्विक प्रासंगिक पैटर्न (QRS complex की लय) दोनों को कैप्चर करता है।
Synergistic Design: समस्या और समाधान के बीच का "विवाह" दो विशिष्ट गेटिंग वेरिएंट के एकीकरण में निहित है:
- Noise Gating (NG): यादृच्छिक, उच्च-आवृत्ति शोर के प्रारंभिक दमन को करने के लिए sigmoid एक्टिवेशन का उपयोग करता है।
- Competitive Gating (CG): सिग्नल को वैश्विक रूप से महत्व देने के लिए softmax एक्टिवेशन का उपयोग करता है, यह सुनिश्चित करते हुए कि आवधिक हृदय विशेषताएं पूरी अनुक्रम में प्राथमिकता प्राप्त करें।

Why Alternatives Failed

लेखक स्पष्ट रूप से मानक Transformer-आधारित दृष्टिकोणों को अस्वीकार करते हैं क्योंकि SA में अनावश्यक $Q/K$ प्रोजेक्शन ऐसे संकेतों के लिए अनावश्यक हैं जिनमें इतना मजबूत स्व-सहसंबंध (self-correlation) होता है। GANs या बुनियादी CNNs के विपरीत, जो उच्च-शोर स्थितियों में P और T तरंगों के नाजुक आकारिकी (morphology) को बनाए रखने के लिए संघर्ष कर सकते हैं, MGU-Net का गेटिंग तंत्र विशेष रूप से MCG सिग्नल की आवधिकता के लिए ट्यून किया गया है। यह इसे DeScoD और APR-CNN से बेहतर प्रदर्शन करने की अनुमति देता है, जो लेखक प्रदर्शित करते हैं कि कई हृदय चक्रों में QRS complex को बहाल करने में विफल रहते हैं।

संक्षेप में, MGU-Net केवल एक "बड़ा" मॉडल नहीं है; यह एक विशेष आर्किटेक्चर है जो अपने गणितीय संचालन—विशेष रूप से रैखिक प्रोजेक्शन की गेटिंग—को TMR सेंसर शोर की भौतिक वास्तविकता के साथ संरेखित करता है। यह दृष्टिकोण कम्प्यूटेशनल बोझ को प्रभावी ढंग से कम करता है जबकि वास्तविक डेटासेट पर Signal-to-Noise Ratio (SNR) को लगभग 3.9 dB से 14.5 dB तक काफी सुधारता है, यह साबित करता है कि एक विशेष बायोमेडिकल इंजीनियरिंग कार्यों में एक सामान्य, उच्च-क्षमता वाले मॉडल की तुलना में एक अनुकूलित इंडक्टिव बायस (inductive bias) अक्सर अधिक प्रभावी होता है।

Mathematical & Logical Mechanism

MGU-Net (Multi-Level Gated U-Net) Tunnel Magnetoresistance (TMR) सेंसर के माध्यम से प्राप्त मैग्नेटोकार्डियोग्राफी (MCG) संकेतों को Denoise करने की महत्वपूर्ण चुनौती को संबोधित करता है। SQUID-आधारित प्रणालियों के विपरीत, TMR सेंसर लागत प्रभावी हैं लेकिन उच्च-आवृत्ति शोर और $1/f$ शोर से ग्रस्त हैं, जो P-waves और T-waves जैसी सूक्ष्म हृदय विशेषताओं को अस्पष्ट करते हैं।

The Master Equation

Gated Linear Unit (GLU) मॉड्यूल का मूल तर्क, जो आवधिक हृदय पैटर्न को बेहतर ढंग से कैप्चर करने के लिए मानक self-attention तंत्र को प्रतिस्थापित करता है, इस प्रकार परिभाषित है:

$$X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$$

समीकरण का विश्लेषण:

$X_{\text{in}}$: $T \times D$ आयाम (समय चरण $\times$ फीचर आयाम) का इनपुट MCG फीचर अनुक्रम। यह कच्चे, शोर वाले सिग्नल खंडों का प्रतिनिधित्व करता है।
$f_1(\cdot; \theta_W)$ और $f_2(\cdot; \theta_V)$: ये सीखने योग्य रैखिक मैपिंग हैं (कन्वेन्शनल परतों के माध्यम से कार्यान्वित)। वे इनपुट को दो अलग-अलग फीचर स्पेस में बदलते हैं।
$\sigma(\cdot)$: एक्टिवेशन फ़ंक्शन। "Noise Gating" (NG) मॉड्यूल में, यह यादृच्छिक शोर को दबाने के लिए एक sigmoid फ़ंक्शन है। "Competitive Gating" (CG) मॉड्यूल में, यह वैश्विक गेटिंग वेट की गणना करने के लिए एक softmax फ़ंक्शन है।
$\odot$: एलिमेंट-वाइज (Hadamard) प्रोडक्ट। यह "गेट" है। यह एक गतिशील फिल्टर के रूप में कार्य करता है जहाँ $f_1$ का आउटपुट $f_2$ द्वारा उत्पादित विशेषताओं के "महत्व" या "लाभ" को निर्धारित करता है।

Step-by-Step Flow

Input: एक शोर वाला 10-सेकंड का MCG सिग्नल नेटवर्क में प्रवेश करता है।
Noise Gating (NG): सिग्नल पहले एक NG मॉड्यूल से गुजरता है, जो चैनल आयाम का विस्तार करता है और यादृच्छिक, गैर-आवधिक शोर के प्रारंभिक दमन को करने के लिए sigmoid-gated पाइपलाइन का उपयोग करता है।
Hierarchical Encoding: सिग्नल चार डाउनसैंपलिंग चरणों से गुजरता है। प्रत्येक चरण स्थानीय विशेषताओं को निकालने के लिए ResBlock और वैश्विक आवधिक निर्भरता सीखने के लिए Competitive Gating (CG) मॉड्यूल का उपयोग करता है।
Bottleneck: सबसे गहरे स्तर पर, मॉडल उच्च-स्तरीय अभ्यावेदन को एकत्रित करता है, जो हृदय चक्र की वैश्विक लय को कैप्चर करता है।
Decoding: तीन अपसैंपलिंग चरण सिग्नल रिज़ॉल्यूशन को बहाल करते हैं। एनकोडर से विशेषताओं को बारीक लौकिक विवरण (जैसे P-wave) को संरक्षित करने के लिए स्किप कनेक्शन के माध्यम से संयोजित किया जाता है।
Output: एक अंतिम $1 \times 1$ कन्वेन्शन चैनलों को ढहाकर एक एकल, साफ Denoised MCG सिग्नल उत्पन्न करता है।

Optimization Dynamics

मॉडल Denoised आउटपुट और ग्राउंड-ट्रुथ सिग्नल के बीच Mean Squared Error (MSE) को कम करके सीखता है। अनुकूलन Adam ऑप्टिमाइज़र द्वारा संचालित होता है। "सीखना" तब होता है जब नेटवर्क GLU मॉड्यूल के भीतर पैरामीटर $\theta_W$ और $\theta_V$ को समायोजित करता है। चूंकि MCG सिग्नल अत्यधिक आवधिक है, ग्रेडिएंट्स प्रभावी रूप से त्रुटि सिग्नल को गेटिंग शाखाओं के माध्यम से वापस प्रसारित करते हैं, जिससे मॉडल को अपने आंतरिक "गेट" को हृदय चक्रों के समय के साथ संरेखित करने के लिए मजबूर किया जाता है। यह मॉडल को स्टोकेस्टिक, गैर-आवधिक शोर (जिसे दबा दिया जाता है) और संरचित, आवधिक हृदय सिग्नल (जिसे संरक्षित किया जाता है) के बीच अंतर करने की अनुमति देता है।

Results, Limitations & Conclusion

Analysis of Multi-Level Gated U-Net for Denoising TMR Sensor-Based MCG Signals

लेखक Multi-Level Gated U-Net (MGU-Net) का प्रस्ताव करते हैं। आर्किटेक्चर दो प्राथमिक नवाचारों का लाभ उठाता है:
1. Hierarchical U-Net Backbone: यह मॉडल को बहु-स्तरीय अभ्यावेदन सीखने की अनुमति देता है, जो वैश्विक लयबद्ध पैटर्न और स्थानीय तरंग विवरण दोनों को कैप्चर करता है।
2. Gated Linear Unit (GLU) Modules: मानक self-attention के बजाय, वे GLU मॉड्यूल का उपयोग करते हैं जिन्हें इस प्रकार परिभाषित किया गया है:
$$X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$$
यह गेटिंग तंत्र प्रभावी रूप से एक अनुकूली फिल्टर के रूप में कार्य करता है जो अनियमित शोर को दबाते हुए आवधिक हृदय हस्ताक्षरों को प्रवर्धित करता है।

Experimental Validation

लेखकों ने पारंपरिक सिग्नल प्रोसेसिंग विधियों (FIR/IIR फिल्टर, EMD, VMD) और अत्याधुनिक डीप लर्निंग बेसलाइन (APR-CNN, TCDAE, DeScoD) सहित "पीड़ितों" के एक सूट के खिलाफ अपने मॉडल का बेरहमी से परीक्षण किया। उनकी सफलता का प्रमाण महत्वपूर्ण SNR सुधारों में पाया जाता है। वास्तविक दुनिया के डेटासेट पर, उन्होंने $14.514$ dB का SNR हासिल किया, जबकि अगले सर्वश्रेष्ठ प्रतियोगी (DeScoD) का SNR $8.3049$ dB था। एब्लेशन अध्ययन "स्मोकिंग गन" प्रमाण प्रदान करता है: Noise Gating (NG) और Competitive Gating (CG) मॉड्यूल को अलग करके, उन्होंने साबित किया कि इन दो घटकों के बीच तालमेल ही प्रदर्शन को संचालित करता है।

Discussion and Future Perspectives

यह शोध पत्र सफलतापूर्वक प्रदर्शित करता है कि विशेष आर्किटेक्चरल इंडक्टिव बायस (जैसे आवधिकता के लिए गेटिंग) विशेष हार्डवेयर डोमेन में सामान्य डीप लर्निंग मॉडल से बेहतर प्रदर्शन कर सकते हैं। इन निष्कर्षों को विकसित करने के लिए, मैं निम्नलिखित चर्चा विषयों का प्रस्ताव करता हूँ:

Pathological Signals का सामान्यीकरण: वर्तमान अध्ययन स्वस्थ स्वयंसेवकों पर निर्भर करता है। MGU-Net अतालता (arrhythmias) या मायोकार्डियल इस्किमिया के रोगियों पर कैसा प्रदर्शन करेगा, जहाँ QRS complex की "आवधिक" प्रकृति मौलिक रूप से बदल जाती है?
Hardware-Algorithm Co-design: चूंकि शोर प्रोफाइल TMR सेंसर के लिए विशिष्ट है, क्या हम भौतिक सेंसर शोर मॉडल को सीधे लॉस फ़ंक्शन में शामिल करके प्रदर्शन में और सुधार कर सकते हैं?
Real-time Clinical Integration: हालांकि अनुमान की गति प्रभावशाली है (5.06 ms), नैदानिक तैनाती के लिए मॉडल की अनिश्चितता के कठोर सत्यापन की आवश्यकता होती है।