EN KR JP CN RU IN
MICCAI

用于TMR传感器MCG信号去噪的多层门控U-Net

Open PDF Open MICCAI page

背景与学术渊源

起源与学术脉络

心磁图(Magnetocardiography, MCG)是一种通过测量心脏产生的磁场来绘制心脏电活动的无创技术。从历史角度看,该领域的“金标准”一直是超导量子干涉仪(SQUID)。尽管 SQUID 具有极高的灵敏度,但其依赖液氦冷却且成本高达约 100 万美元,这使其难以在临床中广泛应用。光泵磁力计(OPMs)作为一种较新的替代方案,却涉及复杂的光学系统及严格的磁屏蔽要求,从而推高了维护成本。

隧道磁阻(TMR)传感器作为一种高性价比的室温替代方案应运而生。然而,它们面临一个显著的“痛点”:表现出高水平的 $1/f$ 电噪声(0.1–100 Hz),且极易受到环境干扰。现有的去噪方法,如数字滤波器或经验模态分解(EMD),在处理此类非平稳噪声时,往往难以在保留心动周期中微弱、低幅值特征(如 P 波和 T 波)的同时有效滤除噪声。此外,现有的针对心电图(ECG)设计的深度学习模型通常不适用于 MCG,因为 MCG 的噪声分布(特别是 $1/f$ 噪声)与 ECG 数据中常见的基线漂移和肌电伪影存在本质差异。作者开发了 MGU-Net,旨在通过利用心脏信号的周期性来抑制不规则噪声,从而弥补这一技术鸿沟。

直观领域术语

  • 隧道磁阻(TMR)传感器: 可将其视为一种高灵敏度的“磁性麦克风”。正如麦克风拾取声波一样,该传感器拾取心脏微弱的磁性“低语”。
  • 门控线性单元(Gated Linear Unit, GLU): 想象成建筑物中的智能过滤器或“守门人”。它审视输入数据,决定哪些部分是重要的(心脏节律),哪些部分仅仅是干扰背景噪声,仅允许重要信号通过。
  • QRS 波群(QRS Complex): 这是心跳信号中最显著的“尖峰”。如果将心跳比作山脉,QRS 波群就是最高、最尖锐的山峰,代表心脏主要的电收缩过程。
  • $1/f$ 噪声: 可将其视为一种持续的、低频的嗡嗡声或“静电干扰”,听觉频率越低,其响度越大。这是电子传感器中常见的一种干扰,由于其模拟了生物信号缓慢、节律性的特征,因此极难滤除。

符号表

变量 描述
$T$ MCG 信号样本的长度(时间点数量)。
$D$ MCG 信号的特征维度。
$X_{\text{in}}$ 输入 MCG 特征序列,其中 $X_{\text{in}} \in \mathbb{R}^{T \times D}$。
$X_{\text{out}}$ 模型生成的去噪后输出信号。
$f_1, f_2$ GLU 模块内的可学习线性映射函数。
$\theta_W, \theta_V$ 线性映射 $f_1$ 和 $f_2$ 的参数(权重)。
$\sigma$ 用于门控的激活函数(如 sigmoid 或 softmax)。
$\odot$ 门控机制中使用的逐元素乘法算子。

数学解释

作者通过使用门控线性单元(GLU)替代标准的自注意力(Self-Attention, SA)机制来解决去噪问题,并指出后者引入了冗余参数。

在标准自注意力机制中,模型计算:
$$X_{\text{out}} = \text{softmax} \left( \frac{QK^\top}{\sqrt{d_k}} \right) V$$
这需要为查询向量(Query, $Q$)和键向量(Key, $K$)分别进行投影,作者认为这会导致周期性 MCG 信号的收敛效果不佳。相反,他们提出了基于 GLU 的方法:
$$X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$$

在此模型中,使用两条并行流水线($f_1$ 和 $f_2$)处理输入。由 $\sigma$ 控制的门控机制充当自适应滤波器。通过使用竞争门控(Competitive Gating, CG)模块(其中 $\sigma$ 为 softmax 函数),模型学习在整个序列中对全局周期性特征(如 QRS 波群)赋予更高的权重。通过使用噪声门控(Noise Gating, NG)模块(其中 $\sigma$ 为 sigmoid 函数),模型执行对随机噪声的初步抑制。这种双重门控方法使网络能够通过放大循环出现的心脏模式,同时衰减困扰 TMR 传感器数据的不规则、非周期性噪声分量,从而有效地“清洗”信号。该模型使用均方误差(MSE)损失进行训练,通过最小化含噪输入与 Ground Truth 信号之间的差异,有效地训练网络从含噪原始数据中重构“真实”的心脏波形。其结果是一个鲁棒的系统,能够恢复此前被传感器噪声掩盖的 P 波和 T 波等微弱特征。

问题定义与约束

核心问题阐述与困境

起点与目标:
输入数据为通过隧道磁阻(TMR)传感器采集的原始长序列磁心电图(MCG)信号。此类信号受到高强度噪声的严重干扰,特别是 $1/f$ 电噪声(频率范围 $0.1-100$ Hz)及热扰动。目标输出为去噪后的纯净信号,要求在保持 QRS complex 完整性的前提下,从噪声基底中清晰恢复出具有临床意义的微弱特征,即 P-wave 和 T-wave。

困境:
核心矛盾在于 Noise suppressionFeature preservation 之间的权衡。传统的信号处理方法(如数字滤波器或经验模态分解)在处理非平稳噪声时往往表现欠佳;它们要么无法有效去除噪声,要么在平滑过程中不慎“抹除”了对诊断心脏异常至关重要的低振幅 P-wave 和 T-wave。此外,尽管深度学习模型在 ECG 去噪方面已取得成功,但它们针对的是不同的噪声分布(如基线漂移或电极运动)。将这些模型直接应用于基于 TMR 的 MCG 信号会导致性能不佳,因为两者的噪声特性及传感器特定的伪影存在本质差异。

严苛约束:
1. Non-Stationary Noise: 噪声并非恒定,其幅度和频率呈现不规则变化,导致简单的阈值处理或静态滤波失效。
2. Data Sparsity of Features: 在原始 TMR-based MCG 中,P-wave 和 T-wave 常被噪声完全掩盖,仅 R-peak 可见。模型必须基于学习到的周期性模式来“重构”或推断这些特征,而非仅仅对输入进行滤波。
3. Computational Complexity: 处理包含多个心动周期的长序列信号会带来巨大的计算负担。作者必须在高分辨率特征提取的需求与实时推理的实际要求(例如在 RTX 4090 上每样本 $5.06$ ms)之间取得平衡。
4. Architectural Mismatch: 标准的 Self-attention 机制虽然在处理长距离依赖方面表现出色,但引入了冗余参数(如独立的 Query 和 Key 投影),在处理心脏信号特有的周期性时,可能导致收敛性能不佳。

解决方案的数学诠释

作者通过引入 Gated Linear Unit (GLU) 替代标准的 Self-attention 机制,弥合了噪声输入与纯净信号之间的鸿沟。

在标准的 Self-attention 机制中,输出计算公式为:
$$X_{\text{out}} = \text{softmax} \left( \frac{QK^\top}{\sqrt{d_k}} \right) V$$
其中 $Q, K, V$ 为输入 $X_{\text{in}}$ 的投影。作者认为,对于周期性的 MCG 信号,这种方式效率低下。取而代之的是 GLU,它通过两个线性投影的逐元素乘法执行门控:
$$X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$$

此处,$\sigma$ 作为门控函数。通过使用 Competitive Gating (CG) 模块(其中 $\sigma$ 为 Softmax 函数),模型能够学习对全局周期性特征进行加权,从而使网络优先处理循环出现的 QRS complex。通过使用 Noise Gating (NG) 模块(其中 $\sigma$ 为 Sigmoid 函数),模型可执行对随机噪声的初步抑制。

这种分层 U-Net 架构使模型能够学习多尺度表征,通过压缩信号提取高层特征,再通过重构恢复微弱的心脏波形。这些门控机制的组合使模型能够系统性地放大周期性心脏信号,同时衰减不规则噪声,从而巧妙地规避了标准卷积或基于 Attention 方法的局限性。

为何采用此方法

本文作者指出,现有的深度学习解决方案与隧道磁阻(TMR)传感器的特定噪声特性之间存在根本性的失配。尽管 Transformers 或 Diffusion models(如 DeScoD)等标准方法在处理心电图(ECG)去噪(通常涉及基线漂移和肌电伪影)方面表现优异,但它们在应对 TMR 磁心电图(MCG)中固有的 $1/f$ 电噪声和非均匀频谱衰减时却显得力不从心。

方法论逻辑

作者认为,传统的“SOTA”方法之所以不足,是因为它们往往将信号去噪视为通用的序列到序列(sequence-to-sequence)任务,未能充分利用心电 QRS 波群强烈的内在周期性。研究的关键转折点在于作者观察到,标准的自注意力(Self-Attention, SA)机制引入了冗余参数(通过独立的 Query 和 Key 投影),当应用于具有特定重复结构的 MCG 信号时,会导致次优的收敛效果。

比较优势与结构性优势

MGU-Net 在多个维度上优于先前的金标准,其原因如下:

  • 门控机制与注意力的对比: 通过用门控线性单元(Gated Linear Unit, GLU)取代标准的 SA 机制,作者将计算开销大、参数密集的注意力模型转化为更高效的门控机制。GLU 定义为 $X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$,利用逐元素乘法(element-wise multiplication)充当自适应滤波器。这使得模型能够“门控”掉不规则噪声,同时放大周期性的心脏特征。
  • 分层特征提取: U-Net 架构通过实现多尺度特征学习提供了结构性优势。它既能捕捉局部波形细节(如细微的 P 波和 T 波),又能捕捉全局上下文模式(QRS 波群的节律),且避免了标准 Transformers 中全序列自注意力所带来的 $O(N^2)$ 内存复杂度瓶颈。
  • 协同设计: 该方案的核心在于两种特定门控变体的整合:
    • 噪声门控(Noise Gating, NG): 利用 Sigmoid 激活函数对随机高频噪声进行初步抑制。
    • 竞争门控(Competitive Gating, CG): 利用 Softmax 激活函数对信号进行全局加权,确保周期性的心脏特征在整个序列中获得优先处理。

替代方案失效的原因

作者明确摒弃了标准的 Transformer 类方法,因为在具有强自相关性的信号中,SA 中的冗余 $Q/K$ 投影是不必要的。与在强噪声条件下难以维持 P 波和 T 波精细形态的 GAN 或基础 CNN 不同,MGU-Net 的门控机制是专门针对 MCG 信号的周期性进行调优的。这使其性能超越了 DeScoD 和 APR-CNN,作者通过实验证明,后者在多个心动周期中均未能有效恢复 QRS 波群。

综上所述,MGU-Net 不仅仅是一个“更大”的模型,它是一种专门的架构,通过将数学运算(特别是线性投影的门控)与 TMR 传感器噪声的物理现实相匹配,实现了性能优化。该方法在真实数据集上将信噪比(SNR)从约 3.9 dB 显著提升至 14.5 dB,同时有效降低了计算负担。这证明在专业的生物医学工程任务中,量身定制的归纳偏置(inductive bias)往往比通用的高容量模型更为有效。

数学与逻辑机制

MGU-Net (Multi-Level Gated U-Net) 旨在解决通过隧道磁阻 (TMR) 传感器采集的心磁图 (MCG) 信号去噪这一关键挑战。与基于 SQUID 的系统不同,TMR 传感器虽然具有成本效益,但易受高频噪声和 $1/f$ 噪声的影响,从而掩盖了 P 波和 T 波等细微的心脏特征。

核心方程 (The Master Equation)

Gated Linear Unit (GLU) 模块的核心逻辑旨在取代标准的 Self-attention 机制,以更有效地捕捉周期性的心脏模式,其定义如下:

$$X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$$

方程解析:

  1. $X_{\text{in}}$:输入 MCG 特征序列,维度为 $T \times D$(时间步长 $\times$ 特征维度),代表原始的含噪信号片段。
  2. $f_1(\cdot; \theta_W)$ 和 $f_2(\cdot; \theta_V)$:均为可学习的线性映射(通过卷积层实现),将输入变换至两个不同的 Latent Space。
  3. $\sigma(\cdot)$:激活函数。在 "Noise Gating" (NG) 模块中,该函数为 Sigmoid,用于抑制随机噪声;在 "Competitive Gating" (CG) 模块中,该函数为 Softmax,用于计算全局门控权重。
  4. $\odot$:逐元素(Hadamard)乘积。此即“门控”机制,充当动态滤波器,其中 $f_1$ 的输出决定了 $f_2$ 所产生特征的“重要性”或“增益”。

处理流程 (Step-by-Step Flow)

  1. 输入: 10 秒的含噪 MCG 信号进入网络。
  2. Noise Gating (NG): 信号首先通过 NG 模块,该模块扩展通道维度并利用 Sigmoid 门控流水线对随机、非周期性噪声进行初步抑制。
  3. 分层编码 (Hierarchical Encoding): 信号经过四个下采样阶段。每个阶段利用 ResBlock 提取局部特征,并结合 Competitive Gating (CG) 模块学习全局周期性依赖关系。
  4. 瓶颈层 (Bottleneck): 在最深层,模型聚合高层表征,捕捉心动周期的全局节律。
  5. 解码 (Decoding): 三个上采样阶段恢复信号分辨率。来自编码器的特征通过 Skip Connections 进行拼接,以保留细粒度的时序细节(如 P 波)。
  6. 输出: 最终通过 $1 \times 1$ 卷积压缩通道,生成单一的纯净去噪 MCG 信号。

优化动力学 (Optimization Dynamics)

模型通过最小化去噪输出与 Ground Truth 信号之间的 Mean Squared Error (MSE) 进行学习,并由 Adam 优化器驱动。学习过程即网络对 GLU 模块内参数 $\theta_W$ 和 $\theta_V$ 的调整。由于 MCG 信号具有高度周期性,梯度有效地将误差信号通过门控分支进行 Backpropagation,迫使模型将其内部“门控”与心动周期的时间点对齐。这使得模型能够区分随机的非周期性噪声(被抑制)与结构化的周期性心脏信号(被保留)。

结果、局限性与结论

基于多层门控 U-Net 的 TMR 传感器 MCG 信号去噪分析

本文作者提出了 Multi-Level Gated U-Net (MGU-Net)。该架构主要包含两项核心创新:

  1. Hierarchical U-Net Backbone:该骨干网络使模型能够学习多尺度表征,从而同时捕捉全局节律模式与局部波形细节。
  2. Gated Linear Unit (GLU) Modules:不同于标准的 Self-attention,该模型采用了 GLU 模块,其定义如下:
    $$X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$$
    这种门控机制有效地充当了自适应滤波器,在抑制不规则噪声的同时,增强了周期性的心脏信号特征。

实验验证

作者将该模型与一系列基准方法进行了严苛的对比测试,包括传统的信号处理方法(FIR/IIR 滤波器、EMD、VMD)以及 SOTA 深度学习基线模型(APR-CNN、TCDAE、DeScoD)。实验结果显示 SNR 得到了显著提升,证明了其有效性。在真实数据集上,该模型达到了 $14.514$ dB 的 SNR,而表现次优的竞争模型(DeScoD)仅为 $8.3049$ dB。消融实验提供了决定性的证据:通过对 Noise Gating (NG) 和 Competitive Gating (CG) 模块进行隔离分析,证明了这两个组件之间的协同作用是性能提升的关键驱动力。

讨论与未来展望

本文成功证明了针对特定硬件领域,引入专门的架构归纳偏置(如针对周期性的门控机制)能够优于通用的深度学习模型。为进一步深化上述研究,我提出以下讨论议题:

  • 对病理信号的泛化能力:当前研究仅基于健康受试者。若应用于心律失常或心肌缺血患者,即 QRS 波群的“周期性”特征发生根本性改变时,MGU-Net 的表现如何?
  • 软硬件协同设计 (Hardware-Algorithm Co-design):鉴于噪声分布具有 TMR 传感器的特异性,是否可以通过将物理传感器噪声模型直接纳入 Loss Function 来进一步提升性能?
  • 临床实时集成:尽管推理速度表现优异($5.06$ ms),但临床部署仍需对模型的 Uncertainty 进行严格验证。
Table 2. Ablation studies of the proposed model on the simulated and real MCG datasets. The impact of Competitive Gating (CG) and Noise Gating (NG) modules are evaluated Table 1. Comparison on the Simulated and MCG Real Datasets

与其他领域的同构

基于多层门控 U-Net 的 TMR 传感器 MCG 信号去噪分析

背景知识

心磁图(Magnetocardiography, MCG)是一种记录心脏电活动所产生磁场的无创技术。尽管基于 SQUID 的系统被视为行业金标准,但由于其必须依赖低温冷却系统,导致成本极其高昂(通常约为 100 万美元)。隧道磁阻(TMR)传感器提供了一种经济高效的室温替代方案,但其噪声水平显著较高,尤其是 $1/f$ 噪声,这会掩盖 P 波和 T 波等关键心脏特征。当前面临的挑战在于如何从 TMR 硬件固有的高振幅、非平稳噪声中分离出这些细微的周期性生物信号。

动机与约束

本研究的主要动机在于利用低成本的 TMR 硬件实现临床级 MCG 诊断。作者面临两大主要约束:
1. 信号复杂性: MCG 信号是包含多个心动周期的长序列,直接处理会导致计算成本过高。
2. 噪声特性: 与 ECG 噪声(通常为基线漂移或肌电伪影)不同,基于 TMR 的 MCG 噪声主要由具有非均匀频谱衰减的 $1/f$ 电噪声主导,这使得标准滤波技术难以奏效。

数学解释

作者通过 U-Net 架构将含噪输入信号 $X_{\text{in}} \in \mathbb{R}^{T \times D}$ 映射为纯净输出信号 $X_{\text{out}}$,从而解决去噪问题。其核心创新在于使用门控线性单元(Gated Linear Unit, GLU)替代标准的 Self-attention 机制,以充分利用心脏信号固有的周期性。GLU 定义如下:
$$X_{\text{out}} = \sigma (f_1(X_{\text{in}}; \theta_W)) \odot f_2(X_{\text{in}}; \theta_V)$$
其中 $f_1$ 和 $f_2$ 为可学习的线性投影,$\sigma$ 为激活函数(噪声门控使用 Sigmoid,竞争性门控使用 Softmax),$\odot$ 表示逐元素乘法(element-wise multiplication)。通过该门控机制,网络能够学习对信号进行动态加权,在放大周期性心脏特征的同时抑制非周期性噪声。这种方法既避免了 Self-attention 的参数冗余,又能有效捕获长距离依赖关系。


结构骨架

一种分层门控机制,通过逐元素调制(element-wise modulation)利用信号潜在的时间周期性来过滤非周期性噪声。

跨领域关联

  1. 目标领域:量化金融(高频交易)
  2. 关联性: 在市场数据中,“信号”是潜在的价格趋势,而“噪声”则是高频微观结构波动。MGU-Net 的逻辑与波动率调整后的趋势跟踪算法互为镜像,其中 GLU 充当动态滤波器,通过“门控”过滤市场噪声,从而分离出真实的价格走势。
  3. 目标领域:深空通信(信号处理)
  4. 关联性: 深空探测器在遥远距离传输数据时,信号往往淹没在宇宙背景辐射中。MGU-Net 从 TMR 噪声中恢复 P 波的方法,与从星际空间混沌、高熵背景中提取微弱周期性遥测脉冲的逻辑结构完全一致。

“假设”场景

如果量化金融研究人员“借鉴”这一方程,他们可能会开发出一种“门控市场网络”(Gated Market-Net)。通过将价格行为视为周期性信号(结合日内或盘中周期),该模型有望过滤掉“微观噪声”(随机游走波动),从而以极高的清晰度识别机构吸筹模式。这将有望在预测当前标准移动平均滤波器无法捕捉的短期价格反转方面取得突破。

对通用结构库的贡献

本文证明了“门控周期性”(gated periodicity)的数学模式是一种通用的信号恢复工具,证实了用于清洗心跳信号的逻辑同样适用于任何隐藏在随机混沌海洋中的结构化、重复性事件系统。