Communications Physics

通过输入态设计增强变分量子算法的可达性

Design smarter inputs to unlock deeper insights & boost accuracy in quantum algorithms.

研究领域 Quantum Computing

Article Type Research analysis

Authors Wu et al.

Original Paper Published 2026-04-07

ISOM Posted 2026-04-07 12:22 UTC

Read Time 29M

Open PDF Open DOI Open Source Page

Editorial Disclosure

ISOM follows an editorial workflow that structures the source paper into a readable analysis, then publishes the summary, source links, and metadata shown on this page so readers can verify the original work.

The goal of this page is to help readers understand the paper's core question, method, evidence, and implications before opening the original publication.

背景与学术渊源

起源与学术渊源

本文所解决的问题源于量子计算领域蓬勃发展的背景，特别是在含噪声中等规模量子（NISQ）器件的语境下。量子计算机在解决经典计算机难以处理的问题方面展现出巨大潜力，但当前的 NISQ 硬件在初始化、操作和读出方面存在不完善之处。这些近期设备面临的一个核心挑战是展示“量子优势”——即比经典计算机更高效地解决实际问题。

变分量子算法（VQAs）应运而生，成为应对这一挑战的主要方法。VQAs 大约于 2014 年首次引入，以变分量子本征求解器（VQE）[20, 104, 105] 为代表，它们将复杂的计算任务框架化为优化问题。核心思想是通过最小化成本函数 $E(\theta)$ 来近似一个期望的量子态，通常是物理系统哈密顿量 $H$ 的基态。这通过制备一个参数化的量子态来实现，称为“ansatz 态” $|\Psi(\theta)\rangle = U(\theta)|\Psi_0\rangle$。其中，$U(\theta)$ 是一个具有可调参数 $\theta$ 的量子电路，$|\Psi_0\rangle$ 是一个初始输入态，传统上是一个简单的乘积态，如 $|0\rangle^{\otimes n}$。然后，经典优化器会迭代地调整 $\theta$ 以最小化 $E(\theta)$。

先前 VQA 方法的基本限制或“痛点”在于“表达能力”（电路能产生的状态范围）与“可训练性”（参数易于优化的程度）之间的权衡。更深、更具表达能力的电路理论上可以达到更广泛的量子态，但它们极易受到噪声累积和臭名昭著的“无梯度区域”（barren plateau）问题的影响，即优化景观变得极其平坦，导致训练不可能。相反，浅层电路更易于训练且不易受噪声影响，但它们通常具有“可达集合不足”——这意味着目标量子态 $|\Psi_{\text{tar}}\rangle$ 根本不在电路能够产生的状态之列，无论参数 $\theta$ 如何完美调整。

历史上，大多数改进 VQA 的研究工作几乎完全集中在设计更好的 ansatz 电路 $U(\theta)$ 上。策略包括硬件高效型 ansatz（HEA）、哈密顿量变分 ansatz（HVA）和自适应电路等。然而，初始输入态 $|\Psi_0\rangle$ 在确定可达集合中的作用受到的关注相对较少。这种疏忽意味着，即使有一个设计良好的电路 $U(\theta)$，如果目标态超出了由固定输入态定义的可达集合，算法也将不可避免地收敛到次优近似。本文旨在通过专注于输入态设计来解决这个问题，从而在不增加电路深度或参数数量的情况下增强可达集合，为现有的电路设计策略提供有力的补充。

直观的领域术语

变分量子算法（VQAs）：想象一下，你正在尝试使用一个新颖但有些挑剔的烤箱来找到制作一道复杂菜肴的最佳食谱。VQA 就像一个“智能试错”过程：你从一个基本食谱（具有初始设置的量子电路）开始，烘烤它，品尝结果（测量成本函数），然后根据味道调整食谱的设置（电路参数）。你重复这个循环，直到菜肴达到你的烤箱所能达到的最佳状态。
含噪声中等规模量子（NISQ）设备：这些就像是超级快速、复杂计算器的早期原型。它们可以执行普通计算器无法完成的惊人计算，但它们仍然有些错误，会产生小错误，并且在错误堆积之前只能处理有限数量的步骤。这些是我们目前拥有的量子计算机，在拥有完全纠错的“容错”机器之前。
无梯度区域（Barren Plateaus）：想象一下你在一个广阔、平坦的沙漠中迷失了方向，试图找到最低点。无论你望向何处，地形似乎都完全平坦，让你无法分辨哪个方向是下坡。在 VQA 中，这描述了一个优化问题，其中可能解决方案的“景观”变得如此平坦，以至于经典优化器找不到任何梯度可以遵循，实际上陷入停滞，阻止算法找到最佳参数。
可达集合（Reachable Set）：将其视为给定固定一组原料和特定烹饪方法时，特定烹饪过程可以产生的所有可能结果的“菜单”。如果期望的结果（例如，完美烘烤的蛋糕）不在该菜单上，那么无论你如何调整烤箱的温度或时间，你都无法制作出来。在 VQA 中，它是给定量子电路可以生成的所有量子态的集合。
Ansatz：这是量子电路的“模板”或“蓝图”。它定义了量子门和操作的通用结构，但具有可调的“旋钮”（参数）可以进行调整。不同的 ansatz 设计就像不同类型的引擎——有些对某些任务更有效，有些更强大，但所有都有可调部件。

符号表

符号	描述
$\|\Psi_{\text{tar}}\rangle$	目标量子态，VQA 旨在近似（例如，哈密顿量的基态）。
$H$	量子系统的可观测量或哈密顿量，其期望值被最小化。
$\|\Psi(\theta)\rangle$	由 ansatz 电路 $U(\theta)$ 生成的参数化量子态。
$U(\theta)$	酉型 ansatz 电路，一系列具有可调参数 $\theta$ 的量子门。
$\|\Psi_0\rangle$	ansatz 电路的初始输入态，通常是 $\|0\rangle^{\otimes n}$ 这样的简单乘积态。
$E(\theta)$	成本函数，由经典优化器最小化以找到最优参数。
$\theta$	ansatz 电路 $U(\theta)$ 的可调参数向量。
$\theta_{\text{opt}}$	通过最小化成本函数 $E(\theta)$ 找到的最优参数。
$V(\gamma)$	编码器电路，一个用于制备设计输入态的附加参数化电路。
$\|\Psi_0(\gamma)\rangle$	设计的输入态，是候选态的叠加，由编码器 $V(\gamma)$ 制备。
$\gamma$	编码器电路 $V(\gamma)$ 的可调参数向量。
$F$	保真度，衡量生成量子态与目标态接近程度的度量，定义为 $F = \|\langle\Psi\|\Psi_{\text{tar}}\rangle\|^2$。
$m$	用于构建设计输入态的选定相互正交态的数量。
$M$	在预选阶段采样的计算基态总数。
$n$	量子系统中的量子比特数。

问题定义与约束

核心问题表述与困境

在变分量子算法（VQAs）的领域中，本文所解决的核心问题围绕着目标量子态的“可达性”有限性。

输入/当前状态：VQA 的起点通常是一个参数化量子态 $|\Psi(\theta)\rangle = U(\theta)|\Psi_0\rangle$。其中，$U(\theta)$ 代表一个具有可调参数 $\theta$ 的酉量子电路，而 $|\Psi_0\rangle$ 是一个简单、通常固定的初始输入态（例如，计算基态 $|0\rangle^{\otimes n}$）。目标是通过最小化成本函数来找到一组最优参数 $\theta_{\text{opt}}$，使得产生的状态 $|\Psi(\theta_{\text{opt}})\rangle$ 能够精确地近似一个期望的目标量子态 $|\Psi_{\text{tar}}\rangle$。例如，在变分量子本征求解器（VQE）中，$|\Psi_{\text{tar}}\rangle$ 是给定哈密顿量 $H$ 的基态。

期望终点/目标状态：最终目标是实现目标态 $|\Psi_{\text{tar}}\rangle$ 的高保真度近似，这意味着 $|\langle\Psi_{\text{tar}}|\Psi(\theta_{\text{opt}})\rangle|^2$ 应接近于 1。这表明目标态必须包含在 ansatz $U(\theta)$ 从输入态 $|\Psi_0\rangle$ 生成的状态的“可达集合”中。

缺失环节/数学鸿沟：关键的缺失环节是，当从一个固定的、简单的输入态 $|\Psi_0\rangle$ 开始时，目标态 $|\Psi_{\text{tar}}\rangle$ 可能不包含在 $U(\theta)$ 的可达集合中。如果 $|\Psi_{\text{tar}}\rangle$ 超出了这个集合，无论如何优化电路参数 $\theta$，VQA 都无法达到它，导致无论计算多少努力都无法获得最优结果。本文旨在通过引入一个设计输入态 $|\Psi_0(\gamma)\rangle$ 来弥合这一差距，该状态由一个附加的参数化编码器电路 $V(\gamma)$ 制备，使得 $U(\theta)|\Psi_0(\gamma)\rangle$ 的可达集合被修改以包含 $|\Psi_{\text{tar}}\rangle$。数学上，本文旨在通过联合优化 $\theta$ 和 $\gamma$ 来最大化保真度 $F = |\langle\Psi_{\text{tar}}|U(\theta)V(\gamma)|0\rangle^{\otimes n}|^2$。定理 1 提供了一个严格的基础，表明正交输入态的线性叠加可以系统地增强可实现的保真度。

困境：VQA 中一个核心的困境，它困扰着先前的研究者，是“表达能力”与“可训练性”之间痛苦的权衡。
* 表达能力：更深的量子电路（具有更多层或门）通常更具表达能力，这意味着它们原则上可以达到更广泛的量子态，包括潜在的目标态。
* 可训练性：然而，增加电路深度通常会导致“无梯度区域”，其中成本函数的梯度呈指数级减小，使得经典优化极其困难或不可能。这阻止了算法收敛到最优参数。
* 反之，浅层电路更易于训练且不易受无梯度区域的影响，但它们通常具有不足的可达性，这意味着它们有限的表达能力阻止它们近似复杂的目标态。

先前的工作主要集中在设计酉电路 $U(\theta)$。本文提出通过关注输入态 $|\Psi_0\rangle$ 来解决这一困境，旨在增强可达性而不显著增加电路深度或遭受无梯度区域的影响。

约束与失效模式

增强 VQA 可达性的问题由于几个严峻的现实约束而变得异常困难：

硬件内存限制与噪声累积（物理/计算）：近期量子计算机（NISQ 设备）的量子比特数量有限，相干时间短，且易受噪声影响。更深的电路虽然可能更具表达能力，但会累积更多噪声，导致错误并使输出不可靠。这对可以执行的量子电路的实际深度施加了严格的物理限制。
无梯度区域（计算/数学）：这是一个基本的数学约束，其中深层、随机初始化的 VQA 的成本函数景观变得极其平坦。梯度随量子比特数量呈指数级消失，使得经典优化无效，并阻止收敛到真正的最小值。这种现象严重限制了具有表达能力的电路的可训练性。
固定输入态的可达性有限（数学）：对于给定的 ansatz $U(\theta)$ 和一个简单、固定的输入态 $|\Psi_0\rangle$（如 $|0\rangle^{\otimes n}$），可达状态的集合可能非常小。如果目标态 $|\Psi_{\text{tar}}\rangle$ 位于此“可达集合”之外，那么无论如何调整 $U(\theta)$ 的参数，都无法实现期望的保真度。ansatz 态 $|\Psi(\theta)\rangle$ 的可达集合本质上受初始状态的约束。
输入态设计中的计算成本（计算/数据驱动）：虽然提出的输入态设计提供了一种解决方案，但它也带来了自身的开销：
- 采样预算 ($M$)：该方法需要采样 $M$ 个计算基态来识别输入叠加的潜在候选者。如果 $M$ 过大（例如，对于 $n$ 个量子比特为 $2^n$），则此预选步骤将变得经典上难以处理，尤其对于较大的系统。本文旨在将 $M$ 保持在适中水平。
- 编码器电路深度 ($m$)：编码器 $V(\gamma)$ 会增加总电路深度。虽然设计为低深度，但增加 $m$（叠加中选定基态的数量）会增加 $V(\gamma)$ 的复杂性和门成本，从而消耗更多量子资源。
- 经典优化开销：对 ansatz 参数 $\theta$ 和编码器参数 $\gamma$ 进行联合优化会增加经典计算成本。本文试图通过限制联合训练的优化迭代次数来缓解这一问题。
硬件高效型 ansatz 的低效参数化（算法）：硬件高效型 ansatz（HEA）灵活且可适应各种硬件平台，但它们通常缺乏问题特定的结构。这可能导致低效的参数化，使其容易出现优化挑战，如无梯度区域，尤其是在更深的配置中。

Figure 1. Representative variational quantum ansatz. (a) Hardware-eﬃcient ansatz (HEA). Each layer consists of alternating single-qubit rotations Ry and Rz followed by a chain of CZ gates. The dashed box indicates one circuit layer, which is repeated p times. (b) General Hamiltonian variational ansatz (HVA). Each layer contains a product of unitaries Qq k=1 e−iθkHk, where {Hk} are problem-speciﬁc Hamiltonian terms. (c-e) Examples of HVA design for three diﬀerent models. (c) For the transverse-ﬁeld Ising model. An initial layer of Hadamard gates H prepares |+⟩⊗n. UZZ(θ) = e−i(θ/2) σz i σz j represents the two-qubit gate for ZZ interaction, while Rx(θ) = e−iθ σx i represents the single- qubit X-rotation. (d) For the cluster-Ising model. UZXZ(θ) = e−i(θ/2) σz i σx j σz k is a three-qubit gate, and UXX(θ) = e−i(θ/2) σx i σx j is a two-qubit gate. (e) For the Fermi-Hubbard model. The upper (lower) register encodes spin-↑(spin- ↓). On-site interactions between the two spins at site i are implemented as UZZ(θ). Hopping terms on odd and even bonds are realized by UXY (θ) = e−i(θ/2) (σx i σx i+1+σy i σy i+1)

为什么选择这种方法

选择的必然性

本工作所解决的核心问题是变分量子算法（VQAs）中电路表达能力与可训练性之间固有的权衡。传统的“最先进”（SOTA）方法主要关注设计酉电路 $U(\theta)$ 本身。然而，正如作者们清楚阐述的那样，通过使用更深的电路来增加 $U(\theta)$ 的表达能力会导致显著的挑战，例如噪声累积和臭名昭著的无梯度区域问题，这阻碍了经典优化（摘要，第 2 页；引言，第 4 页）。相反，浅层电路虽然易于训练且不易受噪声影响，但通常具有不足的“可达集合”，这意味着期望的目标态 $|\Psi_{tar}\rangle$ 可能根本无法访问，无论电路参数 $\theta$ 如何优化（第 4 页，图 2）。

当作者们观察到，即使经过广泛优化，现有的 VQA ansatz 也会在约 0.95 的保真度处达到平台期，并且增加电路深度或训练迭代次数几乎没有或根本没有带来改进，因为存在固有的 ansatz 限制或无梯度区域的出现（第 9 页），他们意识到这些传统的以电路为中心的方法是不够的。这一关键观察强调，问题不仅仅在于如何演化状态，而在于从何处开始演化。如果目标态超出了从标准输入 $|0\rangle^{\otimes n}$ 开始的 $U(\theta)$ 的初始可达集合，那么无论如何优化电路，都永远无法达到它（第 6 页）。这一认识使得输入态设计成为在不诉诸更深、更具问题性的电路或从根本上改变 ansatz 结构的情况下，增强可达性的唯一可行解决方案。在固定电路深度和结构下，这种方法成为克服表达能力瓶颈的必然选择（第 9 页）。

相对优越性

该方法通过提供一个强大的、互补的框架来增强现有 VQA ansatz 的性能，而不是取代它们，从而展现出定性的优越性。其结构优势在于，它能够通过设计一个更合适的输入态 $|\Psi_0(\gamma)\rangle$ 来重塑任何给定 VQA ansatz $U(\theta)$ 的可达集合，而不是仅仅修改 ansatz 电路本身。这是通过一个低深度的“编码器”电路 $V(\gamma)$ 实现的，该电路制备了候选态的叠加（第 4 页，图 2）。

关键优势在于：
1. 增强的可达性和准确性：通过从精心设计的输入态开始，该方法确保目标态对现有的 $U(\theta)$ 电路是可访问的。这导致在相同的门预算下，与标准方法相比，保真度始终更高，基态能量估计更准确（摘要，第 2 页；第 9 页）。例如，在 1D 横向场伊辛模型中，该方法仅用 8 层就实现了 0.99 的保真度，与传统硬件高效型 ansatz（HEA）所需的 12 层相比，深度减少了 33%（第 4 页，第 10 页）。在 2D 伊辛和簇伊辛模型中也观察到了类似的增益（第 4 页）。
2. 资源效率：输入态设计显著减少了量子和经典资源。它降低了达到目标保真度所需的门数量（例如，112 个 CNOT 门 vs. HEA 的 144 个）和优化工作量（1100 步 vs. HEA 的 1500 步）（第 11 页）。编码器 $V(\gamma)$ 本身是一个低深度电路，其门成本与基线 ansatz 的单层相当，确保了总体开销最小且可控（第 6 页，第 10 页，第 17 页）。
3. 广泛适用性：由于该方法修改了输入态并保持参数化电路 $U(\theta)$ 不变，因此它广泛适用于不同的 ansatz 系列，包括 HEA 和哈密顿量变分 ansatz（HVA）（第 4 页）。这种通用性使其成为提高 VQA 性能的通用工具。
4. 理论基础：定理 1 提供了一个严格的数学基础，证明了正交输入态线性组合的可实现基态保真度与各个保真度之和相关，从而证明了选择与目标态具有更大重叠的候选态的策略的合理性（第 6-7 页）。

本文没有明确讨论如何更好地处理高维噪声或将内存复杂度从 $O(N^2)$ 降低到 $O(N)$。其优越性主要在于在严格的资源约束下提高表达能力和可达性，从而以更少的量子和经典资源实现更高的保真度。

与约束的对齐

所选择的输入态设计方法完美地符合近期量子计算的严苛要求，特别是与含噪声中等规模量子（NISQ）设备相关的要求。问题约束与解决方案独特属性之间的“结合”在几个方面显而易见：

约束：有限的电路深度和噪声累积：NISQ 设备极易受噪声影响，噪声会随着电路深度的增加而累积。更深的电路还会加剧无梯度区域，使优化变得困难。
- 对齐：该方法通过避免更深的电路直接解决此问题。它不是增加 $U(\theta)$ 的深度，而是修改输入态以移动可达集合，从而使更浅的电路能够实现更高的保真度。例如，它以 8 层实现了 0.99 的保真度，而传统 HEA 需要 12 层才能达到相同的保真度，代表了电路深度的显著减少（第 4 页，第 10 页）。编码器本身是低深度的，确保它只适度地增加了总电路深度（第 6 页）。
约束：固定的门预算和资源限制：实际的 NISQ 应用要求解决方案在量子门和经典优化步骤的受限预算内运行。
- 对齐：输入态设计本质上是资源高效的。它减少了达到目标保真度所需的总门数量和优化步骤（第 11 页）。编码器的门成本与基线 ansatz 的单层相当，确保了额外的量子开销最小且可控（第 10 页，第 17 页）。这允许“可扩展且资源高效的保真度增强”（第 9 页）。
约束：浅层电路的可达性不足：浅层 VQA 的一个主要限制是目标态可能超出了从标准输入态（如 $|0\rangle^{\otimes n}$）可达的状态集合。
- 对齐：这是该方法解决的核心问题。通过制备一个精心设计的输入态 $|\Psi_0(\gamma)\rangle$ 作为选定基态的叠加，该方法重新配置了固定 ansatz $U(\theta)$ 的可达集合以包含目标基态（第 9 页，图 2）。这确保了即使是浅层 $U(\theta)$ 现在也可以访问期望的状态，从而在不增加电路复杂性的情况下克服了表达能力的瓶颈。

本质上，该方法通过在浅层电路和固定门预算的限制内工作，而不是试图通过要求更多量子资源来克服它们，从而尊重了 NISQ 的“严苛要求”。它通过优化量子演化的起点提供了一个巧妙的解决方案。

替代方案的拒绝

本文对替代方案的拒绝主要是一种隐含的拒绝，侧重于现有 VQA 改进策略的局限性，而不是与生成任务的量子生成对抗网络（GANs）或扩散模型等完全不同的量子算法进行直接比较。作者们强调，“大多数改进 VQA 的努力都集中在 $U(\theta)$ 的电路设计上”（第 4 页）。这些以电路为中心的方法虽然有价值，但被证明对于在固定资源约束下增强可达性的特定问题是不够的。

拒绝这些仅限于电路的替代方案的理由如下：
1. 表达能力与可训练性之间的权衡：通过使电路更深（例如，在 HEA 或 HVA 中使用更多层）来增加 $U(\theta)$ 的表达能力，会导致噪声累积和无梯度区域，使优化过程变得困难或不可能（第 4 页）。这意味着虽然更深的电路理论上可以达到更多的状态，但它们在实践中变得不可训练。
2. 浅层电路的可达性有限：相反，保持电路浅层以维持可训练性和减轻噪声，通常会导致目标态超出了 ansatz 的可达集合（第 4 页）。这是输入态设计直接解决的基本限制。
3. 固定门预算下的效率低下：本文明确证明，在相同的门预算（例如，总层数或 CNOT 门数）下，传统的 HEA 或 HVA 在实现高保真度方面效率较低（第 4 页，第 10 页，第 11 页）。这表明，仅优化 $U(\theta)$ 本身，而不考虑输入态，在实现高保真度方面的资源利用效率较低。

因此，本文并非论证其他方法完全失败，而是认为它们在固定资源预算下对于改进 VQA 可达性是不足或次优的。输入态设计被呈现为电路设计的必要补充，解决了传统方法在固定资源预算下无法有效解决的一个被忽视的方面。

Figure 2. Reachable sets modiﬁed through input-state design. For a ﬁxed uni- tary U(θ), a simple input state |Ψ0⟩induces a reachable set (red-shaded) that excludes the target |Ψtar⟩, causing optimization to converge to a suboptimal state |Ψ′(θ)⟩(blue path). By contrast, a designed input state |Ψ0(γ)⟩, pre- pared by the encoder V(γ), produces a diﬀerent reachable set (green-shaded) that contains |Ψtar⟩, enabling the same U(θ) to reach the target (red path)

数学与逻辑机制

主方程

本文提出的增强型变分量子算法（VQA）的核心方程是能量最小化的目标函数，它同时包含了变分 ansatz 和新引入的输入态编码器。该函数相对于两个组件的参数进行联合优化：

$$ E(\theta,\gamma) = \langle 0|V^\dagger(\gamma)U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle $$

按项解剖

让我们仔细分析这个方程，以理解每个组件的数学定义、物理/逻辑作用以及其包含和操作的原理。

$E(\theta,\gamma)$：
- 数学定义：该项代表哈密顿量 $H$ 相对于量子态 $|\Psi(\theta,\gamma)\rangle = U(\theta)V(\gamma)|0\rangle^{\otimes n}$ 的期望值。
- 物理/逻辑作用：这是变分量子本征求解器（VQE）的成本函数。算法的主要目标是最小化这个能量期望值。在量子力学中，哈密顿量的最小期望值对应于系统的基态能量，而实现该最小值的状态就是基态本身。
- 为什么是这个算符？ 期望值 $\langle\Psi|H|\Psi\rangle$ 是量子力学中计算给定状态 $|\Psi\rangle$ 下系统平均能量的基本量。最小化该值是 VQE 寻找基态的标准且最直接的方法。
$|0\rangle^{\otimes n}$：
- 数学定义：这表示所有 $n$ 个量子比特都设置为 $|0\rangle$ 状态的初始计算基态。
- 物理/逻辑作用：这是大多数量子电路的标准的、易于制备的、非纠缠的起始状态。它作为所有后续量子操作开始的“空白画布”。
- 为什么是这个算符？ 它是最简单、最常见的初始状态，为量子计算提供了一个通用且可重现的起点。
$V(\gamma)$：
- 数学定义：一个参数化的酉算符，称为“编码器”电路。它接收初始状态 $|0\rangle^{\otimes n}$ 并将其转换为设计输入态 $|\Psi_0(\gamma)\rangle$。参数 $\gamma$ 是一组可调的经典值，控制着该电路中的特定门和旋转。
- 物理/逻辑作用：该算符是本文的核心创新。它的作用是为后续的 VQA ansatz 制备一个“更智能”或更有利的初始状态。通过修改输入态，它有效地重塑了主 ansatz 可以达到的状态集合，使得目标态更容易访问。它被设计成一个低深度的电路，以保持效率。
- 为什么是这个算符？ 它是一个酉算符，因为量子演化必须是酉的，以保持概率并符合量子力学原理。它是参数化的，以便进行灵活的优化和适应不同问题，从而能够设计出针对手头问题量身定制的输入态。
$U(\theta)$：
- 数学定义：一个参数化的酉算符，代表“ansatz”电路。它接收输入态 $|\Psi_0(\gamma)\rangle$（或在常规 VQA 中是 $|\Psi_0\rangle$）并将其转换为变分态 $|\Psi(\theta,\gamma)\rangle$。参数 $\theta$ 是一组可调的经典值，控制着该电路中的门。
- 物理/逻辑作用：这是主要的变分量子电路，它试图近似目标量子态（例如，哈密顿量的基态）。它的表达能力决定了它在希尔伯特空间中可以生成和探索的量子态范围。
- 为什么是这个算符？ 与 $V(\gamma)$ 一样，它必须是酉的，才能在量子计算机上实现。它的参数化允许迭代优化以找到目标态的最佳近似。 $U(\theta)$ 的具体结构（例如，硬件高效型 ansatz 或哈密顿量变分 ansatz）根据问题和可用硬件选择。
$H$：
- 数学定义：物理系统的哈密顿量算符。它是一个厄米算符，意味着 $H = H^\dagger$。
- 物理/逻辑作用：该算符代表量子系统的总能量。在 VQE 的背景下，目标是找到最小化该哈密顿量期望值的量子态，这对应于系统的基态。
- 为什么是这个算符？ 哈密顿量是量子力学中描述系统能量及其时间演化的基本算符。其期望值是 VQE 旨在最小化的量。
$U^\dagger(\theta)$：
- 数学定义：酉算符 $U(\theta)$ 的厄米共轭（或伴随）。由于 $U(\theta)$ 是酉的，所以 $U^\dagger(\theta) = U^{-1}(\theta)$。
- 物理/逻辑作用：该算符“撤销”了 $U(\theta)$ 执行的变换。在期望值中，它从左侧作用于状态 $H U(\theta)V(\gamma)|0\rangle$，有效地将其投影回由 $V(\gamma)|0\rangle$ 定义的空间。
- 为什么是这个算符？ 它是形成左矢向量 $\langle\Psi|$ 的关键部分。如果 $|\Psi\rangle = U(\theta)V(\gamma)|0\rangle$，那么 $\langle\Psi| = \langle 0|V^\dagger(\gamma)U^\dagger(\theta)$。这是计算期望值的数学必需。
$V^\dagger(\gamma)$：
- 数学定义：酉算符 $V(\gamma)$ 的厄米共轭（或伴随）。由于 $V(\gamma)$ 是酉的，所以 $V^\dagger(\gamma) = V^{-1}(\gamma)$。
- 物理/逻辑作用：与 $U^\dagger(\theta)$ 类似，该算符“撤销”了 $V(\gamma)$ 执行的变换。它从左侧作用于状态 $U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle$。
- 为什么是这个算符？ 它完成了左矢向量 $\langle\Psi|$ 的形成，确保了期望值的正确计算。
$\langle 0| \dots |0\rangle$：
- 数学定义：这表示状态 $V^\dagger(\gamma)U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle$ 与初始状态 $|0\rangle^{\otimes n}$ 的内积。
- 物理/逻辑作用：整个表达式 $\langle 0| \dots |0\rangle$ 计算期望值。在量子力学中，可观测量值的期望值是通过将可观测量“夹”在状态及其共轭转置之间来获得的。这就是如何测量系统的平均能量。
- 为什么是这个算符？ 内积是用于将一个量子态投影到另一个态，或计算一个态在另一个态中的概率幅的数学运算。在这里，它用于计算 $H$ 的期望值。
为什么是乘法而不是加法？ 算符 $V(\gamma)$、$U(\theta)$、$H$、$U^\dagger(\theta)$ 和 $V^\dagger(\gamma)$ 是相乘的，因为它们代表了量子态上的顺序操作。在量子力学中，将多个门或算符应用于一个状态，是通过按照应用顺序乘以它们对应的矩阵来表示的。首先，$V(\gamma)$ 作用于 $|0\rangle^{\otimes n}$，然后 $U(\theta)$ 作用于结果状态，然后 $H$ 作用于该状态，最后左矢向量 $\langle 0|V^\dagger(\gamma)U^\dagger(\theta)$ 从左侧作用以计算期望值。这种操作序列是量子电路功能的基础。
为什么是求和而不是积分？ 当在量子计算机上测量期望值时，它涉及对测量结果的求和。对于离散的计算基态集合，期望值本质上是概率与可观测量特征值加权的求和。积分将用于连续变量，而这些变量通常不是 VQA 在当前硬件上的直接输出。

分步流程

想象一个抽象的量子态，最初是一个纯净的 $|0\rangle^{\otimes n}$，通过一个复杂精密的量子装配线，最终成为目标基态的一个高度优化的近似。

初始状态输入：过程始于量子系统被制备成简单、非纠缠的计算基态 $|0\rangle^{\otimes n}$。这是进入装配线第一阶段的“原材料”。
编码器预处理：这个原始的 $|0\rangle^{\otimes n}$ 状态首先进入“编码器”电路 $V(\gamma)$。该电路由其参数 $\gamma$ 控制，作用类似于一个专门的预处理器。它应用一系列精心选择的单量子比特和多量子比特门（旋转、纠缠操作）来将简单的 $|0\rangle^{\otimes n}$ 转换为一个更复杂、“设计的输入态” $|\Psi_0(\gamma)\rangle$。这一步类似于在原材料进入主要制造过程之前，将其塑造成一种特定、有利的形式。目标是确保这个预处理过的状态已经“更接近”了庞大量子态空间中期望的最终产品。
Ansatz 主变换：设计输入态 $|\Psi_0(\gamma)\rangle$ 然后进入主要的“ansatz”电路 $U(\theta)$。这是核心的变分引擎，由 $\theta$ 参数化。它应用另一系列量子门，进一步将 $|\Psi_0(\gamma)\rangle$ 转换为最终的变分态 $|\Psi(\theta,\gamma)\rangle = U(\theta)|\Psi_0(\gamma)\rangle$。这是主要的制造阶段，状态被迭代地精炼，以尽可能精确地近似目标基态。
能量测量（概念性）：一旦状态 $|\Psi(\theta,\gamma)\rangle$ 被制备出来，它并不是直接在时间演化意义上被哈密顿量 $H$“作用”。相反，它的能量被测量。这涉及到将哈密顿量 $H$ 分解为一组可测量的 Pauli 项之和。对于每一项，量子计算机对 $|\Psi(\theta,\gamma)\rangle$ 执行测量，以获得其期望值。
期望值聚合：然后，这些测量结果被经典地聚合。通过对哈密顿量中各项的系数加权，对各个 Pauli 项的测量期望值进行求和，计算出期望值 $E(\theta,\gamma)$。这个最终的数值 $E(\theta,\gamma)$ 代表了当前变分态的“质量得分”，表明其能量与真实基态能量的接近程度。这完成了量子-经典循环的一次传递。

优化动力学

该机制通过一个混合量子-经典优化循环进行学习、更新和收敛，旨在找到最小化能量期望值 $E(\theta,\gamma)$ 的最优参数 $(\theta_{\text{opt}}, \gamma_{\text{opt}})$。

两阶段优化策略：学习过程分为两个主要阶段，以管理复杂性和提高效率：
- Ansatz 的预训练：最初，仅优化 ansatz 电路 $U(\theta)$。这包括从一个简单的输入态（例如 $|0\rangle^{\otimes n}$）开始，并迭代地调整 $\theta$ 以最小化 $E(\theta) = \langle 0|U^\dagger(\theta) H U(\theta)|0\rangle$。经典优化器（如梯度下降或无梯度方法）探索由 $E(\theta)$ 定义的损失景观。优化器计算（或估计）梯度 $\nabla_\theta E(\theta)$ 以确定最陡下降方向，引导参数 $\theta$ 朝向局部最小值。此阶段持续进行，直到梯度范数低于预定阈值，表明达到稳定点，并产生一组预优化的参数 $\tilde{\theta}_{\text{opt}}$。此步骤对于为给定电路建立基线性能至关重要。
- 编码器和 Ansatz 的联合优化：预训练后，启动输入态设计机制。采样一组 $M$ 个计算基态，并使用预训练的 ansatz $U(\tilde{\theta}_{\text{opt}})$ 估计它们的能量。从该池中选择 $m$ 个“有希望的”状态（包括 $|0\rangle^{\otimes n}$）来构成新输入态的叠加基础。然后构建编码器电路 $V(\gamma)$ 以制备这些 $m$ 个状态的叠加作为新的输入态 $|\Psi_0(\gamma)\rangle$。现在，考虑完整的电路 $U(\theta)V(\gamma)$，并联合优化两组参数 $\theta$ 和 $\gamma$，以最小化 $E(\theta,\gamma) = \langle 0|V^\dagger(\gamma)U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle$。参数 $\theta$ 使用 $\tilde{\theta}_{\text{opt}}$ 初始化，而参数 $\gamma$ 通常随机初始化。
梯度行为与损失景观：
- 在优化过程中，经典优化器根据计算出的梯度 $\nabla_\theta E(\theta,\gamma)$ 和 $\nabla_\gamma E(\theta,\gamma)$ 迭代地更新 $\theta$ 和 $\gamma$。这些梯度指示了能量景观相对于每个参数的斜率。然后，参数将沿着与梯度相反的方向调整，以降低能量。
- VQA 的损失景观可能非常复杂，通常以大量局部最小值和“无梯度区域”为特征，这些区域的梯度随量子比特数量呈指数级消失，阻碍了收敛。
- 本文的关键见解是，通过 $V(\gamma)$ 设计输入态可以有效地重塑这个损失景观。通过从一个更有利的初始状态 $|\Psi_0(\gamma)\rangle$ 开始 ansatz $U(\theta)$，$U(\theta)$ 的可达集合被移动。这种移动可以将能量景观的全局最小值移到一个更容易被优化器访问的区域，或者使目标态附近的景观“更平滑”，从而减轻无梯度区域并改善可训练性。作者们故意保持编码器 $V(\gamma)$ 浅层，以避免引入新的、有问题的局部最小值或增加训练难度。
迭代状态更新与收敛：
- 在联合优化的每次迭代中，参数 $\theta$ 和 $\gamma$ 根据计算出的梯度进行更新。这些更新后的参数定义了一个新的量子电路 $U(\theta)V(\gamma)$，该电路制备了一个新的变分态 $|\Psi(\theta,\gamma)\rangle$。
- 然后测量新状态 $|\Psi(\theta,\gamma)\rangle$ 的能量 $E(\theta,\gamma)$，并重复该循环。这个迭代过程驱动量子态 $|\Psi(\theta,\gamma)\rangle$ 越来越接近哈密顿量 $H$ 的真实基态。
- 当能量 $E(\theta,\gamma)$ 稳定或达到非常接近精确基态能量的值，并且保真度（与真实基态的重叠）接近 1 时，通常实现收敛。本文表明，与传统 VQA 相比，这种输入态设计能够持续实现更高的准确性和更快的收敛速度（更少的层数，更少的迭代次数），表明对希尔伯特空间的探索更有效，并且能够更好地找到最优状态。优化通常限制在适度的迭代次数（例如，200 次）内，以控制经典开销。

结果、局限性与结论

实验设计与基线

作者们的实验设计经过精心设计，以无情地验证其核心主张：设计一个合适的输入态可以显著增强 VQA 的可达性和性能，而无需增加电路深度或参数数量。核心思想是引入一个“编码器”电路 $V(\gamma)$，它制备一个叠加输入态 $|\Psi_0(\gamma)\rangle = V(\gamma)|0\rangle^{\otimes n} = \sum_{j=1}^m \alpha_j |\psi_j\rangle$，而不是传统的乘积态 $|0\rangle^{\otimes n}$ 或 $|+\rangle^{\otimes n}$。该编码器有效地移动了后续 ansatz 电路 $U(\theta)$ 在希尔伯特空间中的可达集合，使得目标态更容易访问。

实验架构涉及一个多阶段优化过程：
1. 预训练：首先使用传统的输入态（例如 $|0\rangle^{\otimes n}$）优化标准 ansatz 电路 $U(\theta)$（无论是硬件高效型 ansatz（HEA）还是哈密顿量变分 ansatz（HVA）），以获得初始参数集 $\theta_{\text{opt}}$。此步骤为给定的电路深度建立了基线性能。
2. 候选态选择：采样一组 $M$ 个计算基态 $\{|j^{(k)}\rangle\}_{k=1}^M$。对于每个状态，使用预训练的 ansatz $U(\theta_{\text{opt}})$ 估计其能量期望值 $E_{j^{(k)}} = \langle j^{(k)}|U^\dagger(\theta_{\text{opt}})HU(\theta_{\text{opt}})|j^{(k)}\rangle$。测量次数按 $N_m = 1/\epsilon^2$ 缩放，以获得目标估计误差 $\epsilon$。从该池中选择 $m$ 个低能量状态（包括 $|0\rangle^{\otimes n}$）来构成新输入态的叠加基础。选择 $m$ 的方式是与系统大小线性相关的（例如，12 个量子比特时 $m=6$），确保编码器的门成本与 ansatz 的单层相当。
3. 联合优化：基于选定的 $m$ 个基态构建编码器 $V(\gamma)$。然后，联合优化编码器 $\gamma$ 和 ansatz $\theta$ 的参数，以最小化能量 $E(\theta, \gamma) = \langle 0|V^\dagger(\gamma)U^\dagger(\theta)HU(\theta)V(\gamma)|0\rangle$。ansatz 参数使用 $\theta_{\text{opt}}$ 初始化，而编码器参数 $\gamma$ 被随机化。这种联合优化被限制在适度的迭代次数（通常为 $T=200$）内，以控制经典开销。

与该方法进行无情测试的“受害者”（基线模型）是传统的 HEA 和 HVA 电路，它们使用标准乘积态进行初始化。证明其数学主张的关键在于，在匹配的门预算或固定的电路深度下，比较增强型 VQA（ansatz + 编码器）与这些基线的性能。这意味着增强方法的总量子资源（例如，层数、CNOT 门数）与基线（L+1 层 ansatz）保持相当（L 层 ansatz + 1 个编码器层）。这种架构选择确保了任何观察到的性能改进都直接归因于输入态设计，而不是简单地使用了更深或更复杂的电路。

实验在几个代表性的量子多体模型上进行：
* 1D 横向场伊辛模型（TFIM）：使用 12 量子比特系统和 HEA 作为 ansatz。
* 2D TFIM：在各种横向场强度下使用 HVA 作为 ansatz。
* 簇伊辛模型：使用 HVA 作为 ansatz。
* 1D 费米-哈伯德模型：使用 HVA 作为 ansatz，半填充且相互作用强度不同。

性能主要通过基态能量和保真度（F = $|\langle \Psi|\Psi_{\text{tar}}\rangle|^2$）来衡量，以及量子资源（电路深度、CNOT 门数）和经典资源（优化步数）。

证据证明了什么

本文提供的证据明确证明了输入态设计是增强 VQA 可达性和性能的强大且广泛适用的工具。正如定理 1 严格证明的那样，核心机制是，通过将输入态构建为 $m$ 个正交态的线性叠加，最大可实现保真度 $F$ 是各个保真度 $F_j = |\langle \psi_j|\Psi_{\text{tar}}\rangle|^2$ 之和。这使得 ansatz 的可达集合能够被有效地修改以包含目标态，即使对于浅层电路也是如此。

以下是无可辩驳的证据：

1D 横向场伊辛模型（HEA）：对于 12 量子比特的 1D TFIM，增强型 HEA 仅用 8 层（112 个 CNOT 门）就实现了 0.99 的保真度。相比之下，传统 HEA 需要 12 层（144 个 CNOT 门）才能达到相同的保真度，代表了电路深度的显著减少 33%（图 4(a)-(b)）。此外，增强方法仅需要 1100 次优化步数，而传统 HEA 需要 1500 次，显示了经典资源的收益。训练轨迹清楚地表明，一旦引入编码器，能量和保真度会迅速提高（图 4(c)-(d)）。
2D 横向场伊辛模型（HVA）：在各种场强（$h \in \{0.5, 1.0, 1.5\}$）下，增强型 HVA 始终优于传统 HVA。它在较低的电路深度下实现了更低的变分能量和更高的保真度（图 5）。编码器由 $m=8$ 个基态构成，其门成本与单层 HVA 相当，确保了在匹配的门预算下进行公平比较。
簇伊辛模型（HVA）：对于这个模型，增强型 HVA 用 6 层（450 个双量子比特门）达到了 0.99 的保真度，而传统 HVA 需要 9 层（558 个双量子比特门）。经典资源比较甚至更为惊人：输入态设计方法需要 $C_R = 54550$ 次优化步数，而传统 HVA 需要 $C_R = 118800$ 次。这是效率优越性的明确证明。
1D 费米-哈伯德模型（HVA）：该模型为强关联系统提供了一个严格的测试。对于 $U=2$，增强型 HVA 用 5 层实现了 0.99 的保真度，而传统 HVA 需要 9 层。更重要的是，对于更高的相互作用强度（$U=5$ 和 $U=10$），传统方法由于初始化敏感性和无梯度区域而常常停滞在约 0.6 的保真度，而输入态设计则持续将保真度推高到 0.99 以上（图 8）。这凸显了编码器提供物理相关且具有表达能力的初始化的能力。
资源开销分析：本文还分析了采样数 $M$ 和编码器大小 $m$ 相关的开销。结果表明，增加 $M$ 可以提高准确性，但收益递减，并且使用适度的 $M$ 也能获得有益的改进（图 9）。例如，对于 12 量子比特系统，将 $M$ 从 2000 减少到 400 仍能获得 0.99 的保真度。预选 $M=400$ 个候选者的经典成本适中，为 12 量子比特伊辛模型的总经典成本（约 189600 美元）增加了约 1000 美元（如论文中所述，尽管表格引用缺失，但很可能指的是表 2）。总成本约 190600 美元，仍远低于传统 HEA 基线为达到相同目标保真度所需的 432000 美元。

总之，在匹配的门预算下，跨越不同模型和 ansatz 系列的保真度、电路深度和经典优化成本的持续改进，提供了无可辩驳的证据，证明输入态设计机制有效地增强了 VQA 的可达性。

局限性与未来方向

尽管输入态设计框架为 VQA 的可达性问题提供了一个引人注目的解决方案，但作者们也承认存在一些局限性以及未来研究的开放方向。

一个主要局限性在于当前编码器构造和候选选择策略的启发式性质。本文明确指出，“我们当前的编码器构造和候选选择策略在很大程度上是启发式的，而非最优的。” 这意味着尽管该方法效果良好，但可能存在更有效或更稳健的方法来识别叠加的最佳基态以及构建编码器电路 $V(\gamma)$。当前方法依赖于采样 $M$ 个计算基态并选择 $m$ 个低能量态，虽然有效，但可能并非总是资源最有效或全局最优的策略，尤其对于没有强烈先验物理直觉的问题。

另一个讨论点是采样预算 $M$。尽管本文证明了使用适度的 $M$ 可以获得有益的改进，并且增加 $M$ 会带来收益递减，但根本挑战仍然存在：在没有任何关于哈密顿量的先验知识的情况下，原则上保证高保真度需要采样几乎所有的 $2^n$ 个计算基态，这在计算上是指数级低效的。尽管作者们专注于 $M$ 随系统大小多项式增长的区域，但采样开销与目标精度之间的权衡对于扩展到更大的系统仍然是一个实际考虑因素。

此外，虽然输入态设计通过修改可达集合解决了表达能力瓶颈，但它与无梯度区域的关系是微妙的。作者们认为，使用无法经典模拟的高度纠缠输入态可能允许他们的协议在不面临适用于经典可模拟输入态的无梯度区域禁忌定理的情况下实现量子优势。然而，编码器本身被故意保持浅层，以避免引入新的训练问题。这表明 ansatz $U(\theta)$ 本身的根本无梯度区域问题并未直接解决，而是通过更好的起点来规避。

基于这些见解，出现了几个关于未来发展和成果演进的讨论主题：

自适应和智能候选态选择：我们如何超越简单的基于能量的过滤来选择候选基态？未来的研究可以探索先进的机器学习技术，如强化学习或主动学习，以自适应地识别最“有信息量”的基态，甚至是非计算基态，用于输入叠加。这可以显著减少采样预算 $M$ 和所需的测量次数，使预选阶段更具资源效率和可扩展性。
最优编码器架构和参数化：当前的编码器 $V(\gamma)$ 被构建为制备计算基态的叠加。我们能否探索更复杂或特定于问题的编码器架构，它们可能更有效地制备更复杂、纠缠的输入态？这可能涉及设计利用哈密顿量对称性的编码器，或结合量子信息理论的见解来优化 $V(\gamma)$ 的 $\alpha_j$ 系数和门结构。
协同无梯度区域缓解：虽然输入态设计提高了可达性，但它并没有直接解决 ansatz 电路的无梯度区域问题。一个关键的未来方向是研究输入态设计如何与其他的无梯度区域缓解技术（例如，参数初始化策略、局部成本函数或受问题启发的 ansatz）协同结合。精心选择的纠缠输入态是否也能“平滑”或“陡峭化”后续 ansatz 优化的损失景观，从而改善可训练性？
更大系统的可扩展性和资源分析：当前的模拟最多限于 12 个量子比特。一个关键问题是，对于更大的量子系统，开销（采样 $M$、编码器门数、经典优化步数）如何扩展。需要详细的理论和数值分析来确定 $n$ 增加时 $M$ 和 $m$ 的实际限制和最佳权衡，以确保该方法对于容错量子计算仍然可行。
泛化到其他 VQA 任务：当前工作主要集中在基态制备。如何将这种输入态设计框架扩展并验证到其他 VQA 应用，例如量子机器学习、优化问题（如 QAOA）或模拟激发态？每个应用可能对目标态有独特的要求，需要不同的输入态设计策略。
噪声鲁棒性和硬件实现：考虑到当前和近期量子硬件中固有的噪声，输入态设计方法对各种噪声模型（例如，去极化、退相干、读出误差）的鲁棒性如何？未来的工作可以探索针对编码器电路量身定制的噪声感知输入态设计策略或误差缓解技术，以确保在实际硬件实现中保留性能增益。

Figure 9. Impact of sampling size on inﬁdelity for basis-state in pre-selection step. We consider the 12-qubit 1D transverse-ﬁeld Ising model with a 5-layer HEA as the variational circuit U(θ) and m = 6. The horizontal axis shows the sampling number M, and the vertical axis reports the ﬁnal inﬁdelity 1 −F obtained after the joint optimization. Increasing M improves the ﬁnal accuracy by providing a better set of candidate basis states for constructing the encoder input state, while the improvement quickly saturates for larger M, indicating diminishing returns beyond a moderate sampling number

Table 2. Minimum sample size required to reach target ﬁdelity in the transverse- ﬁeld Ising model. Results are shown for target ﬁdelities F = 0.99 and 0.95 and for n ∈{6, 8, 10, 12} qubits. The number of selected computational-basis states is set to m = 4 for n = 6, 8 and m = 6 for n = 10, 12. We also report the ﬁnal ﬁdelity achieved by the baseline hardware-eﬃcient ansatz (HEA) without input-state design under a matched quantum-resource budget: the baseline uses (L + 1) HEA layers, whereas our method uses L HEA layers plus one encoder layer

Figure 5. Simulation results for the 12-qubit 2D Ising model at h = 0.5, 1, and 1.5. The upper panels (a, c, e) show the ground energy as a function of circuit depth p for h = 0.5, 1, and 1.5, respectively, and the lower panels (b, d, f) show the corresponding ﬁdelity to the exact ground state. The blue curves correspond to the conventional HVA, and the orange curves correspond to the input-state design (enhanced HVA). Each marker represents the mean over 100 random initializations, and the error bars represent standard deviations over these runs. Across all three values of h, the input-state design consistently achieves lower variational energies and higher ﬁdelities under the same depth, and it reaches the 0.99 ﬁdelity threshold with fewer layers than the baseline

与其他领域的同构性

结构骨架

本文提出了一种机制，通过智能设计参数化优化过程的初始配置，而不是仅仅修改过程本身，来系统地扩展其可访问的解空间，从而克服可达性限制。