← Back
Communications Physics

양자 알고리즘의 도달 가능성 향상을 위한 입력 상태 설계

Design smarter inputs to unlock deeper insights & boost accuracy in quantum algorithms.

Open PDF Open DOI Open Source Page

Editorial Disclosure

ISOM follows an editorial workflow that structures the source paper into a readable analysis, then publishes the summary, source links, and metadata shown on this page so readers can verify the original work.

The goal of this page is to help readers understand the paper's core question, method, evidence, and implications before opening the original publication.

배경 및 학문적 계보

기원 및 학문적 계보

본 논문에서 다루는 문제는 양자 컴퓨팅의 신흥 분야, 특히 노이즈가 있는 중간 규모 양자(NISQ) 장치의 맥락에서 비롯된다. 양자 컴퓨터는 고전 컴퓨터로는 해결할 수 없는 문제를 해결할 수 있는 엄청난 잠재력을 가지고 있지만, 현재 NISQ 하드웨어는 초기화, 연산 및 판독의 불완전성으로 인해 제한된다. 이러한 근거리 장치의 핵심 과제는 "양자 우위"를 입증하는 것, 즉 고전 컴퓨터보다 더 효율적으로 실제 문제를 해결하는 것이다.

변분 양자 알고리즘(VQA)은 이러한 과제를 해결하기 위한 선도적인 접근 방식으로 부상했다. 2014년경 변분 양자 고유값 솔버(VQE) [20, 104, 105]와 함께 처음 소개된 VQA는 복잡한 계산 작업을 최적화 문제로 프레임한다. 핵심 아이디어는 종종 물리 시스템의 해밀토니안 $H$의 바닥 상태인 원하는 양자 상태를 비용 함수 $E(\theta)$를 최소화함으로써 근사하는 것이다. 이는 매개변수화된 양자 상태, 즉 "안자츠 상태" $|\Psi(\theta)\rangle = U(\theta)|\Psi_0\rangle$를 준비함으로써 달성된다. 여기서 $U(\theta)$는 조정 가능한 매개변수 $\theta$를 가진 양자 회로이고, $|\Psi_0\rangle$는 전통적으로 $|0\rangle^{\otimes n}$과 같은 간단한 곱 상태인 초기 입력 상태이다. 그런 다음 고전 최적화기가 반복적으로 $\theta$를 조정하여 $E(\theta)$를 최소화한다.

이전 VQA 접근 방식의 근본적인 한계 또는 "고충점"은 "표현력"(회로가 생성할 수 있는 상태의 범위)과 "훈련 가능성"(매개변수를 얼마나 쉽게 최적화할 수 있는지) 사이의 절충점이다. 더 깊고 표현력이 풍부한 회로는 이론적으로 더 넓은 범위의 양자 상태에 도달할 수 있지만, 노이즈 축적과 최적화 지형이 극도로 평탄해져 훈련이 불가능해지는 악명 높은 "황무지 고원" 문제에 매우 취약하다. 반대로, 얕은 회로는 훈련 가능성이 높고 노이즈에 덜 민감하지만, 종종 "불충분한 도달 가능 집합"을 가진다. 즉, 매개변수 $\theta$를 완벽하게 조정하더라도 대상 양자 상태 $|\Psi_{\text{tar}}\rangle$가 회로가 생성할 수 있는 상태 집합에 포함되지 않는다는 의미이다.

역사적으로 VQA 개선을 위한 대부분의 연구 노력은 거의 전적으로 더 나은 안자츠 회로 $U(\theta)$ 설계에 집중되었다. 전략에는 하드웨어 효율적인 안자츠(HEA), 해밀토니안 변분 안자츠(HVA), 적응형 회로 등이 포함되었다. 그러나 초기 입력 상태 $|\Psi_0\rangle$가 도달 가능 집합을 결정하는 역할은 상대적으로 적은 관심을 받았다. 이러한 간과로 인해 잘 설계된 회로 $U(\theta)$를 사용하더라도 대상 상태가 고정된 입력 상태로 정의된 도달 가능 집합 외부에 있다면 알고리즘은 필연적으로 최적이 아닌 근사에 수렴하게 된다. 본 논문은 이러한 문제를 해결하기 위해 입력 상태 설계에 초점을 맞추어 회로 깊이나 매개변수 수를 늘리지 않고 도달 가능 집합을 향상시키는 것을 목표로 하며, 기존 회로 설계 전략에 강력한 보완책을 제공한다.

직관적인 도메인 용어

  1. 변분 양자 알고리즘 (VQA): 새로운, 다소 까다로운 오븐을 사용하여 복잡한 요리의 최상의 레시피를 찾으려고 한다고 상상해 보세요. VQA는 "스마트 시행착오" 과정과 같습니다. 기본 레시피(초기 설정이 있는 양자 회로)로 시작하여 결과를 맛보고(비용 함수 측정), 맛에 따라 레시피 설정을 조정합니다(회로 매개변수). 오븐이 허용하는 한 요리가 완벽해질 때까지 이 주기를 반복합니다.
  2. 노이즈가 있는 중간 규모 양자 (NISQ) 장치: 이것은 초고속, 복잡한 계산기의 초기 프로토타입과 같습니다. 일반 계산기가 할 수 없는 놀라운 계산을 수행할 수 있지만, 여전히 버그가 있고 작은 오류를 일으키며 오류가 쌓이기 전에 제한된 수의 단계만 처리할 수 있습니다. 이것들은 오류가 완전히 보정된 "내결함성" 기계를 갖기 전에 오늘날 우리가 사용할 수 있는 양자 컴퓨터입니다.
  3. 황무지 고원: 광활하고 평평한 사막에서 길을 잃고 가장 낮은 지점을 찾으려고 한다고 상상해 보세요. 어디를 보든 지형이 완벽하게 평평해 보여 어느 방향이 아래쪽으로 이어지는지 알 수 없습니다. VQA에서 이것은 가능한 솔루션의 "지형"이 너무 평평해져서 고전 최적화기가 따라갈 기울기를 찾을 수 없어 알고리즘이 최적의 매개변수를 찾는 것을 방해하는 최적화 문제를 설명합니다.
  4. 도달 가능 집합: 이것은 고정된 재료 세트와 특정 조리 방법을 고려할 때 특정 조리 과정이 생성할 수 있는 모든 가능한 결과의 "메뉴"라고 생각하십시오. 원하는 결과(예: 완벽하게 구워진 케이크)가 해당 메뉴에 없으면 오븐 온도나 타이밍을 아무리 조정해도 만들 수 없습니다. VQA에서는 주어진 양자 회로가 생성할 수 있는 모든 양자 상태의 모음입니다.
  5. 안자츠: 이것은 양자 회로의 "템플릿" 또는 "청사진"입니다. 조정 가능한 "손잡이"(매개변수)가 있지만 일반적인 양자 게이트 및 연산의 구조를 정의합니다. 다른 안자츠 설계는 다양한 유형의 엔진과 같습니다. 일부는 특정 작업에 더 효율적이고, 일부는 더 강력하지만, 모두 조정 가능한 부품을 가지고 있습니다.

표기법 표

표기법 설명
$|\Psi_{\text{tar}}\rangle$ VQA가 근사하려고 하는 대상 양자 상태 (예: 해밀토니안의 바닥 상태).
$H$ 최소화되는 비용 함수의 관측량 또는 해밀토니안.
$|\Psi(\theta)\rangle$ 안자츠 회로 $U(\theta)$에 의해 생성된 매개변수화된 양자 상태.
$U(\theta)$ 조정 가능한 매개변수 $\theta$를 가진 양자 게이트 시퀀스인 단위 안자츠 회로.
$|\Psi_0\rangle$ 안자츠 회로의 초기 입력 상태, 일반적으로 $|0\rangle^{\otimes n}$과 같은 간단한 곱 상태.
$E(\theta)$ 고전 최적화기가 최적 매개변수를 찾기 위해 최소화하는 비용 함수.
$\theta$ 안자츠 회로 $U(\theta)$의 조정 가능한 매개변수 벡터.
$\theta_{\text{opt}}$ 비용 함수 $E(\theta)$를 최소화하여 찾은 최적 매개변수.
$V(\gamma)$ 설계된 입력 상태를 준비하는 데 사용되는 추가 매개변수화된 회로인 인코더 회로.
$|\Psi_0(\gamma)\rangle$ 인코더 $V(\gamma)$에 의해 준비된 후보 상태의 중첩인 설계된 입력 상태.
$\gamma$ 인코더 회로 $V(\gamma)$의 조정 가능한 매개변수 벡터.
$F$ 생성된 양자 상태가 대상 상태에 얼마나 가까운지를 측정하는 충실도, $F = |\langle\Psi|\Psi_{\text{tar}}\rangle|^2$로 정의됨.
$m$ 설계된 입력 상태를 구성하는 데 사용된 상호 직교 상태의 수.
$M$ 사전 선택 단계 동안 샘플링된 계산 기반 상태의 총 수.
$n$ 양자 시스템의 큐비트 수.

문제 정의 및 제약 조건

핵심 문제 공식화 및 딜레마

변분 양자 알고리즘(VQA)의 영역에서 본 논문이 다루는 근본적인 문제는 대상 양자 상태의 "도달 가능성"이 제한된다는 것입니다.

입력/현재 상태: VQA의 시작점은 일반적으로 매개변수화된 양자 상태 $|\Psi(\theta)\rangle = U(\theta)|\Psi_0\rangle$입니다. 여기서 $U(\theta)$는 조정 가능한 매개변수 $\theta$를 가진 단위 양자 회로를 나타내고, $|\Psi_0\rangle$는 간단하고 종종 고정된 초기 입력 상태(예: 계산 기반 상태 $|0\rangle^{\otimes n}$)입니다. 목표는 비용 함수를 최소화하여 최적 매개변수 집합 $\theta_{\text{opt}}$를 찾는 것이며, 결과 상태 $|\Psi(\theta_{\text{opt}})\rangle$는 원하는 대상 양자 상태 $|\Psi_{\text{tar}}\rangle$를 밀접하게 근사합니다. 예를 들어, 변분 양자 고유값 솔버(VQE)에서 $|\Psi_{\text{tar}}\rangle$는 주어진 해밀토니안 $H$의 바닥 상태입니다.

원하는 최종점/목표 상태: 궁극적인 목표는 대상 상태 $|\Psi_{\text{tar}}\rangle$의 높은 충실도 근사를 달성하는 것입니다. 즉, $|\langle\Psi_{\text{tar}}|\Psi(\theta_{\text{opt}})\rangle|^2$가 1에 가까워야 합니다. 이는 대상 상태가 안자츠 $U(\theta)$가 입력 상태 $|\Psi_0\rangle$에서 생성할 수 있는 "도달 가능 집합" 내에 있어야 함을 의미합니다.

누락된 연결/수학적 격차: 결정적인 누락된 연결은 대상 상태 $|\Psi_{\text{tar}}\rangle$가 간단하고 고정된 입력 상태 $|\Psi_0\rangle$에서 시작할 때 $U(\theta)$의 도달 가능 집합에 포함되지 않을 수 있다는 것입니다. $|\Psi_{\text{tar}}\rangle$가 이 집합 외부에 있다면, 회로 매개변수 $\theta$의 어떤 최적화도 알고리즘이 이를 달성할 수 없게 하여 계산 노력에 관계없이 최적이 아닌 결과로 이어집니다. 본 논문은 추가 매개변수화된 인코더 회로 $V(\gamma)$에 의해 준비된 설계된 입력 상태 $|\Psi_0(\gamma)\rangle$를 도입함으로써 이 격차를 해소하는 것을 목표로 하며, 이를 통해 회로 깊이나 매개변수 수를 크게 늘리지 않고 도달 가능 집합을 향상시킵니다. 수학적으로, 본 논문은 $\theta$와 $\gamma$를 공동으로 최적화하여 충실도 $F = |\langle\Psi_{\text{tar}}|U(\theta)V(\gamma)|0\rangle^{\otimes n}|^2$를 최대화하는 것을 목표로 합니다. 정리 1은 직교 입력 상태의 선형 중첩이 달성 가능한 충실도를 체계적으로 향상시킬 수 있음을 보여줌으로써 엄격한 기초를 제공합니다.

딜레마: VQA에서 이전 연구자들을 가두었던 핵심 딜레마는 표현력훈련 가능성 사이의 고통스러운 절충점입니다.
* 표현력: 더 깊은 양자 회로(더 많은 레이어 또는 게이트를 가진 회로)는 일반적으로 더 표현력이 풍부합니다. 즉, 이론적으로 더 넓은 범위의 양자 상태에 도달할 수 있으며, 잠재적으로 대상 상태도 포함합니다.
* 훈련 가능성: 그러나 회로 깊이를 늘리면 종종 "황무지 고원"이 발생합니다. 여기서 비용 함수의 기울기가 기하급수적으로 작아져 고전 최적화가 극도로 어렵거나 불가능해집니다. 이는 알고리즘이 최적 매개변수에 수렴하는 것을 방지합니다.
* 반대로, 얕은 회로는 훈련 가능성이 높고 황무지 고원에 덜 민감하지만, 종종 불충분한 도달 가능성을 가집니다. 즉, 제한된 표현력으로 인해 복잡한 대상 상태를 근사할 수 없습니다.

이 논문은 회로 $U(\theta)$ 자체에 초점을 맞추는 대신 입력 상태 $|\Psi_0\rangle$에 초점을 맞춤으로써 딜레마를 해결할 것을 제안하며, 회로 깊이나 매개변수 수를 크게 늘리지 않고 황무지 고원에 빠지지 않으면서 도달 가능성을 향상시키는 것을 목표로 합니다.

제약 조건 및 실패 모드

VQA 도달 가능성 향상 문제는 몇 가지 가혹하고 현실적인 제약 조건으로 인해 엄청나게 어렵습니다.

  1. 하드웨어 메모리 제한 및 노이즈 축적 (물리적/계산적): 근거리 양자 컴퓨터(NISQ 장치)는 큐비트 수가 제한적이고, 코히런스 시간이 짧으며, 노이즈에 민감합니다. 더 깊은 회로는 잠재적으로 더 표현력이 풍부하지만, 더 많은 노이즈를 축적하여 오류를 유발하고 출력을 신뢰할 수 없게 만듭니다. 이는 실행할 수 있는 양자 회로의 실제 깊이에 엄격한 물리적 제한을 부과합니다.

  2. 황무지 고원 (계산적/수학적): 이것은 깊고 무작위로 초기화된 VQA의 비용 함수 지형이 극도로 평평해지는 근본적인 수학적 제약입니다. 기울기는 큐비트 수에 따라 기하급수적으로 사라져 고전 최적화가 비효율적이 되고 수렴이 방지됩니다. 이 현상은 표현력이 풍부한 회로의 훈련 가능성을 심각하게 제한합니다.

  3. 고정 입력 상태의 불충분한 도달 가능성 (수학적): 주어진 안자츠 $U(\theta)$와 간단하고 고정된 입력 상태 $|\Psi_0\rangle$ (예: $|0\rangle^{\otimes n}$)에 대해 도달 가능한 상태의 집합은 매우 작을 수 있습니다. 대상 상태 $|\Psi_{\text{tar}}\rangle$가 이 "도달 가능 집합" 외부에 있다면, $U(\theta)$의 매개변수 조정으로는 원하는 충실도를 달성할 수 없습니다. 안자츠 상태 $|\Psi(\theta)\rangle$의 도달 가능 집합은 본질적으로 초기 상태에 의해 제약됩니다.

  4. 입력 상태 설계의 비효율적인 계산 비용 (계산적/데이터 기반): 제안된 입력 상태 설계가 해결책을 제공하지만, 자체적인 오버헤드를 도입합니다.

    • 샘플링 예산 ($M$): 이 방법은 입력 중첩에 대한 유망한 후보를 식별하기 위해 $M$개의 계산 기반 상태를 샘플링해야 합니다. $M$이 너무 크면(예: $n$ 큐비트의 경우 $2^n$), 특히 더 큰 시스템의 경우 이 사전 선택 단계가 고전적으로 다루기 어려워집니다. 본 논문은 $M$을 적당하게 유지하는 것을 목표로 합니다.
    • 인코더 회로 깊이 ($m$): 인코더 $V(\gamma)$는 총 회로 깊이에 추가됩니다. 저심도로 설계되었지만, $m$(중첩에서 선택된 기반 상태의 수)을 늘리면 $V(\gamma)$의 복잡성과 게이트 비용이 증가하여 더 많은 양자 리소스를 소비하게 됩니다.
    • 고전 최적화 오버헤드: 안자츠 매개변수 $\theta$와 인코더 매개변수 $\gamma$의 공동 최적화는 고전 계산 비용을 증가시킵니다. 본 논문은 공동 훈련에 대한 최적화 반복 횟수를 제한함으로써 이를 완화하려고 시도합니다.
  5. 하드웨어 효율적인 안자츠의 비효율적인 매개변수화 (알고리즘적): 하드웨어 효율적인 안자츠(HEA)는 유연하고 다양한 하드웨어 플랫폼에 적응할 수 있지만, 종종 문제별 구조가 부족합니다. 이로 인해 비효율적인 매개변수화가 발생하여, 특히 더 깊은 구성에서 황무지 고원과 같은 최적화 문제에 취약해질 수 있습니다.

Figure 1. Representative variational quantum ansatz. (a) Hardware-efficient ansatz (HEA). Each layer consists of alternating single-qubit rotations Ry and Rz followed by a chain of CZ gates. The dashed box indicates one circuit layer, which is repeated p times. (b) General Hamiltonian variational ansatz (HVA). Each layer contains a product of unitaries Qq k=1 e−iθkHk, where {Hk} are problem-specific Hamiltonian terms. (c-e) Examples of HVA design for three different models. (c) For the transverse-field Ising model. An initial layer of Hadamard gates H prepares |+⟩⊗n. UZZ(θ) = e−i(θ/2) σz i σz j represents the two-qubit gate for ZZ interaction, while Rx(θ) = e−iθ σx i represents the single- qubit X-rotation. (d) For the cluster-Ising model. UZXZ(θ) = e−i(θ/2) σz i σx j σz k is a three-qubit gate, and UXX(θ) = e−i(θ/2) σx i σx j is a two-qubit gate. (e) For the Fermi-Hubbard model. The upper (lower) register encodes spin-↑(spin- ↓). On-site interactions between the two spins at site i are implemented as UZZ(θ). Hopping terms on odd and even bonds are realized by UXY (θ) = e−i(θ/2) (σx i σx i+1+σy i σy i+1)

왜 이 접근 방식인가

선택의 불가피성

본 연구에서 다루는 핵심 문제는 회로 표현력과 훈련 가능성 사이의 근본적인 절충점입니다. 전통적인 "최신 기술"(SOTA) 방법은 주로 단위 회로 $U(\theta)$ 자체를 설계하는 데 중점을 둡니다. 그러나 저자들이 명확하게 설명하듯이, $U(\theta)$의 표현력을 더 깊은 회로를 사용하여 증가시키면 노이즈 축적 및 악명 높은 황무지 고원 문제와 같은 심각한 문제가 발생하여 고전 최적화(초록, 2페이지; 서론, 4페이지)를 방해합니다. 반대로, 얕은 회로는 훈련 가능하고 노이즈에 덜 민감하지만, 종종 "불충분한 도달 가능 집합"을 가집니다. 즉, 원하는 대상 상태 $|\Psi_{tar}\rangle$가 단순히 접근할 수 없을 수 있으며, 회로 매개변수 $\theta$가 얼마나 잘 최적화되든 상관없이 (4페이지, 그림 2).

저자들은 기존 VQA 안자츠가 0.95의 충실도에서 정체되는 것을 관찰했을 때 이러한 전통적인 회로 중심 접근 방식의 불충분성을 깨달았습니다. 이 지점을 넘어서는 회로 깊이 증가나 훈련 반복 횟수 증가는 본질적인 안자츠 한계 또는 황무지 고원의 시작으로 인해 거의 또는 전혀 개선을 가져오지 않았습니다 (9페이지). 이 결정적인 관찰은 문제가 단순히 상태를 어떻게 진화시키느냐가 아니라 어디에서 진화를 시작하느냐에 있다는 것을 강조했습니다. 대상 상태가 표준 입력 $|0\rangle^{\otimes n}$에서 시작할 때 $U(\theta)$의 초기 도달 가능 집합 외부에 있다면, 회로 최적화로는 결코 도달할 수 없습니다 (6페이지). 이러한 깨달음은 더 깊고 문제가 많은 회로에 의존하거나 안자츠 구조를 근본적으로 변경하지 않고 도달 가능성을 향상시키기 위한 유일하게 실행 가능한 해결책으로 입력 상태 설계를 만들었습니다. 이 접근 방식은 고정된 회로 깊이와 구조 하에서 표현력 병목 현상을 극복하기 위한 수단으로 불가피해졌습니다 (9페이지).

비교 우위

이 방법은 기존 VQA 안자츠를 대체하는 것이 아니라 성능을 향상시키는 강력하고 보완적인 프레임워크를 제공함으로써 질적인 우수성을 보여줍니다. 그 구조적 이점은 단순히 안자츠 회로 자체를 수정하는 것이 아니라, 더 적합한 입력 상태 $|\Psi_0(\gamma)\rangle$를 설계하여 주어진 VQA 안자츠 $U(\theta)$의 도달 가능 집합을 재구성할 수 있다는 점에 있습니다. 이는 후보 상태의 중첩을 준비하는 저심도 "인코더" 회로 $V(\gamma)$를 통해 달성됩니다 (4페이지, 그림 2).

주요 이점은 다음과 같습니다.
1. 향상된 도달 가능성 및 정확도: 신중하게 설계된 입력 상태에서 시작함으로써, 이 방법은 대상 상태가 기존 $U(\theta)$ 회로에 접근 가능하도록 보장합니다. 이는 동일한 게이트 예산에서도 표준 방법과 비교하여 일관되게 더 높은 충실도와 더 정확한 바닥 에너지 추정치를 제공합니다 (초록, 2페이지; 9페이지). 예를 들어, 1D 횡단 자기 이징 모델에서 이 방법은 8개의 레이어만으로 0.99의 충실도를 달성했으며, 이는 기존 하드웨어 효율적인 안자츠(HEA)가 필요로 했던 12개의 레이어보다 33% 깊이가 감소한 것입니다 (4페이지, 10페이지). 유사한 이득이 2D 이징 및 클러스터 이징 모델에서도 관찰됩니다 (4페이지).
2. 자원 효율성: 입력 상태 설계는 양자 및 고전 리소스를 모두 크게 줄입니다. 이는 필요한 게이트 수(예: 0.99 충실도 달성을 위해 HEA의 144개 대비 112개의 CNOT 게이트)와 최적화 노력(HEA의 1500개 대비 1100개 단계)을 줄입니다 (11페이지). 인코더 $V(\gamma)$ 자체는 기준 안자츠의 단일 레이어와 유사한 게이트 비용을 가진 저심도 회로이므로 전체 오버헤드가 최소화되고 관리 가능하도록 보장합니다 (6페이지, 10페이지, 17페이지).
3. 광범위한 적용 가능성: 이 방법은 입력 상태를 수정하고 매개변수화된 회로 $U(\theta)$를 변경하지 않으므로 HEA 및 해밀토니안 변분 안자츠(HVA)를 포함한 다양한 안자츠 계열에 광범위하게 적용할 수 있습니다 (4페이지). 이러한 보편성은 VQA 성능을 향상시키는 다목적 도구입니다.
4. 이론적 기반: 정리 1은 직교 입력 상태의 선형 조합의 달성 가능한 바닥 상태 충실도가 개별 충실도의 합과 관련이 있음을 보여주는 엄격한 수학적 기반을 제공하여, 대상과 더 큰 중첩을 가진 후보 상태를 선택하는 전략을 정당화합니다 (6-7페이지).

이 논문은 고차원 노이즈를 더 잘 처리하거나 메모리 복잡성을 $O(N^2)$에서 $O(N)$으로 줄이는 것에 대해 명시적으로 논의하지 않습니다. 그 우수성은 주로 엄격한 리소스 제약 조건 하에서 표현력과 도달 가능성을 개선하여 더 적은 양자 및 고전 리소스로 더 높은 충실도를 달성하는 데 있습니다.

제약 조건과의 정렬

선택된 입력 상태 설계 방법은 특히 노이즈가 있는 중간 규모 양자(NISQ) 장치와 관련된 근거리 양자 컴퓨팅의 가혹한 요구 사항과 완벽하게 일치합니다. 문제의 제약 조건과 솔루션의 고유한 속성 간의 "결합"은 여러 방식으로 분명합니다.

  1. 제약 조건: 제한된 회로 깊이 및 노이즈 축적: NISQ 장치는 노이즈에 매우 민감하며, 노이즈는 회로 깊이가 증가함에 따라 축적됩니다. 더 깊은 회로는 또한 황무지 고원을 악화시켜 최적화를 어렵게 만듭니다.

    • 정렬: 이 방법은 더 깊은 회로를 피함으로써 이 문제를 직접적으로 해결합니다. $U(\theta)$의 깊이를 늘리는 대신, 입력 상태를 수정하여 도달 가능 집합을 이동시켜 더 얕은 회로가 더 높은 충실도를 달성하도록 합니다. 예를 들어, 0.99의 충실도를 8개의 레이어로 달성하는데, 이는 기존 HEA가 12개의 레이어를 필요로 하는 것에 비해 상당한 깊이 감소를 나타냅니다 (4페이지, 10페이지). 인코더 자체는 저심도이므로 전체 회로 깊이를 약간만 증가시킵니다 (6페이지).
  2. 제약 조건: 고정 게이트 예산 및 리소스 제한: 실제 NISQ 응용 프로그램은 양자 게이트 및 고전 최적화 단계의 제한된 예산 내에서 작동하는 솔루션을 요구합니다.

    • 정렬: 입력 상태 설계는 본질적으로 리소스 효율적입니다. 목표 충실도에 도달하는 데 필요한 총 게이트 수와 최적화 단계를 줄입니다 (11페이지). 인코더의 게이트 비용은 기준 안자츠의 단일 레이어와 유사하게 유지되어 추가 양자 오버헤드가 최소화되고 제어되도록 합니다 (10페이지, 17페이지). 이를 통해 "확장 가능하고 리소스 효율적인 충실도 향상"이 가능합니다 (9페이지).
  3. 제약 조건: 얕은 회로의 불충분한 도달 가능성: 얕은 VQA의 주요 한계는 대상 상태가 $|0\rangle^{\otimes n}$과 같은 표준 입력 상태에서 도달 가능한 상태 집합 외부에 있을 수 있다는 것입니다.

    • 정렬: 이것이 이 방법이 해결하는 핵심 문제입니다. 선택된 기반 상태의 중첩으로 신중하게 설계된 입력 상태 $|\Psi_0(\gamma)\rangle$를 준비함으로써, 이 방법은 고정 안자츠 $U(\theta)$의 도달 가능 집합을 재구성하여 대상 바닥 상태를 포함하도록 합니다 (9페이지, 그림 2). 이를 통해 얕은 $U(\theta)$도 이제 원하는 상태에 접근할 수 있게 되어 회로 복잡성을 늘리지 않고 표현력 병목 현상을 극복합니다.

본질적으로 이 방법은 더 많은 양자 리소스를 요구함으로써 이를 극복하려고 하기보다는 얕은 회로와 고정 게이트 예산의 한계 내에서 작동함으로써 NISQ의 "가혹한 요구 사항"을 존중합니다. 양자 진화의 시작점을 최적화함으로써 영리한 해결책을 제공합니다.

대안의 거부

이 논문은 완전히 다른 양자 알고리즘(예: 생성 작업에 대한 GAN 또는 확산 모델)과의 직접적인 비교에 초점을 맞추기보다는 주로 암묵적으로 대안을 거부합니다. 저자들은 "VQA 개선을 위한 대부분의 노력은 $U(\theta)$의 회로 설계에 초점을 맞추었다"고 강조합니다 (4페이지). 이러한 회로 중심 접근 방식은 가치 있지만, 고정된 리소스 제약 조건 하에서 도달 가능성 향상이라는 특정 문제에 대해 불충분한 것으로 나타났습니다.

이러한 회로 전용 대안을 거부하는 이유는 다음과 같습니다.
1. 표현력과 훈련 가능성 간의 절충점: 회로를 더 깊게 만들어 $U(\theta)$의 표현력을 증가시키면(예: HEA 또는 HVA에서 더 많은 레이어 사용) 노이즈 축적 및 황무지 고원이 발생하여 최적화 프로세스가 어렵거나 불가능해집니다 (4페이지). 이는 더 깊은 회로가 이론적으로 더 많은 상태에 도달할 수 있지만, 실제로는 훈련 불가능해진다는 것을 의미합니다.
2. 얕은 회로의 제한된 도달 가능성: 반대로, 훈련 가능성을 유지하고 노이즈를 완화하기 위해 회로를 얕게 유지하면 종종 대상 상태가 안자츠의 도달 가능 집합 외부에 있게 됩니다 (4페이지). 이것이 입력 상태 설계가 직접 해결하는 근본적인 한계입니다.
3. 고정 게이트 예산에 대한 비효율성: 본 논문은 동일한 게이트 예산(예: 총 레이어 또는 CNOT 게이트)으로 제약될 때 기존 HEA 또는 HVA가 제안된 입력 상태 설계 방법보다 낮은 충실도를 달성함을 명시적으로 보여줍니다 (4페이지, 10페이지, 11페이지). 이는 입력 상태를 고려하지 않고 $U(\theta)$만 최적화하는 것이 높은 충실도를 달성하는 데 있어 리소스 활용 측면에서 덜 효율적임을 시사합니다.

따라서 본 논문은 다른 접근 방식이 완전히 실패한다고 주장하는 것이 아니라, 고정된 리소스 예산 내에서 실용적인 NISQ 장치의 제약 조건 하에서 VQA 도달 가능성을 개선하는 데 있어 불충분하거나 최적이 아니라고 주장합니다. 입력 상태 설계는 전통적인 방법이 자체적으로 효과적으로 처리할 수 없었던 간과된 측면을 해결하는 회로 설계에 대한 필수적인 보완책으로 제시됩니다.

Figure 2. Reachable sets modified through input-state design. For a fixed uni- tary U(θ), a simple input state |Ψ0⟩induces a reachable set (red-shaded) that excludes the target |Ψtar⟩, causing optimization to converge to a suboptimal state |Ψ′(θ)⟩(blue path). By contrast, a designed input state |Ψ0(γ)⟩, pre- pared by the encoder V(γ), produces a different reachable set (green-shaded) that contains |Ψtar⟩, enabling the same U(θ) to reach the target (red path)

수학적 및 논리적 메커니즘

마스터 방정식

본 논문에서 제안된 향상된 변분 양자 알고리즘(VQA)을 구동하는 절대적인 핵심 방정식은 두 구성 요소의 매개변수에 대해 공동으로 최적화되는, 변분 안자츠와 새로 도입된 입력 상태 인코더를 통합하는 에너지 최소화를 위한 목적 함수입니다.

$$ E(\theta,\gamma) = \langle 0|V^\dagger(\gamma)U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle $$

항별 분석

이 방정식을 분해하여 각 구성 요소의 수학적 정의, 물리적/논리적 역할, 그리고 포함 및 작동 이유를 이해해 보겠습니다.

  • $E(\theta,\gamma)$:

    • 수학적 정의: 이 항은 해밀토니안 $H$의 기대값을 양자 상태 $|\Psi(\theta,\gamma)\rangle = U(\theta)V(\gamma)|0\rangle^{\otimes n}$에 대해 나타냅니다.
    • 물리적/논리적 역할: 이것은 변분 양자 고유값 솔버(VQE)의 비용 함수입니다. 알고리즘의 주요 목표는 이 에너지 기대값을 최소화하는 것입니다. 양자 역학에서 해밀토니안의 최소 기대값은 시스템의 바닥 상태 에너지에 해당하며, 이 최소값을 달성하는 상태는 바닥 상태 자체입니다.
    • 왜 이 연산자인가? 기대값 $\langle\Psi|H|\Psi\rangle$는 주어진 상태 $|\Psi\rangle$에서 시스템의 평균 에너지를 계산하는 양자 역학의 기본 양입니다. 이 값을 최소화하는 것은 VQE가 바닥 상태를 찾기 위한 표준적이고 가장 직접적인 접근 방식입니다.
  • $|0\rangle^{\otimes n}$:

    • 수학적 정의: 모든 $n$개의 큐비트가 $|0\rangle$ 상태로 설정된 초기 계산 기반 상태를 나타냅니다.
    • 물리적/논리적 역할: 이것은 대부분의 양자 회로에 대한 표준적이고 쉽게 준비할 수 있으며 얽히지 않은 시작 상태입니다. 모든 후속 양자 연산이 시작되는 "빈 슬레이트" 역할을 합니다.
    • 왜 이 연산자인가? 가장 간단하고 가장 일반적인 초기 상태이며, 양자 계산을 위한 보편적이고 재현 가능한 시작점을 제공합니다.
  • $V(\gamma)$:

    • 수학적 정의: "인코더" 회로로 알려진 매개변수화된 단위 연산자입니다. 초기 상태 $|0\rangle^{\otimes n}$을 가져와 설계된 입력 상태 $|\Psi_0(\gamma)\rangle$로 변환합니다. 매개변수 $\gamma$는 이 회로 내의 특정 게이트와 회전을 제어하는 조정 가능한 고전 값 집합입니다.
    • 물리적/논리적 역할: 이 연산자는 본 논문의 핵심 혁신입니다. 그 역할은 후속 VQA 안자츠에 대해 더 "스마트"하거나 더 유리한 초기 상태를 준비하는 것입니다. 입력 상태를 수정함으로써, 이는 대상 상태를 더 접근 가능하게 만드는 주 안자츠에 의해 도달 가능한 상태 집합을 효과적으로 재구성합니다. 효율성을 유지하기 위해 저심도 회로로 설계되었습니다.
    • 왜 이 연산자인가? 양자 진화는 확률을 보존하고 양자 역학 원리를 준수하기 위해 단위여야 하므로 단위 연산자입니다. 유연한 최적화와 다양한 문제에 대한 적응을 허용하기 위해 매개변수화되어 있어 문제에 맞춰진 입력 상태를 설계할 수 있습니다.
  • $U(\theta)$:

    • 수학적 정의: "안자츠" 회로를 나타내는 매개변수화된 단위 연산자입니다. 입력 상태 $|\Psi_0(\gamma)\rangle$(또는 기존 VQA의 $|\Psi_0\rangle$)를 가져와 최종 변분 상태 $|\Psi(\theta,\gamma)\rangle$로 변환합니다. 매개변수 $\theta$는 이 회로 내의 게이트를 제어하는 조정 가능한 고전 값 집합입니다.
    • 물리적/논리적 역할: 이것은 대상 양자 상태(예: $H$의 바닥 상태)를 근사하려고 시도하는 주요 변분 양자 회로입니다. 그 표현력은 힐베르트 공간 내에서 생성하고 탐색할 수 있는 양자 상태의 범위를 결정합니다.
    • 왜 이 연산자인가? $V(\gamma)$와 마찬가지로 양자 컴퓨터에서 물리적으로 실현 가능하려면 단위여야 합니다. 매개변수화를 통해 대상 상태의 최적 근사를 찾기 위한 반복적인 최적화가 가능합니다. $U(\theta)$의 특정 구조(예: 하드웨어 효율적인 안자츠 또는 해밀토니안 변분 안자츠)는 문제와 사용 가능한 하드웨어에 따라 선택됩니다.
  • $H$:

    • 수학적 정의: 물리 시스템의 해밀토니안 연산자입니다. $H = H^\dagger$인 에르미트 연산자입니다.
    • 물리적/논리적 역할: 이 연산자는 양자 시스템의 총 에너지를 나타냅니다. VQE의 맥락에서 목표는 이 해밀토니안의 기대값을 최소화하는 양자 상태를 찾는 것이며, 이는 시스템의 바닥 상태에 해당합니다.
    • 왜 이 연산자인가? 해밀토니안은 양자 역학에서 시스템의 에너지와 시간 진화를 설명하는 기본 연산자입니다. 그 기대값은 VQE가 최소화하려는 양입니다.
  • $U^\dagger(\theta)$:

    • 수학적 정의: 단위 연산자 $U(\theta)$의 에르미트 켤레(또는 수반)입니다. $U(\theta)$가 단위이므로 $U^\dagger(\theta) = U^{-1}(\theta)$입니다.
    • 물리적/논리적 역할: 이 연산자는 $U(\theta)$에 의해 수행된 변환을 "되돌립니다". 기대값에서, 그것은 $V(\gamma)|0\rangle$에 의해 정의된 공간으로 효과적으로 투영하면서, $H U(\theta)V(\gamma)|0\rangle$ 상태에 작용합니다.
    • 왜 이 연산자인가? 이것은 브라 벡터 $\langle\Psi|$를 형성하는 데 필수적인 부분입니다. $|\Psi\rangle = U(\theta)V(\gamma)|0\rangle$이면, $\langle\Psi| = \langle 0|V^\dagger(\gamma)U^\dagger(\theta)$입니다. 이것은 기대값을 계산하기 위한 수학적 필수 사항입니다.
  • $V^\dagger(\gamma)$:

    • 수학적 정의: 단위 연산자 $V(\gamma)$의 에르미트 켤레(또는 수반)입니다. $V(\gamma)$가 단위이므로 $V^\dagger(\gamma) = V^{-1}(\gamma)$입니다.
    • 물리적/논리적 역할: $U^\dagger(\theta)$와 유사하게, 이 연산자는 $V(\gamma)$에 의해 수행된 변환을 "되돌립니다". 그것은 $U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle$ 상태에 왼쪽에서 작용합니다.
    • 왜 이 연산자인가? 브라 벡터 $\langle\Psi|$의 형성을 완료하여 기대값의 올바른 계산을 보장합니다.
  • $\langle 0| \dots |0\rangle$:

    • 수학적 정의: 이것은 상태 $V^\dagger(\gamma)U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle$와 초기 상태 $|0\rangle^{\otimes n}$의 내적을 나타냅니다.
    • 물리적/논리적 역할: 전체 표현식 $\langle 0| \dots |0\rangle$는 기대값을 계산합니다. 양자 역학에서 관측량의 기대값은 상태와 그 켤레 전치를 상태와 그 켤레 전치 사이에 "샌드위치"함으로써 얻어집니다. 이것이 시스템의 평균 에너지가 측정되는 방식입니다.
    • 왜 이 연산자인가? 내적은 양자 상태를 다른 상태로 투영하거나 한 상태에서 다른 상태를 찾을 확률 진폭을 계산하는 데 사용되는 수학적 연산입니다. 여기서는 기대값을 계산하는 데 사용됩니다.
  • 곱셈 대신 덧셈을 사용하는 이유? 연산자 $V(\gamma)$, $U(\theta)$, $H$, $U^\dagger(\theta)$, 및 $V^\dagger(\gamma)$는 양자 상태에 대한 순차적인 연산을 나타내기 때문에 곱해집니다. 양자 역학에서 여러 게이트 또는 연산자를 상태에 적용하는 것은 적용 순서대로 해당 행렬을 곱함으로써 표현됩니다. 먼저 $V(\gamma)$가 $|0\rangle^{\otimes n}$에 작용하고, 다음으로 $U(\theta)$가 결과 상태에 작용하고, 다음으로 $H$가 해당 상태에 작용하고, 마지막으로 브라 벡터 $\langle 0|V^\dagger(\gamma)U^\dagger(\theta)$가 왼쪽에서 작용하여 기대값을 계산합니다. 이 연산 시퀀스는 양자 회로가 작동하는 방식의 기본입니다.

  • 적분 대신 합계를 사용하는 이유? 양자 컴퓨터에서 측정될 때 기대값은 측정 결과의 합계를 포함합니다. 계산 기반 상태의 이산 집합에 대해 기대값은 본질적으로 관측량의 고유값에 의해 가중치가 부여된 확률의 합입니다. 적분은 일반적으로 VQA의 직접적인 출력인 현재 하드웨어에서 연속 변수에 사용됩니다.

단계별 흐름

초기 $|0\rangle^{\otimes n}$인 추상적인 단일 양자 상태가 정교한 양자 조립 라인을 통과하여 대상 바닥 상태의 고도로 최적화된 근사치로 변환되는 과정을 상상해 보세요.

  1. 초기 상태 입력: 프로세스는 시스템이 간단하고 얽히지 않은 계산 기반 상태 $|0\rangle^{\otimes n}$으로 준비되면서 시작됩니다. 이것이 첫 번째 조립 라인 단계에 들어가는 "원자재"입니다.

  2. 인코더 사전 처리: 이 원자재 $|0\rangle^{\otimes n}$ 상태는 먼저 "인코더" 회로 $V(\gamma)$에 들어갑니다. 이 회로는 $\gamma$ 매개변수에 의해 제어되며, 특수 사전 처리기 역할을 합니다. 일련의 신중하게 선택된 단일 및 다중 큐비트 게이트(회전, 얽힘 연산)를 적용하여 간단한 $|0\rangle^{\otimes n}$을 복잡한 "설계된 입력 상태" $|\Psi_0(\gamma)\rangle$로 변환합니다. 이 단계는 주요 제조 공정에 들어가기 전에 원자재를 특정 유리한 형태로 만드는 것과 유사합니다. 목표는 이 사전 처리된 상태가 최종 제품에 대한 양자 상태 공간에서 이미 "더 가까운" 상태가 되도록 하는 것입니다.

  3. 안자츠 주요 변환: 설계된 입력 상태 $|\Psi_0(\gamma)\rangle$는 이제 주요 "안자츠" 회로 $U(\theta)$로 진행됩니다. 이것은 $\theta$에 의해 매개변수화된 핵심 변분 엔진입니다. 또 다른 일련의 양자 게이트를 적용하여 $|\Psi_0(\gamma)\rangle$를 최종 변분 상태 $|\Psi(\theta,\gamma)\rangle = U(\theta)|\Psi_0(\gamma)\rangle$로 변환합니다. 이것은 상태가 대상 바닥 상태를 가능한 한 가깝게 근사하도록 반복적으로 개선되는 주요 제조 단계입니다.

  4. 에너지 측정 (개념적): 상태 $|\Psi(\theta,\gamma)\rangle$가 준비되면, 해밀토니안 $H$에 의해 시간 진화의 의미로 직접 "작용"되지 않습니다. 대신, 그 에너지가 측정됩니다. 여기에는 해밀토니안 $H$를 측정 가능한 파울리 항의 합으로 분해하는 것이 포함됩니다. 각 항에 대해 양자 컴퓨터는 $|\Psi(\theta,\gamma)\rangle$에 대한 측정을 수행하여 기대값을 얻습니다.

  5. 기대값 집계: 이러한 측정 결과는 고전적으로 집계됩니다. $E(\theta,\gamma)$ 기대값은 해밀토니안의 계수로 가중치가 부여된 개별 파울리 항의 측정된 기대값을 합산하여 계산됩니다. 이 최종 수치 값 $E(\theta,\gamma)$는 현재 변분 상태의 "품질 점수"를 나타내며, 그 에너지가 실제 바닥 상태 에너지에 얼마나 가까운지를 나타냅니다. 이것으로 양자-고전 루프를 한 번 통과하는 것이 완료됩니다.

최적화 역학

이 메커니즘은 에너지 기대값 $E(\theta,\gamma)$를 최소화하는 최적 매개변수 $(\theta_{\text{opt}}, \gamma_{\text{opt}})$를 찾기 위해 하이브리드 양자-고전 최적화 루프를 통해 학습, 업데이트 및 수렴합니다.

  1. 2단계 최적화 전략: 복잡성을 관리하고 효율성을 개선하기 위해 학습 프로세스는 두 가지 주요 단계로 구성됩니다.

    • 안자츠 사전 훈련: 처음에 안자츠 회로 $U(\theta)$만 최적화됩니다. 여기에는 간단한 입력 상태(예: $|0\rangle^{\otimes n}$)로 시작하여 $E(\theta) = \langle 0|U^\dagger(\theta) H U(\theta)|0\rangle$를 최소화하기 위해 $\theta$를 반복적으로 조정하는 것이 포함됩니다. 고전 최적화기(경사 하강법 또는 경사 없는 방법)는 $E(\theta)$로 정의된 손실 지형을 탐색합니다. 최적화기는 $\nabla_\theta E(\theta)$의 기울기(또는 추정치)를 계산하여 가장 가파른 하강 방향을 결정하고 매개변수 $\theta$를 국소 최소값으로 안내합니다. 이 단계는 기울기 노름이 미리 정의된 임계값 아래로 떨어져 안정적인 지점을 나타낼 때까지 계속되며, 사전 최적화된 매개변수 집합 $\tilde{\theta}_{\text{opt}}$를 생성합니다. 이 단계는 주어진 회로 깊이에 대한 기준 성능을 설정하는 데 중요합니다.
    • 인코더 및 안자츠 공동 최적화: 사전 훈련 후 입력 상태 설계 메커니즘이 활성화됩니다. $M$개의 계산 기반 상태 풀이 샘플링되고, 사전 훈련된 안자츠 $U(\tilde{\theta}_{\text{opt}})$를 사용하여 에너지 추정치가 계산됩니다. 이 풀에서 $m$개의 "유망한" 상태가 선택되어( $|0\rangle^{\otimes n}$ 포함) 새 입력 상태 $|\Psi_0(\gamma)\rangle$에 대한 중첩의 기반을 형성합니다. 그런 다음 전체 회로 $U(\theta)V(\gamma)$가 고려되고, 두 매개변수 집합 $\theta$와 $\gamma$가 공동으로 최적화되어 $E(\theta,\gamma) = \langle 0|V^\dagger(\gamma)U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle$를 최소화합니다. 안자츠 매개변수는 $\tilde{\theta}_{\text{opt}}$로 초기화되고, 인코더 매개변수 $\gamma$는 무작위로 초기화됩니다.
  2. 기울기 동작 및 손실 지형:

    • 최적화 중에 고전 최적화기는 계산된 기울기 $\nabla_\theta E(\theta,\gamma)$ 및 $\nabla_\gamma E(\theta,\gamma)$에 따라 $\theta$와 $\gamma$를 반복적으로 업데이트합니다. 이러한 기울기는 각 매개변수에 대한 에너지 지형의 기울기를 나타냅니다. 매개변수는 에너지를 낮추기 위해 기울기의 반대 방향으로 조정됩니다.
    • VQA의 손실 지형은 매우 복잡할 수 있으며, 종종 수많은 국소 최소값과 큐비트 수에 따라 기울기가 기하급수적으로 사라져 수렴을 방해하는 "황무지 고원"으로 특징지어집니다.
    • 이 논문의 핵심 통찰력은 $V(\gamma)$를 통한 입력 상태 설계가 이 손실 지형을 효과적으로 재구성한다는 것입니다. 안자츠 $U(\theta)$를 더 유리한 초기 상태 $|\Psi_0(\gamma)\rangle$에서 시작함으로써, 도달 가능 집합이 이동됩니다. 이 이동은 최적화기가 접근하기 쉬운 영역으로 에너지 지형의 전역 최소값을 이동시키거나, 대상 상태 근처에서 지형을 "더 부드럽게" 만들어 황무지 고원을 완화하고 훈련 가능성을 개선할 수 있습니다. 저자들은 새로운 문제가 되는 국소 최소값을 도입하거나 훈련 어려움을 증가시키지 않기 위해 인코더 $V(\gamma)$를 의도적으로 얕게 유지합니다.
  3. 반복적인 상태 업데이트 및 수렴:

    • 공동 최적화의 각 반복에서 매개변수 $\theta$와 $\gamma$는 계산된 기울기에 따라 업데이트됩니다. 이러한 업데이트된 매개변수는 새 양자 회로 $U(\theta)V(\gamma)$를 정의하며, 이는 새 변분 상태 $|\Psi(\theta,\gamma)\rangle$를 준비합니다.
    • 그런 다음 이 새 상태의 에너지 $E(\theta,\gamma)$가 측정되고, 사이클이 반복됩니다. 이 반복 프로세스는 양자 상태 $|\Psi(\theta,\gamma)\rangle$를 해밀토니안 $H$의 실제 바닥 상태에 점점 더 가깝게 만듭니다.
    • 수렴은 일반적으로 에너지 $E(\theta,\gamma)$가 안정화되거나 실제 바닥 상태 에너지에 매우 가까운 값에 도달하고, 충실도(실제 바닥 상태와의 중첩)가 1에 가까워질 때 달성됩니다. 본 논문은 이 입력 상태 설계가 기존 VQA에 비해 일관되게 더 높은 정확도와 더 빠른 수렴(더 적은 레이어, 더 적은 반복)을 가져온다고 보여주며, 이는 힐베르트 공간을 더 효율적으로 탐색하고 최적 상태를 더 잘 찾을 수 있음을 나타냅니다. 최적화는 일반적으로 고전적 오버헤드를 제어하기 위해 적당한 수의 반복(예: 200회)으로 제한됩니다.

결과, 한계 및 결론

실험 설계 및 기준선

저자들의 실험 설계는 입력 상태를 지능적으로 설계하는 것이 회로 깊이나 매개변수 수를 늘리지 않고도 VQA의 도달 가능성과 성능을 크게 향상시킬 수 있다는 핵심 주장을 철저히 검증하기 위해 세심하게 제작되었습니다. 핵심 아이디어는 기존의 곱 상태 $|0\rangle^{\otimes n}$ 또는 $|+\rangle^{\otimes n}$ 대신, 중첩 입력 상태 $|\Psi_0(\gamma)\rangle = V(\gamma)|0\rangle^{\otimes n} = \sum_{j=1}^m \alpha_j |\psi_j\rangle$를 준비하는 "인코더" 회로 $V(\gamma)$를 도입하는 것입니다. 이 인코더는 후속 안자츠 회로 $U(\theta)$의 도달 가능 집합을 힐베르트 공간에서 효과적으로 이동시켜 대상 상태를 더 접근 가능하게 만듭니다.

실험 아키텍처는 다단계 최적화 프로세스를 포함했습니다.
1. 사전 훈련: 표준 안자츠 회로 $U(\theta)$(하드웨어 효율적인 안자츠(HEA) 또는 해밀토니안 변분 안자츠(HVA) 중 하나)는 먼저 기존 입력 상태(예: $|0\rangle^{\otimes n}$)를 사용하여 최적화되어 초기 매개변수 집합 $\theta_{\text{opt}}$를 얻었습니다. 이 단계는 주어진 회로 깊이에 대한 기준 성능을 설정합니다.
2. 후보 상태 선택: $M$개의 계산 기반 상태 $\{|j^{(k)}\rangle\}_{k=1}^M$ 풀이 샘플링되었습니다. 각 상태에 대해 에너지 기대값 $E_{j^{(k)}} = \langle j^{(k)}|U^\dagger(\theta_{\text{opt}})HU(\theta_{\text{opt}})|j^{(k)}\rangle$가 양자 측정값을 사용하여 추정되었습니다. 측정 횟수는 목표 추정 오차 $\epsilon$에 대해 $N_m = 1/\epsilon^2$로 확장되었습니다. 이 풀에서 $m$개의 저에너지 상태($|0\rangle^{\otimes n}$ 포함)가 선택되어 새 입력 상태에 대한 중첩을 구성할 집합 $A_m$을 형성했습니다. $m$의 선택은 시스템 크기에 선형적으로 확장되도록(예: 12 큐비트의 경우 $m=6$) 이루어졌으며, 인코더의 게이트 비용이 안자츠의 단일 레이어와 유사하게 유지되도록 보장했습니다.
3. 공동 최적화: 선택된 $m$개의 기반 상태를 기반으로 인코더 $V(\gamma)$가 구성되었습니다. 그런 다음 인코더 $\gamma$와 안자츠 $\theta$의 매개변수가 공동으로 최적화되어 에너지 $E(\theta, \gamma) = \langle 0|V^\dagger(\gamma)U^\dagger(\theta)HU(\theta)V(\gamma)|0\rangle$를 최소화했습니다. 안자츠 매개변수는 $\theta_{\text{opt}}$로 초기화되었고, 인코더 매개변수 $\gamma$는 무작위로 초기화되었습니다. 이 공동 최적화는 고전적 오버헤드를 제어하기 위해 적당한 수의 반복(일반적으로 $T=200$)으로 제한되었습니다.

제안된 방법이 철저하게 테스트된 기준선 모델은 표준 곱 상태로 초기화된 기존 HEA 및 HVA 회로였습니다. 수학적 주장을 증명하는 열쇠는 일치하는 게이트 예산 또는 고정 회로 깊이 하에서 향상된 VQA(안자츠 + 인코더)의 성능을 이러한 기준선과 비교하는 것이었습니다. 이는 향상된 방법(L 레이어의 안자츠 + 1 인코더 레이어)의 총 양자 리소스(예: 레이어 수, CNOT 게이트)가 기준선(L+1 레이어의 안자츠)과 유사하게 유지되도록 했습니다. 이 아키텍처 선택은 관찰된 성능 향상이 단순히 더 깊거나 더 복잡한 회로를 사용하는 것이 아니라 입력 상태 설계에 직접적으로 기인하도록 보장했습니다.

실험은 몇 가지 대표적인 양자 다체 모델에 대해 수행되었습니다.
* 1D 횡단 자기 이징 모델 (TFIM): 12 큐비트 시스템과 HEA를 안자츠로 사용했습니다.
* 2D TFIM: 다양한 횡단 자기 강도에서 HVA를 안자츠로 사용했습니다.
* 클러스터-이징 모델: HVA를 안자츠로 사용했습니다.
* 1D 페르미-허바드 모델: 다양한 상호 작용 강도에서 절반 채움 상태의 HVA를 안자츠로 사용했습니다.

성능은 주로 바닥 에너지와 충실도(F = $|\langle \Psi|\Psi_{\text{tar}}\rangle|^2$)뿐만 아니라 양자 리소스(회로 깊이, CNOT 게이트) 및 고전 리소스(최적화 단계)로 측정되었습니다.

증거가 증명하는 것

본 논문에서 제시된 증거는 입력 상태 설계가 VQA의 도달 가능성과 성능을 향상시키는 강력하고 광범위하게 적용 가능한 도구임을 확실하게 증명합니다. 정리 1에 의해 엄격하게 증명된 핵심 메커니즘은 $m$개의 직교 상태의 선형 중첩으로 입력 상태를 구성함으로써, 달성 가능한 최대 충실도 $F$는 개별 충실도 $F_j = |\langle \psi_j|\Psi_{\text{tar}}\rangle|^2$의 합이라는 것입니다. 이를 통해 얕은 회로에서도 안자츠의 도달 가능 집합을 대상 상태를 포함하도록 효과적으로 수정할 수 있습니다.

다음은 부인할 수 없는 증거입니다.

  • 1D 횡단 자기 이징 모델 (HEA): 12 큐비트 1D TFIM의 경우, 향상된 HEA는 8개의 레이어(112 CNOT 게이트)만으로 0.99의 충실도를 달성했습니다. 대조적으로, 기존 HEA는 동일한 충실도에 도달하기 위해 12개의 레이어(144 CNOT 게이트)가 필요했으며, 이는 상당한 33%의 회로 깊이 감소를 나타냅니다 (그림 4(a)-(b)). 또한, 향상된 방법은 기존 HEA의 1500개에 비해 1100개의 최적화 단계만 필요했으며, 고전적 리소스에서도 이득을 보여주었습니다. 훈련 궤적은 인코더가 도입된 후 에너지와 충실도의 빠른 개선을 명확하게 보여줍니다 (그림 4(c)-(d)).

  • 2D 횡단 자기 이징 모델 (HVA): 다양한 자기 강도($h \in \{0.5, 1.0, 1.5\}$)에 걸쳐 향상된 HVA는 기존 HVA보다 일관되게 우수한 성능을 보였습니다. 이는 더 낮은 회로 깊이에서 더 낮은 변분 에너지와 더 높은 충실도를 달성했습니다 (그림 5). $m=8$개의 기반 상태로 구성된 인코더는 HVA의 단일 레이어와 유사한 게이트 비용을 가졌으므로 일치하는 게이트 예산 하에서 공정한 비교를 보장했습니다.

  • 클러스터-이징 모델 (HVA): 이 모델의 경우, 향상된 HVA는 6개의 레이어(450개의 2큐비트 게이트)만으로 0.99의 충실도에 도달한 반면, 기존 HVA는 9개의 레이어(558개의 2큐비트 게이트)가 필요했습니다. 고전적 리소스 비교는 더욱 놀라웠습니다. 입력 상태 설계 방법은 $C_R = 54550$개의 최적화 단계를 필요로 한 반면, 기존 HVA는 $C_R = 118800$개를 요구했습니다. 이것은 우수한 효율성의 명확한 시연입니다.
  • 1D 페르미-허바드 모델 (HVA): 이 모델은 강하게 상관된 시스템에 대한 엄격한 테스트 역할을 했습니다. $U=2$의 경우, 향상된 HVA는 5개의 레이어로 0.99의 충실도를 달성한 반면, 기존 HVA는 9개의 레이어가 필요했습니다. 더 중요한 것은, 기존 방법이 초기화 민감성 및 황무지 고원으로 인해 종종 0.6의 충실도에서 정체되었던 더 높은 상호 작용 강도($U=5$ 및 $U=10$)의 경우, 입력 상태 설계는 일관되게 충실도를 0.99 이상으로 밀어 올렸습니다 (그림 8). 이는 인코더가 물리적으로 관련성 있고 표현력이 풍부한 초기화를 제공하는 능력을 강조합니다.
  • 리소스 오버헤드 분석: 본 논문은 또한 샘플링 수 $M$ 및 인코더 크기 $m$과 관련된 오버헤드를 분석했습니다. $M$을 증가시키면 정확도가 향상되지만 수익이 감소하며, 적당한 $M$으로 유용한 개선이 이루어진다는 것을 보여주었습니다 (그림 9). 예를 들어, 12 큐비트 시스템의 경우 $M$을 2000에서 400으로 줄여도 여전히 0.99의 충실도를 얻었습니다. $M=400$ 후보에 대한 사전 선택의 고전적 비용은 적당했으며, 12 큐비트 이징 모델에 대한 총 고전 비용 USD 189600에 약 USD 1000을 추가했습니다 (논문에 언급되었지만 표 참조는 누락되었지만, 표 2일 가능성이 높음). 이 결합된 비용 USD 190600은 동일한 목표 충실도를 달성하기 위해 기존 HEA 기준선이 필요했던 USD 432000보다 훨씬 낮았습니다.

요약하자면, 다양한 모델과 안자츠 계열에 걸쳐 일관된 충실도 개선, 회로 깊이 감소 및 낮은 고전 최적화 비용은 모두 일치하는 게이트 예산 하에서 입력 상태 설계 메커니즘이 VQA의 도달 가능성을 효과적으로 향상시킨다는 부인할 수 없는 증거를 제공합니다.

한계 및 향후 방향

입력 상태 설계 프레임워크는 VQA의 도달 가능성 문제에 대한 설득력 있는 해결책을 제공하지만, 저자들은 몇 가지 한계와 미래 연구를 위한 열린 기회를 인정합니다.

주요 한계 중 하나는 현재 인코더 구성 및 후보 선택 전략의 휴리스틱 특성에 있습니다. 본 논문은 "우리의 현재 인코더 구성 및 후보 선택 전략은 최적이 아닌 휴리스틱에 크게 기반한다"고 명시적으로 밝히고 있습니다. 이는 이 방법이 잘 작동하지만, 중첩에 대한 최적의 기반 상태를 식별하고 인코더 회로 $V(\gamma)$를 구성하는 데 더 효율적이거나 강력한 방법이 있을 수 있음을 시사합니다. 현재 접근 방식은 $M$개의 계산 기반 상태를 샘플링하고 $m$개의 저에너지 상태를 선택하는 데 의존하며, 이는 효과적이지만 특히 해밀토니안에 대한 사전 지식이 없는 문제의 경우 리소스 효율적이거나 전역적으로 최적인 전략이 아닐 수 있습니다.

또 다른 논의 지점은 샘플링 예산 $M$과 관련이 있습니다. 본 논문은 적당한 $M$으로 유용한 개선이 이루어지고 $M$을 증가시키면 수익이 감소한다는 것을 보여주지만, 근본적인 문제는 남아 있습니다. 해밀토니안에 대한 사전 지식이 없는 경우, 이론적으로 높은 충실도를 보장하려면 거의 모든 $2^n$ 계산 기반 상태를 샘플링해야 하며, 이는 기하급수적으로 비효율적입니다. 저자들은 $M$이 시스템 크기에 따라 다항식으로 증가하는 영역에 초점을 맞추지만, 샘플링 오버헤드와 목표 정확도 간의 절충점은 여전히 더 큰 시스템으로 확장하는 데 있어 실용적인 고려 사항입니다.

또한, 입력 상태 설계는 도달 가능성 병목 현상을 수정 가능한 집합을 수정하여 해결하지만, 황무지 고원과의 관계는 미묘합니다. 저자들은 고전적으로 시뮬레이션할 수 없는 고도로 얽힌 입력 상태를 사용하면 프로토콜이 고전적으로 시뮬레이션 가능한 입력 상태에 적용되는 황무지 고원 불가 정리(no-go theorem)에 직면하지 않고도 양자 우위를 달성할 수 있다고 제안합니다. 그러나 인코더 자체는 새로운 훈련 문제를 도입하지 않기 위해 의도적으로 얕게 유지됩니다. 이는 안자츠 회로 자체의 근본적인 황무지 고원 문제는 직접적으로 해결되지 않고 더 나은 시작점을 통해 우회된다는 것을 시사합니다.

이러한 통찰력을 바탕으로 이러한 결과의 추가 개발 및 발전을 위한 몇 가지 논의 주제가 나타납니다.

  1. 적응형 및 지능형 후보 상태 선택: 후보 기반 상태 선택을 위한 단순한 에너지 기반 필터링을 넘어서 어떻게 나아갈 수 있을까요? 미래 연구는 강화 학습 또는 능동 학습과 같은 고급 기계 학습 기술을 탐색하여 가장 "정보가 풍부한" 기반 상태 또는 입력 중첩에 대한 비계산 기반 상태를 적응적으로 식별할 수 있습니다. 이는 샘플링 예산 $M$과 필요한 측정 횟수를 크게 줄여 사전 선택 단계를 더 리소스 효율적이고 확장 가능하게 만들 수 있습니다.
  2. 최적 인코더 아키텍처 및 매개변수화: 현재 인코더 $V(\gamma)$는 계산 기반 상태의 중첩을 준비하도록 구성됩니다. 더 복잡한 얽힌 입력 상태를 더 효율적으로 준비할 수 있는 더 정교하거나 문제별 인코더 아키텍처를 탐색할 수 있을까요? 여기에는 해밀토니안의 대칭성을 활용하는 인코더를 설계하거나 양자 정보 이론의 통찰력을 통합하여 $V(\gamma)$ 자체의 $\alpha_j$ 계수와 게이트 구조를 최적화하는 것이 포함될 수 있습니다.
  3. 상호 보완적인 황무지 고원 완화: 입력 상태 설계는 도달 가능성을 개선하지만, 안자츠 회로에 대한 황무지 고원 문제를 직접적으로 해결하지는 않습니다. 중요한 미래 방향은 입력 상태 설계를 다른 황무지 고원 완화 기술(예: 매개변수 초기화 전략, 국소 비용 함수 또는 문제 기반 안자츠)과 상호 보완적으로 결합하는 방법을 조사하는 것입니다. 신중하게 선택된 얽힌 입력 상태가 후속 안자츠 최적화의 손실 지형을 "평탄화"하거나 "가파르게" 하여 훈련 가능성을 개선할 수 있을까요?
  4. 더 큰 시스템에 대한 확장성 및 리소스 분석: 현재 시뮬레이션은 최대 12 큐비트로 제한됩니다. 중요한 질문은 오버헤드(샘플링 $M$, 인코더 게이트 수, 고전 최적화 단계)가 훨씬 더 큰 양자 시스템에 대해 어떻게 확장되는가입니다. $n$이 증가함에 따라 $M$ 및 $m$의 최적 절충점과 실제 한계를 확립하기 위해 상세한 이론적 및 수치적 분석이 필요하며, 이를 통해 이 방법이 내결함성 양자 컴퓨팅에 대해 실행 가능하게 유지되도록 보장합니다.
  5. 다른 VQA 작업으로의 일반화: 현재 작업은 주로 바닥 상태 준비에 중점을 둡니다. 이 입력 상태 설계 프레임워크를 다른 VQA 응용 프로그램(예: 양자 기계 학습, 최적화 문제(예: QAOA) 또는 들뜬 상태 시뮬레이션)으로 어떻게 확장하고 검증할 수 있을까요? 각 응용 프로그램은 대상 상태에 대한 고유한 요구 사항을 가질 수 있으며, 이는 입력 상태 설계를 위한 다른 전략을 필요로 합니다.
  6. 노이즈 내성 및 하드웨어 구현: 현재 및 근거리 양자 하드웨어의 고유한 노이즈를 고려할 때, 입력 상태 설계 접근 방식은 다양한 노이즈 모델(예: 탈분극, 위상 제거, 판독 오류)에 얼마나 강건한가? 미래 작업은 인코더 회로에 특별히 맞춰진 노이즈 인식 입력 상태 설계 전략 또는 오류 완화 기술을 탐색하여 실제 하드웨어 구현에서 성능 이득이 유지되도록 할 수 있습니다.
Figure 9. Impact of sampling size on infidelity for basis-state in pre-selection step. We consider the 12-qubit 1D transverse-field Ising model with a 5-layer HEA as the variational circuit U(θ) and m = 6. The horizontal axis shows the sampling number M, and the vertical axis reports the final infidelity 1 −F obtained after the joint optimization. Increasing M improves the final accuracy by providing a better set of candidate basis states for constructing the encoder input state, while the improvement quickly saturates for larger M, indicating diminishing returns beyond a moderate sampling number Table 2. Minimum sample size required to reach target fidelity in the transverse- field Ising model. Results are shown for target fidelities F = 0.99 and 0.95 and for n ∈{6, 8, 10, 12} qubits. The number of selected computational-basis states is set to m = 4 for n = 6, 8 and m = 6 for n = 10, 12. We also report the final fidelity achieved by the baseline hardware-efficient ansatz (HEA) without input-state design under a matched quantum-resource budget: the baseline uses (L + 1) HEA layers, whereas our method uses L HEA layers plus one encoder layer Figure 5. Simulation results for the 12-qubit 2D Ising model at h = 0.5, 1, and 1.5. The upper panels (a, c, e) show the ground energy as a function of circuit depth p for h = 0.5, 1, and 1.5, respectively, and the lower panels (b, d, f) show the corresponding fidelity to the exact ground state. The blue curves correspond to the conventional HVA, and the orange curves correspond to the input-state design (enhanced HVA). Each marker represents the mean over 100 random initializations, and the error bars represent standard deviations over these runs. Across all three values of h, the input-state design consistently achieves lower variational energies and higher fidelities under the same depth, and it reaches the 0.99 fidelity threshold with fewer layers than the baseline