Улучшение достижимости вариационных квантовых алгоритмов посредством проектирования входного состояния
Проблема, рассматриваемая в данной статье, берет свое начало в бурно развивающейся области квантовых вычислений, в частности, в контексте квантовых устройств промежуточного масштаба с шумами (NISQ).
Предыстория и академическая родословная
Происхождение и академическая родословная
Проблема, рассматриваемая в данной статье, берет свое начало в бурно развивающейся области квантовых вычислений, в частности, в контексте квантовых устройств промежуточного масштаба с шумами (NISQ). Квантовые компьютеры обладают огромным потенциалом для решения задач, недоступных для классических машин, однако современные NISQ-аппаратные средства ограничены несовершенствами инициализации, операций и считывания. Центральной задачей для этих устройств ближнего срока является демонстрация "квантового преимущества" – то есть, решение практических задач более эффективно, чем классические компьютеры.
Вариационные квантовые алгоритмы (VQA) стали ведущим подходом к решению этой задачи. Впервые представленные около 2014 года с Вариационным квантовым решателем собственных значений (VQE) [20, 104, 105], VQA формулируют сложные вычислительные задачи как задачи оптимизации. Основная идея заключается в аппроксимации желаемого квантового состояния, часто основного состояния гамильтониана $H$ физической системы, путем минимизации функции стоимости $E(\theta)$. Это достигается путем подготовки параметризованного квантового состояния, известного как "анзац-состояние" $|\Psi(\theta)\rangle = U(\theta)|\Psi_0\rangle$. Здесь $U(\theta)$ – квантовая схема с настраиваемыми параметрами $\theta$, а $|\Psi_0\rangle$ – начальное входное состояние, традиционно простое произведение состояний, такое как $|0\rangle^{\otimes n}$. Классический оптимизатор затем итеративно корректирует $\theta$ для минимизации $E(\theta)$.
Фундаментальным ограничением, или "болевой точкой", предыдущих подходов VQA является компромисс между "выразительностью" (диапазон состояний, которые может произвести схема) и "обучаемостью" (насколько легко параметры могут быть оптимизированы). Более глубокие, более выразительные схемы теоретически могут достигать более широкого спектра квантовых состояний, но они очень восприимчивы к накоплению шума и печально известной проблеме "бесплодных плато", где ландшафт оптимизации становится чрезвычайно плоским, делая обучение невозможным. И наоборот, мелкие схемы более обучаемы и менее подвержены шуму, но они часто имеют "недостаточный достижимый набор" – то есть, целевое квантовое состояние $|\Psi_{\text{tar}}\rangle$ просто не входит в число состояний, которые схема может произвести, независимо от того, насколько идеально настроены параметры $\theta$.
Исторически сложилось так, что большинство исследовательских усилий по улучшению VQA были сосредоточены почти исключительно на разработке лучших анзац-схем $U(\theta)$. Среди стратегий были аппаратно-эффективные анзацы (HEA), гамильтонианные вариационные анзацы (HVA) и адаптивные схемы. Однако роли начального входного состояния $|\Psi_0\rangle$ в определении достижимого набора уделялось сравнительно мало внимания. Этот недосмотр означал, что даже при хорошо разработанной схеме $U(\theta)$, если целевое состояние находилось вне достижимого набора, определяемого фиксированным входным состоянием, алгоритм неизбежно сходился бы к субоптимальной аппроксимации. Данная статья направлена на решение этой проблемы путем фокусировки на проектировании входного состояния, тем самым расширяя достижимый набор без увеличения глубины схемы или количества параметров, предлагая мощное дополнение к существующим стратегиям проектирования схем.
Интуитивные термины предметной области
- Вариационные квантовые алгоритмы (VQA): Представьте, что вы пытаетесь найти лучший рецепт сложного блюда, используя новую, несколько капризную духовку. VQA подобен процессу "умного проб и ошибок": вы начинаете с базового рецепта (квантовая схема с начальными настройками), выпекаете, пробуете результат (измеряете функцию стоимости) и затем корректируете настройки рецепта (параметры схемы) на основе вкуса. Вы повторяете этот цикл, пока блюдо не станет настолько идеальным, насколько это позволяет ваша духовка.
- Квантовые устройства промежуточного масштаба с шумами (NISQ): Это похоже на ранние прототипы сверхбыстрого, сложного калькулятора. Они могут выполнять удивительные вычисления, которые обычные калькуляторы не могут, но они все еще немного глючат, допускают мелкие ошибки и могут обрабатывать только ограниченное количество шагов, прежде чем ошибки накопятся. Это квантовые компьютеры, доступные нам сегодня, до того, как у нас появятся полностью исправленные, "отказоустойчивые" машины.
- Бесплодные плато: Представьте, что вы заблудились в огромной, плоской пустыне, пытаясь найти самую низкую точку. Куда бы вы ни посмотрели, местность кажется идеально ровной, что не позволяет определить, в каком направлении ведет спуск. В VQA это описывает задачу оптимизации, где "ландшафт" возможных решений становится настолько плоским, что классический оптимизатор не может найти никакого градиента для следования, фактически застревая и препятствуя алгоритму нахождения лучших параметров.
- Достижимый набор: Думайте об этом как о "меню" всех возможных исходов, которые может дать конкретный процесс приготовления, при заданном наборе ингредиентов и определенном методе приготовления. Если желаемый результат (например, идеально испеченный торт) отсутствует в этом меню, вы не сможете его получить, независимо от того, насколько сильно вы регулируете температуру или время духовки. В VQA это совокупность всех квантовых состояний, которые может сгенерировать данная квантовая схема.
- Анзац: Это "шаблон" или "чертеж" квантовой схемы. Он определяет общую структуру квантовых вентилей и операций, но с настраиваемыми "ручками" (параметрами), которые можно регулировать. Различные конструкции анзацев подобны различным типам двигателей – некоторые более эффективны для определенных задач, некоторые более мощные, но все имеют регулируемые части.
Таблица обозначений
| Обозначение | Описание |
|---|---|
| $|\Psi_{\text{tar}}\rangle$ | Целевое квантовое состояние, которое VQA стремится аппроксимировать (например, основное состояние гамильтониана). |
| $H$ | Наблюдаемая или гамильтониан квантовой системы, математическое ожидание которого минимизируется. |
| $|\Psi(\theta)\rangle$ | Параметризованное квантовое состояние, генерируемое анзац-схемой $U(\theta)$. |
| $U(\theta)$ | Унитарная анзац-схема, последовательность квантовых вентилей с настраиваемыми параметрами $\theta$. |
| $|\Psi_0\rangle$ | Начальное входное состояние для анзац-схемы, обычно простое произведение состояний, такое как $|0\rangle^{\otimes n}$. |
| $E(\theta)$ | Функция стоимости, которая минимизируется классическим оптимизатором для нахождения оптимальных параметров. |
| $\theta$ | Вектор настраиваемых параметров для анзац-схемы $U(\theta)$. |
| $\theta_{\text{opt}}$ | Оптимальные параметры, найденные путем минимизации функции стоимости $E(\theta)$. |
| $V(\gamma)$ | Энкодер-схема, дополнительная параметризованная схема, используемая для подготовки спроектированного входного состояния. |
| $|\Psi_0(\gamma)\rangle$ | Спроектированное входное состояние, суперпозиция кандидатных состояний, подготовленная энкодером $V(\gamma)$. |
| $\gamma$ | Вектор настраиваемых параметров для энкодер-схемы $V(\gamma)$. |
| $F$ | Фиделити, мера того, насколько сгенерированное квантовое состояние близко к целевому состоянию, определяемая как $F = |\langle\Psi|\Psi_{\text{tar}}\rangle|^2$. |
| $m$ | Количество выбранных взаимно ортогональных состояний, используемых для построения спроектированного входного состояния. |
| $M$ | Общее количество вычислительных базисных состояний, отобранных на этапе предварительного отбора. |
| $n$ | Количество кубитов в квантовой системе. |
Определение проблемы и ограничения
Формулировка основной проблемы и дилемма
В области вариационных квантовых алгоритмов (VQA) основная проблема, рассматриваемая в данной статье, связана с ограниченной "достижимостью" целевых квантовых состояний.
Входное/текущее состояние: Отправной точкой для VQA обычно является параметризованное квантовое состояние $|\Psi(\theta)\rangle = U(\theta)|\Psi_0\rangle$. Здесь $U(\theta)$ представляет собой унитарную квантовую схему с настраиваемыми параметрами $\theta$, а $|\Psi_0\rangle$ – простое, часто фиксированное, начальное входное состояние (например, вычислительное базисное состояние $|0\rangle^{\otimes n}$). Цель состоит в том, чтобы найти оптимальный набор параметров $\theta_{\text{opt}}$ путем минимизации функции стоимости, так чтобы результирующее состояние $|\Psi(\theta_{\text{opt}})\rangle$ точно аппроксимировало желаемое целевое квантовое состояние $|\Psi_{\text{tar}}\rangle$. Например, в Вариационном квантовом решателе собственных значений (VQE) $|\Psi_{\text{tar}}\rangle$ является основным состоянием заданного гамильтониана $H$.
Желаемая конечная точка/целевое состояние: Конечная цель – достичь аппроксимации целевого состояния $|\Psi_{\text{tar}}\rangle$ с высокой фиделити, что означает, что $|\langle\Psi_{\text{tar}}|\Psi(\theta_{\text{opt}})\rangle|^2$ должно быть близко к 1. Это подразумевает, что целевое состояние должно находиться в "достижимом наборе" состояний, которые анзац $U(\theta)$ может сгенерировать из входного состояния $|\Psi_0\rangle$.
Отсутствующее звено/математический пробел: Критическим отсутствующим звеном является то, что целевое состояние $|\Psi_{\text{tar}}\rangle$ может не содержаться в достижимом наборе $U(\theta)$ при старте из фиксированного, простого входного состояния $|\Psi_0\rangle$. Если $|\Psi_{\text{tar}}\rangle$ находится вне этого набора, никакая оптимизация параметров схемы $\theta$ не позволит VQA достичь его, что приведет к субоптимальным результатам независимо от вычислительных усилий. Данная статья стремится устранить этот пробел путем введения спроектированного входного состояния $|\Psi_0(\gamma)\rangle$, подготовленного дополнительной параметризованной энкодер-схемой $V(\gamma)$, таким образом, чтобы достижимый набор $U(\theta)|\Psi_0(\gamma)\rangle$ был модифицирован для включения $|\Psi_{\text{tar}}\rangle$. Математически, статья стремится максимизировать фиделити $F = |\langle\Psi_{\text{tar}}|U(\theta)V(\gamma)|0\rangle^{\otimes n}|^2$ путем совместной оптимизации $\theta$ и $\gamma$. Теорема 1 обеспечивает строгую основу, показывая, что линейная суперпозиция ортогональных входных состояний может систематически улучшать достижимую фиделити.
Дилемма: Основная дилемма в VQA, которая поставила в тупик предыдущих исследователей, заключается в болезненном компромиссе между выразительностью и обучаемостью.
* Выразительность: Более глубокие квантовые схемы (с большим количеством слоев или вентилей), как правило, более выразительны, что означает, что они, в принципе, могут достигать большего спектра квантовых состояний, включая потенциально целевое состояние.
* Обучаемость: Однако увеличение глубины схемы часто приводит к "бесплодным плато", где градиенты функции стоимости становятся экспоненциально малыми, что делает классическую оптимизацию чрезвычайно трудной или невозможной. Это препятствует сходимости алгоритма к оптимальным параметрам.
* И наоборот, мелкие схемы более обучаемы и менее подвержены бесплодным плато, но они часто имеют недостаточную достижимость, что означает, что их ограниченная выразительность не позволяет им аппроксимировать сложные целевые состояния.
Предыдущие усилия были в основном сосредоточены на проектировании унитарной схемы $U(\theta)$. Данная статья предлагает решить дилемму, сосредоточившись вместо этого на входном состоянии $|\Psi_0\rangle$, стремясь улучшить достижимость без существенного увеличения глубины схемы или количества параметров.
Ограничения и режимы отказа
Проблема улучшения достижимости VQA чрезвычайно сложна из-за нескольких суровых, реалистичных ограничений:
-
Ограничения памяти аппаратного обеспечения и накопление шума (физические/вычислительные): Квантовые компьютеры ближнего срока (NISQ) имеют ограниченное количество кубитов, короткое время когерентности и подвержены шуму. Более глубокие схемы, хотя и потенциально более выразительные, накапливают больше шума, что приводит к ошибкам и делает вывод ненадежным. Это накладывает строгое физическое ограничение на практическую глубину квантовых схем, которые могут быть выполнены.
-
Бесплодные плато (вычислительные/математические): Это фундаментальное математическое ограничение, при котором ландшафт функции стоимости для глубоких, случайно инициализированных VQA становится чрезвычайно плоским. Градиенты исчезают экспоненциально с количеством кубитов, делая классическую оптимизацию неэффективной и препятствуя сходимости к истинному минимуму. Это явление серьезно ограничивает обучаемость выразительных схем.
-
Ограниченная достижимость фиксированных входных состояний (математические): Для данной анзац-схемы $U(\theta)$ и простого, фиксированного входного состояния $|\Psi_0\rangle$ (такого как $|0\rangle^{\otimes n}$) набор достижимых состояний может быть очень мал. Если целевое состояние $|\Psi_{\text{tar}}\rangle$ находится вне этого "достижимого набора", никакая настройка параметров для $U(\theta)$ не может достичь желаемой фиделити. Достижимый набор анзац-состояния $|\Psi(\theta)\rangle$ по своей сути ограничен начальным состоянием.
-
Вычислительная стоимость проектирования входного состояния (вычислительная/основанная на данных): Хотя предлагаемое проектирование входного состояния предлагает решение, оно вносит свои собственные накладные расходы:
- Бюджет выборки ($M$): Метод требует выборки $M$ вычислительных базисных состояний для идентификации перспективных кандидатов для входной суперпозиции. Если $M$ слишком велико (например, $2^n$ для $n$ кубитов), этот этап предварительного отбора становится классически неразрешимым, особенно для больших систем. Статья стремится сохранить $M$ умеренным.
- Глубина энкодер-схемы ($m$): Энкодер $V(\gamma)$ добавляется к общей глубине схемы. Хотя он разработан как малоглубокий, увеличение $m$ (количество выбранных базисных состояний в суперпозиции) увеличивает сложность и стоимость вентилей $V(\gamma)$, тем самым потребляя больше квантовых ресурсов.
- Накладные расходы на классическую оптимизацию: Совместная оптимизация параметров анзаца $\theta$ и энкодера $\gamma$ увеличивает стоимость классических вычислений. Статья пытается смягчить это, ограничивая количество итераций оптимизации для совместного обучения.
-
Неэффективная параметризация аппаратно-эффективных анзацев (алгоритмические): Аппаратно-эффективные анзацы (HEA) гибки и адаптируются к различным аппаратным платформам, но им часто не хватает специфической для задачи структуры. Это может привести к неэффективной параметризации, делая их восприимчивыми к проблемам оптимизации, таким как бесплодные плато, особенно в более глубоких конфигурациях.
Figure 1. Representative variational quantum ansatz. (a) Hardware-efficient ansatz (HEA). Each layer consists of alternating single-qubit rotations Ry and Rz followed by a chain of CZ gates. The dashed box indicates one circuit layer, which is repeated p times. (b) General Hamiltonian variational ansatz (HVA). Each layer contains a product of unitaries Qq k=1 e−iθkHk, where {Hk} are problem-specific Hamiltonian terms. (c-e) Examples of HVA design for three different models. (c) For the transverse-field Ising model. An initial layer of Hadamard gates H prepares |+⟩⊗n. UZZ(θ) = e−i(θ/2) σz i σz j represents the two-qubit gate for ZZ interaction, while Rx(θ) = e−iθ σx i represents the single- qubit X-rotation. (d) For the cluster-Ising model. UZXZ(θ) = e−i(θ/2) σz i σx j σz k is a three-qubit gate, and UXX(θ) = e−i(θ/2) σx i σx j is a two-qubit gate. (e) For the Fermi-Hubbard model. The upper (lower) register encodes spin-↑(spin- ↓). On-site interactions between the two spins at site i are implemented as UZZ(θ). Hopping terms on odd and even bonds are realized by UXY (θ) = e−i(θ/2) (σx i σx i+1+σy i σy i+1)
Почему этот подход
Неизбежность выбора
Основная проблема, рассматриваемая в данной работе, заключается в фундаментальном компромиссе в вариационных квантовых алгоритмах (VQA) между выразительностью схемы и ее обучаемостью. Традиционные "передовые" (SOTA) методы в основном сосредоточены на проектировании самой унитарной схемы $U(\theta)$. Однако, как ясно излагают авторы, увеличение выразительности $U(\theta)$ путем использования более глубоких схем приводит к значительным проблемам, таким как накопление шума и печально известная проблема бесплодных плато, которая препятствует классической оптимизации (Аннотация, стр. 2; Введение, стр. 4). И наоборот, мелкие схемы, хотя и обучаемы и менее подвержены шуму, часто имеют недостаточный "достижимый набор" квантовых состояний, что означает, что желаемое целевое состояние $|\Psi_{tar}\rangle$ может просто быть недоступным, независимо от того, насколько хорошо оптимизированы параметры схемы $\theta$ (стр. 4, Рисунок 2).
Авторы осознали недостаточность этих традиционных подходов, ориентированных на схемы, когда заметили, что даже после обширной оптимизации существующие анзацы VQA достигали плато с фиделити около 0.95. После этого простое увеличение глубины схемы или итераций обучения давало мало или совсем не давало улучшения из-за присущих анзацу ограничений или наступления бесплодных плато (стр. 9). Это критическое наблюдение подчеркнуло, что проблема заключалась не только в том, как эволюционировать состояние, но и откуда начинать эволюцию. Если целевое состояние находится вне начального достижимого набора $U(\theta)$ при старте из стандартного входа, такого как $|0\rangle^{\otimes n}$, то никакая оптимизация схемы никогда не сможет его достичь (стр. 6). Это осознание сделало проектирование входного состояния единственным жизнеспособным решением для улучшения достижимости без обращения к более глубоким, более проблемным схемам или фундаментального изменения структуры анзаца. Подход стал неизбежным как средство преодоления узких мест выразительности при фиксированной глубине схемы и структуре (стр. 9).
Сравнительное превосходство
Данный метод демонстрирует качественное превосходство не путем замены существующих анзацев VQA, а путем предоставления мощной, дополняющей структуры, которая улучшает их производительность. Его структурное преимущество заключается в способности изменять достижимый набор любого данного анзаца VQA $U(\theta)$ путем проектирования более подходящего входного состояния $|\Psi_0(\gamma)\rangle$, а не только путем модификации самой анзац-схемы. Это достигается с помощью малоглубокой "энкодер-схемы" $V(\gamma)$, которая подготавливает суперпозицию кандидатных состояний (стр. 4, Рисунок 2).
Ключевые преимущества:
1. Улучшенная достижимость и точность: Начиная с тщательно спроектированного входного состояния, метод гарантирует, что целевое состояние становится доступным для существующей схемы $U(\theta)$. Это приводит к стабильно более высокой фиделити и более точным оценкам основной энергии по сравнению со стандартными методами, даже при том же бюджете вентилей (Аннотация, стр. 2; стр. 9). Например, в 1D модели Изинга с поперечным полем метод достиг фиделити 0.99 всего за 8 слоев, что на 33% меньше глубины по сравнению с 12 слоями, требуемыми обычным аппаратно-эффективным анзацем (HEA) (стр. 4, стр. 10). Аналогичные улучшения наблюдаются для 2D моделей Изинга и кластерных моделей Изинга (стр. 4).
2. Эффективность ресурсов: Проектирование входного состояния значительно сокращает как квантовые, так и классические ресурсы. Оно снижает требуемое количество вентилей (например, 112 CNOT вентилей против 144 для HEA для достижения фиделити 0.99) и усилия по оптимизации (1100 шагов против 1500 шагов для HEA) (стр. 11). Энкодер $V(\gamma)$ сам по себе является малоглубокой схемой, стоимость вентилей которой сопоставима с одним слоем базового анзаца, что гарантирует, что общие накладные расходы минимальны и управляемы (стр. 6, стр. 10, стр. 17).
3. Широкая применимость: Поскольку метод модифицирует входное состояние и оставляет параметризованную схему $U(\theta)$ неизменной, он широко применим к различным семействам анзацев, включая HEA и гамильтонианный вариационный анзац (HVA) (стр. 4). Эта универсальность делает его универсальным инструментом для улучшения производительности VQA.
4. Теоретическая основа: Теорема 1 обеспечивает строгую математическую основу, демонстрируя, что достижимая фиделити основного состояния линейной комбинации ортогональных входных состояний связана с суммой индивидуальных фиделити, что оправдывает стратегию выбора кандидатных состояний с большим перекрытием с целевым состоянием (стр. 6-7).
Статья не обсуждает явно лучшую обработку многомерного шума или снижение сложности памяти с $O(N^2)$ до $O(N)$. Ее превосходство заключается в первую очередь в улучшении выразительности и достижимости при строгих ограничениях ресурсов, что приводит к более высокой фиделити с меньшими квантовыми и классическими ресурсами.
Соответствие ограничениям
Выбранный метод проектирования входного состояния идеально соответствует суровым требованиям квантовых вычислений ближнего срока, особенно тем, которые связаны с устройствами промежуточного масштаба с шумами (NISQ). "Слияние" между ограничениями проблемы и уникальными свойствами решения проявляется несколькими способами:
-
Ограничение: Ограниченная глубина схемы и накопление шума: NISQ-устройства очень восприимчивы к шуму, который накапливается с увеличением глубины схемы. Более глубокие схемы также усугубляют бесплодные плато, затрудняя оптимизацию.
- Соответствие: Данный метод напрямую решает эту проблему, избегая более глубоких схем. Вместо увеличения глубины $U(\theta)$, он модифицирует входное состояние для смещения достижимого набора, позволяя более мелким схемам достигать более высокой фиделити. Например, он достигает фиделити 0.99 с 8 слоями, в то время как обычный HEA требует 12 слоев, что представляет собой значительное сокращение глубины (стр. 4, стр. 10). Энкодер сам по себе малоглубокий, что гарантирует лишь умеренное увеличение общей глубины схемы (стр. 6).
-
Ограничение: Фиксированный бюджет вентилей и ограничения ресурсов: Практические приложения NISQ требуют решений, работающих в рамках ограниченного бюджета квантовых вентилей и классических шагов оптимизации.
- Соответствие: Проектирование входного состояния по своей сути эффективно с точки зрения ресурсов. Оно снижает общее количество вентилей и шагов оптимизации, необходимых для достижения целевой фиделити (стр. 11). Стоимость вентилей энкодера поддерживается сопоставимой со стоимостью одного слоя базового анзаца, что гарантирует минимальные и контролируемые дополнительные квантовые накладные расходы (стр. 10, стр. 17). Это позволяет "масштабируемому и ресурсоэффективному улучшению фиделити" (стр. 9).
-
Ограничение: Недостаточная достижимость мелких схем: Основное ограничение мелких VQA заключается в том, что целевое состояние может находиться вне набора состояний, достижимых из стандартного входного состояния, такого как $|0\rangle^{\otimes n}$.
- Соответствие: Это центральная проблема, которую решает данный метод. Подготавливая тщательно спроектированное входное состояние $|\Psi_0(\gamma)\rangle$ в виде суперпозиции выбранных базисных состояний, метод перестраивает достижимый набор анзаца $U(\theta)$ для включения целевого основного состояния (стр. 9, Рисунок 2). Это гарантирует, что даже мелкий $U(\theta)$ теперь может получить доступ к желаемому состоянию, преодолевая узкое место выразительности без увеличения сложности схемы.
По сути, метод уважает "суровые требования" NISQ, работая в рамках ограничений мелких схем и фиксированных бюджетов вентилей, а не пытаясь преодолеть их, требуя больше квантовых ресурсов. Он предлагает умное решение, оптимизируя начальную точку квантовой эволюции.
Отклонение альтернатив
Отказ от альтернатив в данной статье является в основном неявным, фокусируясь на ограничениях существующих стратегий улучшения VQA, а не на прямом сравнении с совершенно другими квантовыми алгоритмами, такими как GAN или диффузионные модели для генеративных задач. Авторы подчеркивают, что "большинство усилий по улучшению VQA были сосредоточены на проектировании схем для $U(\theta)$" (стр. 4). Эти подходы, ориентированные на схемы, хотя и ценны, показаны как недостаточные для конкретной проблемы улучшения достижимости при фиксированных ограничениях ресурсов.
Причины отказа от этих альтернатив, основанных только на схемах, следующие:
1. Компромисс между выразительностью и обучаемостью: Увеличение выразительности $U(\theta)$ путем уплотнения схем (например, использования большего количества слоев в HEA или HVA) приводит к накоплению шума и бесплодным плато, что затрудняет или делает невозможным процесс оптимизации (стр. 4). Это означает, что хотя более глубокие схемы могли бы теоретически достичь большего количества состояний, на практике они становятся необучаемыми.
2. Ограниченная достижимость мелких схем: И наоборот, сохранение мелких схем для поддержания обучаемости и смягчения шума часто приводит к тому, что целевое состояние находится вне достижимого набора анзаца (стр. 4). Это фундаментальное ограничение, которое метод проектирования входного состояния напрямую решает.
3. Неэффективность при фиксированном бюджете вентилей: Статья явно демонстрирует, что обычные HEA или HVA, при ограниченном том же бюджете вентилей (например, общее количество слоев или CNOT вентилей), достигают более низкой фиделити, чем предлагаемый метод проектирования входного состояния (стр. 4, стр. 10, стр. 11). Это подразумевает, что простая оптимизация только $U(\theta)$, без учета входного состояния, менее эффективна с точки зрения использования ресурсов для достижения высокой фиделити.
Следовательно, статья не утверждает, что другие подходы полностью терпят неудачу, а скорее, что они недостаточны или субоптимальны для улучшения достижимости VQA при практических ограничениях NISQ-аппаратного обеспечения. Проектирование входного состояния представлено как необходимое дополнение к проектированию схем, решающее упущенный аспект, который традиционные методы не могли эффективно решить самостоятельно в рамках фиксированного бюджета ресурсов.
Figure 2. Reachable sets modified through input-state design. For a fixed uni- tary U(θ), a simple input state |Ψ0⟩induces a reachable set (red-shaded) that excludes the target |Ψtar⟩, causing optimization to converge to a suboptimal state |Ψ′(θ)⟩(blue path). By contrast, a designed input state |Ψ0(γ)⟩, pre- pared by the encoder V(γ), produces a different reachable set (green-shaded) that contains |Ψtar⟩, enabling the same U(θ) to reach the target (red path)
Математический и логический механизм
Основное уравнение
Абсолютно ключевым уравнением, которое обеспечивает работу улучшенного вариационного квантового алгоритма (VQA), предложенного в данной статье, является целевая функция для минимизации энергии, которая включает как вариационный анзац, так и вновь введенный энкодер входного состояния. Эта функция совместно оптимизируется по параметрам обоих компонентов:
$$ E(\theta,\gamma) = \langle 0|V^\dagger(\gamma)U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle $$
Поэлементный разбор
Давайте разберем это уравнение, чтобы понять математическое определение, физическую/логическую роль каждого компонента, а также обоснование его включения и работы.
-
$E(\theta,\gamma)$:
- Математическое определение: Этот член представляет собой математическое ожидание гамильтониана $H$ относительно квантового состояния $|\Psi(\theta,\gamma)\rangle = U(\theta)V(\gamma)|0\rangle^{\otimes n}$.
- Физическая/логическая роль: Это функция стоимости Вариационного квантового решателя собственных значений (VQE). Основная цель алгоритма – минимизировать это математическое ожидание энергии. В квантовой механике минимальное математическое ожидание гамильтониана соответствует энергии основного состояния системы, а состояние, достигающее этого минимума, является самим основным состоянием.
- Почему этот оператор? Математическое ожидание $\langle\Psi|H|\Psi\rangle$ является фундаментальной величиной в квантовой механике для расчета средней энергии системы в данном состоянии $|\Psi\rangle$. Минимизация этого значения является стандартным и наиболее прямым подходом для VQE к нахождению основного состояния.
-
$|0\rangle^{\otimes n}$:
- Математическое определение: Обозначает начальное вычислительное базисное состояние, где все $n$ кубитов установлены в состояние $|0\rangle$.
- Физическая/логическая роль: Это стандартное, легко подготавливаемое и не запутанное начальное состояние для большинства квантовых схем. Оно служит "чистым листом", с которого начинаются все последующие квантовые операции.
- Почему этот оператор? Это самое простое и распространенное начальное состояние, обеспечивающее универсальную и воспроизводимую отправную точку для квантовых вычислений.
-
$V(\gamma)$:
- Математическое определение: Параметризованный унитарный оператор, называемый "энкодер" схемой. Он принимает начальное состояние $|0\rangle^{\otimes n}$ и преобразует его в спроектированное входное состояние $|\Psi_0(\gamma)\rangle$. Параметры $\gamma$ – это набор настраиваемых классических значений, которые управляют конкретными вентилями и вращениями внутри этой схемы.
- Физическая/логическая роль: Этот оператор является центральным нововведением данной статьи. Его роль заключается в подготовке "более умного" или более благоприятного начального состояния для последующего анзаца VQA. Модифицируя входное состояние, он эффективно изменяет набор состояний, достижимых основным анзацем, делая целевое состояние более доступным. Он разработан как малоглубокая схема для поддержания эффективности.
- Почему этот оператор? Как и $V(\gamma)$, он должен быть унитарным, поскольку квантовая эволюция должна быть унитарной для сохранения вероятности и соблюдения принципов квантовой механики. Он параметризован для обеспечения гибкой оптимизации и адаптации к различным задачам, позволяя проектировать входное состояние, адаптированное к конкретной задаче.
-
$U(\theta)$:
- Математическое определение: Параметризованный унитарный оператор, представляющий "анзац" схему. Он принимает входное состояние $|\Psi_0(\gamma)\rangle$ (или $|\Psi_0\rangle$ в обычном VQA) и преобразует его в вариационное состояние $|\Psi(\theta,\gamma)\rangle$. Параметры $\theta$ – это набор настраиваемых классических значений, которые управляют вентилями внутри этой схемы.
- Физическая/логическая роль: Это основной вариационный квантовый контур, который пытается аппроксимировать целевое квантовое состояние (например, основное состояние $H$). Его выразительность определяет диапазон квантовых состояний, которые он может генерировать и исследовать в гильбертовом пространстве.
- Почему этот оператор? Как и $V(\gamma)$, он должен быть унитарным для физической реализуемости на квантовом компьютере. Его параметризация позволяет итеративно оптимизировать для поиска наилучшей аппроксимации целевого состояния. Конкретная структура $U(\theta)$ (например, аппаратно-эффективный анзац или гамильтонианный вариационный анзац) выбирается в зависимости от задачи и доступного аппаратного обеспечения.
-
$H$:
- Математическое определение: Оператор гамильтониана физической системы. Это эрмитов оператор, то есть $H = H^\dagger$.
- Физическая/логическая роль: Этот оператор представляет собой полную энергию квантовой системы. В контексте VQE цель состоит в том, чтобы найти квантовое состояние, которое минимизирует математическое ожидание этого гамильтониана, что соответствует основному состоянию системы.
- Почему этот оператор? Гамильтониан является фундаментальным оператором в квантовой механике, описывающим энергию системы и ее временную эволюцию. Его математическое ожидание – это величина, которую VQE стремится минимизировать.
-
$U^\dagger(\theta)$:
- Математическое определение: Эрмитово сопряжение (или сопряженное) унитарного оператора $U(\theta)$. Поскольку $U(\theta)$ унитарен, $U^\dagger(\theta) = U^{-1}(\theta)$.
- Физическая/логическая роль: Этот оператор "отменяет" преобразование, выполненное $U(\theta)$. В математическом ожидании он действует на состояние $H U(\theta)V(\gamma)|0\rangle$ слева, эффективно проецируя его обратно в пространство, определенное $V(\gamma)|0\rangle$.
- Почему этот оператор? Это необходимое условие для формирования бра-вектора $\langle\Psi|$. Если $|\Psi\rangle = U(\theta)V(\gamma)|0\rangle$, то $\langle\Psi| = \langle 0|V^\dagger(\gamma)U^\dagger(\theta)$. Это математическая необходимость для вычисления математического ожидания.
-
$V^\dagger(\gamma)$:
- Математическое определение: Эрмитово сопряжение (или сопряженное) унитарного оператора $V(\gamma)$. Поскольку $V(\gamma)$ унитарен, $V^\dagger(\gamma) = V^{-1}(\gamma)$.
- Физическая/логическая роль: Подобно $U^\dagger(\theta)$, этот оператор "отменяет" преобразование, выполненное $V(\gamma)$. Он действует на состояние $U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle$ слева.
- Почему этот оператор? Он завершает формирование бра-вектора $\langle\Psi|$, обеспечивая правильное вычисление математического ожидания.
-
$\langle 0| \dots |0\rangle$:
- Математическое определение: Представляет собой скалярное произведение состояния $V^\dagger(\gamma)U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle$ с начальным состоянием $|0\rangle^{\otimes n}$.
- Физическая/логическая роль: Вся конструкция $\langle 0| \dots |0\rangle$ вычисляет математическое ожидание. В квантовой механике математические ожидания наблюдаемых получаются путем "сэндвича" наблюдаемой между состоянием и его эрмитово сопряженным. Именно так измеряется средняя энергия системы.
- Почему этот оператор? Скалярное произведение – это математическая операция, используемая для проецирования одного квантового состояния на другое или для вычисления амплитуды вероятности нахождения одного состояния в другом. Здесь оно используется для вычисления математического ожидания $H$.
-
Почему умножение вместо сложения? Операторы $V(\gamma)$, $U(\theta)$, $H$, $U^\dagger(\theta)$ и $V^\dagger(\gamma)$ умножаются, поскольку они представляют последовательные операции над квантовым состоянием. В квантовой механике применение нескольких вентилей или операторов к состоянию представлено умножением их соответствующих матриц в порядке применения. Сначала $V(\gamma)$ действует на $|0\rangle^{\otimes n}$, затем $U(\theta)$ действует на результирующее состояние, затем $H$ действует на это состояние, и, наконец, бра-вектор $\langle 0|V^\dagger(\gamma)U^\dagger(\theta)$ действует слева для вычисления математического ожидания. Эта последовательность операций является фундаментальной для работы квантовых схем.
-
Почему суммирование вместо интегрирования? Математическое ожидание, при измерении на квантовом компьютере, включает суммирование по результатам измерений. Для дискретного набора вычислительных базисных состояний математическое ожидание по своей сути является суммой вероятностей, взвешенных собственными значениями наблюдаемой. Интеграл использовался бы для непрерывных переменных, которые обычно не являются прямым результатом VQA на современном оборудовании.
Пошаговый поток
Представьте себе одно абстрактное квантовое состояние, изначально чистое $|0\rangle^{\otimes n}$, движущееся по сложной квантовой сборочной линии, чтобы стать высокооптимизированной аппроксимацией целевого основного состояния.
-
Вход начального состояния: Процесс начинается с подготовки квантовой системы в простом, не запутанном вычислительном базисном состоянии $|0\rangle^{\otimes n}$. Это наше "сырье", поступающее на первую стадию сборочной линии.
-
Предварительная обработка энкодером: Это сырое состояние $|0\rangle^{\otimes n}$ сначала поступает в "энкодер" схему $V(\gamma)$. Эта схема, управляемая параметрами $\gamma$, действует как специализированный препроцессор. Она применяет серию тщательно выбранных одно- и многокубитных вентилей (вращения, запутывающие операции) для преобразования простого $|0\rangle^{\otimes n}$ в более сложное, "спроектированное входное состояние" $|\Psi_0(\gamma)\rangle$. Этот шаг подобен формированию сырья в определенную, выгодную форму перед его поступлением на основной производственный процесс. Цель состоит в том, чтобы гарантировать, что это предварительно обработанное состояние уже "ближе" к желаемому конечному продукту в огромном пространстве квантовых состояний.
-
Основное преобразование анзацем: Спроектированное входное состояние $|\Psi_0(\gamma)\rangle$ затем поступает на основной "анзац" схему $U(\theta)$. Это основной вариационный механизм, параметризованный $\theta$. Он применяет другую последовательность квантовых вентилей, далее преобразуя $|\Psi_0(\gamma)\rangle$ в конечное вариационное состояние $|\Psi(\theta,\gamma)\rangle = U(\theta)|\Psi_0(\gamma)\rangle$. Это основная производственная стадия, где состояние итеративно уточняется для аппроксимации целевого основного состояния, насколько это возможно.
-
Измерение энергии (концептуально): После подготовки состояния $|\Psi(\theta,\gamma)\rangle$, оно не "действует" напрямую гамильтонианом $H$ в смысле временной эволюции. Вместо этого измеряется его энергия. Это включает разложение гамильтониана $H$ на сумму измеримых паули-членов. Для каждого члена квантовый компьютер выполняет измерения на $|\Psi(\theta,\gamma)\rangle$ для получения его математического ожидания.
-
Агрегация математического ожидания: Результаты этих измерений затем агрегируются классически. Математическое ожидание $E(\theta,\gamma)$ вычисляется путем суммирования измеренных математических ожиданий отдельных паули-членов, взвешенных их коэффициентами в гамильтониане. Это конечное числовое значение, $E(\theta,\gamma)$, представляет собой "оценку качества" текущего вариационного состояния, указывая, насколько его энергия близка к истинной энергии основного состояния. Это завершает один проход через квантово-классический цикл.
Динамика оптимизации
Механизм обучается, обновляется и сходится посредством гибридного квантово-классического цикла оптимизации, направленного на поиск оптимальных параметров $(\theta_{\text{opt}}, \gamma_{\text{opt}})$, которые минимизируют математическое ожидание энергии $E(\theta,\gamma)$.
-
Двухэтапная стратегия оптимизации: Процесс обучения структурирован в два основных этапа для управления сложностью и повышения эффективности:
- Предварительное обучение анзаца: Изначально оптимизируется только анзац-схема $U(\theta)$. Это включает старт с простого входного состояния (например, $|0\rangle^{\otimes n}$) и итеративное корректирование $\theta$ для минимизации $E(\theta) = \langle 0|U^\dagger(\theta) H U(\theta)|0\rangle$. Классический оптимизатор (например, градиентный спуск или метод без градиента) исследует ландшафт потерь, определяемый $E(\theta)$. Оптимизатор вычисляет (или оценивает) градиенты $\nabla_\theta E(\theta)$, чтобы определить направление наискорейшего спуска, направляя параметры $\theta$ к локальному минимуму. Этот этап продолжается до тех пор, пока норма градиента не упадет ниже заданного порога, что указывает на стабильную точку, и дает набор предварительно оптимизированных параметров $\tilde{\theta}_{\text{opt}}$. Этот шаг имеет решающее значение для установления базовой производительности для данной схемы.
- Совместная оптимизация энкодера и анзаца: После предварительного обучения задействуется механизм проектирования входного состояния. Выбирается пул из $M$ вычислительных базисных состояний, и их энергии оцениваются с использованием предварительно обученного анзаца $U(\tilde{\theta}_{\text{opt}})$. Из этого пула выбираются $m$ "перспективных" состояний (включая $|0\rangle^{\otimes n}$), которые составят основу для энкодера. Затем строится энкодер-схема $V(\gamma)$ для подготовки суперпозиции этих $m$ состояний в качестве нового входного состояния $|\Psi_0(\gamma)\rangle$. Теперь рассматривается полная схема $U(\theta)V(\gamma)$, и оба набора параметров, $\theta$ и $\gamma$, совместно оптимизируются для минимизации $E(\theta,\gamma) = \langle 0|V^\dagger(\gamma)U^\dagger(\theta) H U(\theta)V(\gamma)|0\rangle$. Параметры анзаца инициализируются с $\tilde{\theta}_{\text{opt}}$, в то время как параметры энкодера $\gamma$ обычно инициализируются случайным образом.
-
Поведение градиента и ландшафт потерь:
- Во время оптимизации классический оптимизатор итеративно обновляет $\theta$ и $\gamma$, вычисляя градиенты $\nabla_\theta E(\theta,\gamma)$ и $\nabla_\gamma E(\theta,\gamma)$. Эти градиенты указывают на наклон ландшафта энергии по отношению к каждому параметру. Параметры затем корректируются в направлении, противоположном градиенту, для снижения энергии.
- Ландшафт потерь для VQA может быть очень сложным, часто характеризующимся многочисленными локальными минимумами и "бесплодными плато", где градиенты экспоненциально исчезают с количеством кубитов, препятствуя сходимости.
- Ключевая идея данной статьи заключается в том, что проектирование входного состояния с помощью $V(\gamma)$ эффективно изменяет этот ландшафт потерь. Начиная основной анзац $U(\theta)$ из более благоприятного начального состояния $|\Psi_0(\gamma)\rangle$, достижимый набор $U(\theta)$ смещается. Это смещение может переместить глобальный минимум ландшафта энергии в область, более доступную для оптимизатора, или сделать ландшафт "более гладким" в окрестности целевого состояния, тем самым смягчая бесплодные плато и улучшая обучаемость. Авторы намеренно сохраняют энкодер $V(\gamma)$ малоглубоким, чтобы избежать введения новых, проблемных локальных минимумов или увеличения трудностей обучения.
-
Итеративные обновления состояний и сходимость:
- В каждой итерации совместной оптимизации параметры $\theta$ и $\gamma$ обновляются на основе вычисленных градиентов. Эти обновленные параметры определяют новую квантовую схему $U(\theta)V(\gamma)$, которая подготавливает новое вариационное состояние $|\Psi(\theta,\gamma)\rangle$.
- Затем измеряется энергия $E(\theta,\gamma)$ этого нового состояния, и цикл повторяется. Этот итеративный процесс приближает квантовое состояние $|\Psi(\theta,\gamma)\rangle$ все ближе и ближе к истинному основному состоянию гамильтониана $H$.
- Сходимость обычно достигается, когда энергия $E(\theta,\gamma)$ стабилизируется или достигает значения, очень близкого к истинной энергии основного состояния, а фиделити (перекрытие с истинным основным состоянием) приближается к 1. Авторы демонстрируют, что это проектирование входного состояния приводит к стабильно более высокой точности и более быстрой сходимости (меньше слоев, меньше итераций) по сравнению с обычными VQA, что указывает на более эффективное исследование гильбертова пространства и лучшую способность находить оптимальное состояние. Оптимизация обычно ограничивается умеренным количеством итераций (например, 200) для контроля классических накладных расходов.
Результаты, ограничения и заключение
Экспериментальный дизайн и базовые модели
Экспериментальный дизайн авторов был тщательно разработан для безжалостной проверки их основного утверждения: что проектирование подходящего входного состояния может значительно улучшить достижимость и производительность вариационных квантовых алгоритмов (VQA) без увеличения глубины схемы или количества параметров. Основная идея заключается во введении "энкодер" схемы, $V(\gamma)$, которая подготавливает входное состояние суперпозиции $|\Psi_0(\gamma)\rangle = V(\gamma)|0\rangle^{\otimes n} = \sum_{j=1}^m \alpha_j |\psi_j\rangle$, вместо обычного произведения состояний $|0\rangle^{\otimes n}$ или $|+\rangle^{\otimes n}$. Этот энкодер эффективно смещает достижимый набор последующей анзац-схемы $U(\theta)$ в гильбертовом пространстве, делая целевое состояние более доступным.
Архитектура эксперимента включала многоэтапный процесс оптимизации:
1. Предварительное обучение: Стандартная анзац-схема $U(\theta)$ (либо аппаратно-эффективный анзац (HEA), либо гамильтонианный вариационный анзац (HVA)) сначала оптимизировалась с использованием обычного входного состояния (например, $|0\rangle^{\otimes n}$) для получения начального набора параметров, $\theta_{\text{opt}}$. Этот шаг устанавливает базовую производительность для данной глубины схемы.
2. Выбор кандидатных состояний: Был выбран пул из $M$ вычислительных базисных состояний $\{|j^{(k)}\rangle\}_{k=1}^M$. Для каждого состояния его математическое ожидание энергии $E_{j^{(k)}} = \langle j^{(k)}|U^\dagger(\theta_{\text{opt}})HU(\theta_{\text{opt}})|j^{(k)}\rangle$ оценивалось с помощью квантовых измерений. Количество измерений масштабировалось как $N_m = 1/\epsilon^2$ для целевой ошибки оценки $\epsilon$. Из этого пула были выбраны $m$ низкоэнергетических состояний (включая $|0\rangle^{\otimes n}$) для формирования набора $A_m$, который составит суперпозицию для нового входного состояния. Выбор $m$ был сделан так, чтобы линейно масштабироваться с размером системы (например, $m=6$ для 12 кубитов), гарантируя, что стоимость вентилей энкодера останется сопоставимой с одним слоем анзаца.
3. Совместная оптимизация: Энкодер $V(\gamma)$ был построен на основе выбранных $m$ базисных состояний. Затем параметры как энкодера $\gamma$, так и анзаца $\theta$ были совместно оптимизированы для минимизации энергии $E(\theta, \gamma) = \langle 0|V^\dagger(\gamma)U^\dagger(\theta)HU(\theta)V(\gamma)|0\rangle$. Параметры анзаца были инициализированы с $\theta_{\text{opt}}$, а параметры энкодера $\gamma$ были рандомизированы. Эта совместная оптимизация была ограничена умеренным количеством итераций (обычно $T=200$) для контроля классических накладных расходов.
"Жертвами" (базовыми моделями), против которых безжалостно тестировался предлагаемый метод, были обычные схемы HEA и HVA, инициализированные стандартными произведениями состояний. Ключом к доказательству их математических утверждений было сравнение производительности улучшенного VQA (анзац + энкодер) с этими базовыми моделями при согласованном бюджете вентилей или фиксированной глубине схемы. Это означало, что общие квантовые ресурсы (например, количество слоев, CNOT вентилей) для улучшенного метода (L слоев анзаца + 1 слой энкодера) оставались сопоставимыми с базовой моделью (L+1 слоев анзаца). Этот выбор архитектуры гарантировал, что любое наблюдаемое улучшение производительности было напрямую связано с проектированием входного состояния, а не просто с использованием более глубокой или сложной схемы.
Эксперименты проводились на нескольких репрезентативных моделях квантовой многочастичной физики:
* 1D модель Изинга с поперечным полем (TFIM): Использовалась 12-кубитная система и HEA в качестве анзаца.
* 2D TFIM: Использовался HVA в качестве анзаца при различных силах поперечного поля.
* Кластерная модель Изинга: Использовался HVA в качестве анзаца.
* 1D модель Ферми-Хаббарда: Использовался HVA в качестве анзаца, при полузаполнении и различных силах взаимодействия.
Производительность в основном измерялась по основной энергии и фиделити (F = $|\langle \Psi|\Psi_{\text{tar}}\rangle|^2$), а также по квантовым ресурсам (глубина схемы, CNOT вентили) и классическим ресурсам (шаги оптимизации).
Что доказывают доказательства
Представленные в статье доказательства однозначно подтверждают, что проектирование входного состояния является мощным и широко применимым инструментом для улучшения достижимости и производительности VQA. Основной механизм, как строго доказано Теоремой 1, заключается в том, что путем построения входного состояния как линейной суперпозиции $m$ ортогональных состояний, максимальная достижимая фиделити $F$ равна сумме индивидуальных фиделити $F_j = |\langle \psi_j|\Psi_{\text{tar}}\rangle|^2$. Это позволяет эффективно изменять достижимый набор анзаца для включения целевого состояния, даже для мелких схем.
Вот неоспоримые доказательства:
-
1D модель Изинга с поперечным полем (HEA): Для 12-кубитной 1D TFIM улучшенный HEA достиг фиделити 0.99 всего за 8 слоев (112 CNOT вентилей). В отличие от этого, обычный HEA требовал 12 слоев (144 CNOT вентилей) для достижения той же фиделити, что представляет собой существенное сокращение глубины на 33% (Рис. 4(a)-(b)). Кроме того, улучшенный метод требовал всего 1100 шагов оптимизации по сравнению с 1500 для обычного HEA, демонстрируя выигрыш и в классических ресурсах. Траектории обучения явно показывают быстрое улучшение энергии и фиделити после введения энкодера (Рис. 4(c)-(d)).
-
2D модель Изинга с поперечным полем (HVA): При различных силах поля ($h \in \{0.5, 1.0, 1.5\}$) улучшенный HVA последовательно превосходил обычный HVA. Он достиг более низких вариационных энергий и более высокой фиделити при меньшей глубине схемы (Рис. 5). Энкодер, построенный из $m=8$ базисных состояний, имел стоимость вентилей, сопоставимую с одним слоем HVA, что гарантировало справедливое сравнение при согласованном бюджете вентилей.
- Кластерная модель Изинга (HVA): Для этой модели улучшенный HVA достиг фиделити 0.99 всего за 6 слоев (450 двухкубитных вентилей), в то время как обычный HVA требовал 9 слоев (558 двухкубитных вентилей). Сравнение классических ресурсов было еще более поразительным: метод проектирования входного состояния требовал $C_R = 54550$ шагов оптимизации, в то время как обычный HVA требовал $C_R = 118800$. Это явная демонстрация превосходной эффективности.
- 1D модель Ферми-Хаббарда (HVA): Эта модель служила строгим тестом для сильно коррелированных систем. При $U=2$ улучшенный HVA достиг фиделити 0.99 с 5 слоями, в то время как обычный HVA требовал 9 слоев. Более важно, при более высоких силах взаимодействия ($U=5$ и $U=10$), где обычный метод часто стагнировал на фиделити около 0.6 из-за чувствительности к инициализации и бесплодных плато, проектирование входного состояния последовательно повышало фиделити выше 0.99 (Рис. 8). Это подчеркивает способность энкодера обеспечивать физически релевантную и выразительную инициализацию.
- Анализ накладных расходов на ресурсы: В статье также проанализированы накладные расходы, связанные с количеством выборок $M$ и размером энкодера $m$. Показано, что увеличение $M$ улучшает точность, но с убывающей отдачей, и что полезные улучшения достигаются при умеренном $M$ (Рис. 9). Например, для 12-кубитных систем сокращение $M$ с 2000 до 400 все еще давало фиделити 0.99. Классическая стоимость предварительного отбора для $M=400$ кандидатов была скромной, добавляя примерно 1000 долларов США к общей классической стоимости в 189600 долларов США для 12-кубитной модели Изинга (как упомянуто в статье, хотя ссылка на таблицу отсутствует, вероятно, это Таблица 2). Эта общая стоимость в 190600 долларов США все еще была значительно ниже 432000 долларов США, требуемых обычным HEA-базовым уровнем для достижения той же целевой фиделити.
Таким образом, последовательные улучшения фиделити, снижение глубины схемы и меньшие затраты на классическую оптимизацию для разнообразных моделей и семейств анзацев, все при согласованном бюджете вентилей, предоставляют неоспоримые доказательства того, что механизм проектирования входного состояния эффективно улучшает достижимость VQA.
Ограничения и будущие направления
Хотя фреймворк проектирования входного состояния предлагает убедительное решение проблемы достижимости в VQA, авторы признают несколько ограничений и открытых направлений для будущих исследований.
Одно из основных ограничений заключается в эвристической природе текущей конструкции энкодера и стратегии выбора кандидатов. Статья прямо заявляет, что "наша текущая конструкция энкодера и стратегия выбора кандидатов в значительной степени эвристические, а не оптимальные". Это означает, что, хотя метод хорошо работает, могут существовать более эффективные или надежные способы идентификации оптимальных базисных состояний для суперпозиции и построения энкодер-схемы $V(\gamma)$. Текущий подход полагается на выборку $M$ вычислительных базисных состояний и выбор $m$ низкоэнергетических, что, хотя и эффективно, может не всегда быть наиболее ресурсоэффективной или глобально оптимальной стратегией, особенно для задач без сильной априорной физической интуиции.
Другой пункт обсуждения касается бюджета выборки $M$. Хотя в статье демонстрируется, что полезные улучшения достигаются при умеренном $M$ и что увеличение $M$ дает убывающую отдачу, фундаментальная проблема остается: при отсутствии каких-либо априорных знаний о гамильтониане, гарантирование высокой фиделити в принципе потребовало бы выборки почти всех $2^n$ вычислительных базисных состояний, что экспоненциально неэффективно. Хотя авторы фокусируются на режиме, где $M$ растет полиномиально с размером системы, компромисс между накладными расходами на выборку и целевой точностью по-прежнему является практическим соображением для масштабирования на более крупные системы.
Кроме того, хотя проектирование входного состояния решает проблему выразительности путем модификации достижимого набора, его связь с бесплодными плато является нюансированной. Авторы предполагают, что использование сильно запутанных входных состояний, которые не могут быть классически симулированы, может позволить их протоколу достичь квантового преимущества без столкновения с теоремой о запрете бесплодных плато, которая применима к классически симулируемым входным состояниям. Однако сам энкодер намеренно сохраняется малоглубоким, чтобы избежать введения новых проблем с обучением. Это означает, что основная проблема бесплодных плато для самого анзаца $U(\theta)$ не решается напрямую, а скорее обходится благодаря лучшей отправной точке.
Исходя из этих выводов, возникает несколько тем для дальнейшего развития и эволюции этих результатов:
- Адаптивный и интеллектуальный выбор кандидатных состояний: Как мы можем выйти за рамки простого фильтрации на основе энергии для выбора кандидатных базисных состояний? Будущие исследования могли бы изучить продвинутые методы машинного обучения, такие как обучение с подкреплением или активное обучение, для адаптивного выявления наиболее "информативных" базисных состояний или даже невычислительных базисных состояний для входной суперпозиции. Это могло бы значительно сократить бюджет выборки $M$ и количество требуемых измерений, делая этап предварительного отбора более ресурсоэффективным и масштабируемым.
- Оптимальная архитектура и параметризация энкодера: Текущий энкодер $V(\gamma)$ построен для подготовки суперпозиции вычислительных базисных состояний. Можем ли мы исследовать более сложные или специфичные для задачи архитектуры энкодеров, которые могли бы более эффективно подготавливать более сложные, запутанные входные состояния? Это может включать проектирование энкодеров, использующих симметрии гамильтониана, или включение идей из теории квантовой информации для оптимизации коэффициентов $\alpha_j$ и структуры вентилей самого $V(\gamma)$.
- Синергетическое смягчение бесплодных плато: Хотя проектирование входного состояния улучшает достижимость, оно не решает напрямую проблему бесплодных плато для анзац-схемы. Важным будущим направлением является исследование того, как проектирование входного состояния может быть синергетически объединено с другими методами смягчения бесплодных плато (например, стратегии инициализации параметров, локальные функции стоимости или анзацы, вдохновленные задачей). Может ли тщательно выбранное запутанное входное состояние также "сгладить" или "уплотнить" ландшафт потерь последующей оптимизации анзаца, тем самым улучшая обучаемость?
- Масштабируемость и анализ ресурсов для больших систем: Текущие симуляции ограничены до 12 кубитов. Критическим вопросом является то, как накладные расходы (выборка $M$, количество вентилей энкодера, шаги классической оптимизации) масштабируются для гораздо больших квантовых систем. Необходимы детальные теоретические и численные анализы для установления практических пределов и оптимальных компромиссов для $M$ и $m$ при увеличении $n$, гарантируя, что метод остается жизнеспособным для отказоустойчивых квантовых вычислений.
- Обобщение на другие задачи VQA: Текущая работа в основном сосредоточена на подготовке основного состояния. Как этот фреймворк проектирования входного состояния может быть расширен и проверен для других приложений VQA, таких как квантовое машинное обучение, задачи оптимизации (например, QAOA) или симуляция возбужденных состояний? Каждое приложение может иметь уникальные требования к целевому состоянию, требуя различных стратегий для проектирования входного состояния.
- Устойчивость к шуму и аппаратная реализация: Учитывая присущий шум в текущих и перспективных квантовых аппаратных средствах, насколько устойчив подход проектирования входного состояния к различным моделям шума (например, деполяризация, дефазировка, ошибки считывания)? Будущая работа может исследовать стратегии проектирования входного состояния, учитывающие шум, или методы смягчения ошибок, специально адаптированные для энкодер-схемы, чтобы гарантировать сохранение прироста производительности при реалистичных аппаратных реализациях.
Figure 9. Impact of sampling size on infidelity for basis-state in pre-selection step. We consider the 12-qubit 1D transverse-field Ising model with a 5-layer HEA as the variational circuit U(θ) and m = 6. The horizontal axis shows the sampling number M, and the vertical axis reports the final infidelity 1 −F obtained after the joint optimization. Increasing M improves the final accuracy by providing a better set of candidate basis states for constructing the encoder input state, while the improvement quickly saturates for larger M, indicating diminishing returns beyond a moderate sampling number
Table 2. Minimum sample size required to reach target fidelity in the transverse- field Ising model. Results are shown for target fidelities F = 0.99 and 0.95 and for n ∈{6, 8, 10, 12} qubits. The number of selected computational-basis states is set to m = 4 for n = 6, 8 and m = 6 for n = 10, 12. We also report the final fidelity achieved by the baseline hardware-efficient ansatz (HEA) without input-state design under a matched quantum-resource budget: the baseline uses (L + 1) HEA layers, whereas our method uses L HEA layers plus one encoder layer
Figure 5. Simulation results for the 12-qubit 2D Ising model at h = 0.5, 1, and 1.5. The upper panels (a, c, e) show the ground energy as a function of circuit depth p for h = 0.5, 1, and 1.5, respectively, and the lower panels (b, d, f) show the corresponding fidelity to the exact ground state. The blue curves correspond to the conventional HVA, and the orange curves correspond to the input-state design (enhanced HVA). Each marker represents the mean over 100 random initializations, and the error bars represent standard deviations over these runs. Across all three values of h, the input-state design consistently achieves lower variational energies and higher fidelities under the same depth, and it reaches the 0.99 fidelity threshold with fewer layers than the baseline