← Back
npj Quantum Information

QKAN: क्वांटम कोल्मोगोरोव-आर्नोल्ड नेटवर्क (Quantum Kolmogorov-Arnold Networks) मशीन लर्निंग और बहुभिन्नरूपी अवस्था तैयारी में अनुप्रयोगों के साथ

इस पत्र में संबोधित समस्या, क्वांटम कोल्मोगोरोव-आर्नोल्ड नेटवर्क्स (QKANs) का विकास, सटीक रूप से शास्त्रीय न्यूरल नेटवर्क्स और क्वांटम कंप्यूटिंग के प्रतिच्छेदन से उत्पन्न होती है, विशेष रूप से हाल ही में प्रस्तावित...

Open PDF Open DOI Open Source Page

Editorial Disclosure

ISOM follows an editorial workflow that structures the source paper into a readable analysis, then publishes the summary, source links, and metadata shown on this page so readers can verify the original work.

The goal of this page is to help readers understand the paper's core question, method, evidence, and implications before opening the original publication.

पृष्ठभूमि और अकादमिक वंश

उत्पत्ति और अकादमिक वंश

इस पत्र में संबोधित समस्या, क्वांटम कोल्मोगोरोव-आर्नोल्ड नेटवर्क्स (QKANs) का विकास, सटीक रूप से शास्त्रीय न्यूरल नेटवर्क्स और क्वांटम कंप्यूटिंग के प्रतिच्छेदन से उत्पन्न होती है, विशेष रूप से हाल ही में प्रस्तावित शास्त्रीय कोल्मोगोरोव-आर्नोल्ड नेटवर्क्स (KANs) [5] से प्रेरित है। ऐतिहासिक संदर्भ कोल्मोगोरोव-आर्नोल्ड प्रतिनिधित्व प्रमेय (KART) से शुरू होता है, जो 1950 के दशक का एक मौलिक गणितीय परिणाम है [1-4]। KART बताता है कि कोई भी सतत बहुभिन्नरूपी फलन (एक से अधिक इनपुट चर वाला फलन) को एक परिमित संख्या में एकचर फलनों (केवल एक इनपुट चर वाले फलन) की संरचना और योग में विघटित किया जा सकता है। इस प्रमेय ने जटिल फलनों को सरल निर्माण खंडों का उपयोग करके कैसे दर्शाया जा सकता है, इसे समझने के लिए एक सैद्धांतिक आधार प्रदान किया।

हालांकि, व्यावहारिक सेटिंग्स में, विशेष रूप से न्यूरल नेटवर्क्स के लिए, KART का प्रत्यक्ष अनुप्रयोग सीमित था क्योंकि यह जिन आंतरिक और बाहरी फलनों की गारंटी देता है, वे अत्यधिक गैर-चिकने (non-smooth) हो सकते हैं, जिससे उन्हें सटीक और मज़बूती से अनुमानित करना मुश्किल हो जाता है [5]। इस "दर्द बिंदु" का मतलब था कि सैद्धांतिक रूप से शक्तिशाली होने के बावजूद, KART को सीधे एक प्रभावी न्यूरल नेटवर्क आर्किटेक्चर में अनुवादित नहीं किया जा सकता था।

यह कोल्मोगोरोव-आर्नोल्ड नेटवर्क्स (KANs) के हालिया परिचय के साथ बदल गया, जिसे लियू एट अल. [5] द्वारा प्रस्तुत किया गया। KANs, KART की संरचनात्मक संरचना को सामान्यीकृत करते हैं, जिससे परतों की मनमानी संख्या की अनुमति मिलती है, जो KART द्वारा गारंटीकृत दो परतों के विपरीत है। जबकि शास्त्रीय KANs, KART के सार्वभौमिक प्रतिनिधित्व गुण को विरासत में नहीं लेते हैं, उन्होंने विशिष्ट अनुप्रयोगों में, विशेष रूप से वैज्ञानिक डोमेन में, बेहतर व्याख्यात्मकता और छोटे पैमाने के कार्यों पर बेहतर सटीकता प्रदान करके वादा दिखाया है। वे लक्ष्य फलनों में मॉड्यूलर संरचनाओं को प्रकट करके नए भौतिक नियमों की खोज में भी सहायता कर सकते हैं [10]।

इस पत्र के लेखकों को शास्त्रीय KANs की क्षमता से प्रेरित किया गया था और उन्होंने एक क्वांटम संस्करण, QKAN पेश करने की मांग की। पिछले क्वांटम दृष्टिकोणों की मौलिक सीमा, जिसने लेखकों को यह पत्र लिखने के लिए मजबूर किया, क्वांटम मशीन लर्निंग मॉडल की प्रकृति से उत्पन्न होती है। मौजूदा क्वांटम लर्निंग मॉडल, जैसे कि पैरामीट्रिक क्वांटम एल्गोरिदम (VQAs) [34-39], अक्सर क्वांटम सर्किट में मापदंडों को अनुकूलित करने पर निर्भर करते हैं। इसके विपरीत, QKAN एक अलग प्रतिमान प्रदान करता है: यह ब्लॉक-एन्कोडेड मैट्रिसेस के आइगेनवैल्यूज़ को "न्यूरॉन्स" के रूप में मानता है और क्वांटम सिंगुलर वैल्यू ट्रांसफॉर्मेशन (QSVT) का उपयोग करके नेटवर्क के "किनारों" पर पैरामीट्रिक सक्रियण फलनों को लागू करता है। यह दृष्टिकोण KANs की संरचनात्मक संरचना का क्वांटम सेटिंग में लाभ उठाने का लक्ष्य रखता है, जो कुछ कार्यों के लिए दक्षता में संभावित लाभ प्रदान करता है, खासकर जब इनपुट के कुशल ब्लॉक-एन्कोडिंग उपलब्ध हों। हालांकि, QKAN को अपनी बाधाओं का भी सामना करना पड़ता है: QSVT का उपयोग करके परतों को पुनरावर्ती रूप से संयोजित करने से सर्किट गहराई में घातीय ओवरहेड होता है, जिसका अर्थ है कि QKAN स्वाभाविक रूप से उथली आर्किटेक्चर तक सीमित है।

सहज डोमेन शब्द

  1. कोल्मोगोरोव-आर्नोल्ड प्रतिनिधित्व प्रमेय (KART): कल्पना कीजिए कि आपके पास कई सामग्री और चरणों के साथ एक बहुत ही जटिल नुस्खा है। KART एक गणितीय प्रमाण की तरह है जो कहता है, नुस्खा कितना भी जटिल क्यों न हो, आप हमेशा इसे बहुत सरल, एकल-सामग्री मिनी-नुस्खों की एक श्रृंखला में तोड़ सकते हैं जिन्हें फिर जोड़ा जाता है। यह जटिलता को प्रबंधनीय, एकल-चर भागों में सरल बनाने के बारे में है।

  2. ब्लॉक-एन्कोडिंग (Block-encoding): एक गुप्त संदेश (एक मैट्रिक्स या वेक्टर) के बारे में सोचें जिसे आप सुरक्षित रूप से भेजना चाहते हैं। ब्लॉक-एन्कोडिंग इस गुप्त संदेश को एक बहुत बड़े, स्पष्ट रूप से सामान्य दस्तावेज़ (एक एकात्मक क्वांटम ऑपरेशन) के भीतर एम्बेड करने जैसा है। बड़ा दस्तावेज़ हानिरहित दिखता है, लेकिन इसका एक विशिष्ट भाग, एक "ब्लॉक", आपके गुप्त संदेश को, स्केल-डाउन करके, रखता है। क्वांटम कंप्यूटर तब इस बड़े दस्तावेज़ में हेरफेर कर सकते हैं, प्रभावी रूप से आपके छिपे हुए संदेश को सीधे "पढ़े" बिना संसाधित कर सकते हैं।

  3. क्वांटम सिंगुलर वैल्यू ट्रांसफॉर्मेशन (QSVT): एक फोटो संपादन ऐप की कल्पना करें जहां आप एक विशिष्ट प्रभाव लागू करना चाहते हैं, जैसे कि चमक या कंट्रास्ट बदलना, लेकिन केवल छवि में कुछ रंगों या पैटर्न पर। QSVT एक शक्तिशाली क्वांटम तकनीक है जो एक अत्यधिक सटीक डिजिटल फ़िल्टर की तरह काम करती है। यह ब्लॉक-एन्कोडेड मैट्रिक्स में एन्कोड की गई जानकारी की "शक्ति" या "महत्व" (सिंगुलर वैल्यूज़) पर लगभग कोई भी वांछित गणितीय फलन (जैसे बहुपद) लागू कर सकता है, जिससे बहुत विशिष्ट और जटिल परिवर्तन संभव होते हैं।

  4. बहुभिन्नरूपी अवस्था तैयारी (Multivariate State Preparation): कल्पना कीजिए कि आप एक अद्वितीय संगीत कॉर्ड बनाना चाहते हैं जहाँ प्रत्येक नोट की लाउडनेस कई कारकों (जैसे तापमान, आर्द्रता और दिन का समय) को शामिल करने वाले एक जटिल गणितीय सूत्र द्वारा सटीक रूप से निर्धारित होती है। क्वांटम कंप्यूटिंग में बहुभिन्नरूपी अवस्था तैयारी एक क्वांटम अवस्था (क्वांटम बिट्स का एक संग्रह) बनाने के बारे में है जहाँ प्रत्येक संभावित परिणाम (बिट्स का प्रत्येक संयोजन) की "लाउडनेस" या "आयाम" को कई इनपुट चर वाले एक जटिल फलन के मान से मिलान करने के लिए सेट किया जाता है। यह क्वांटम क्षेत्र में सीधे मानों के एक जटिल परिदृश्य को एन्कोड करने जैसा है।

संकेतन तालिका

संकेतन विवरण

समस्या परिभाषा और बाधाएँ

मुख्य समस्या सूत्रीकरण और दुविधा

यह पत्र शास्त्रीय कोल्मोगोरोव-आर्नोल्ड नेटवर्क्स (KANs) से प्रेरित एक क्वांटम एल्गोरिथम फ्रेमवर्क के रूप में क्वांटम कोल्मोगोरोव-आर्नोल्ड नेटवर्क्स (QKANs) का परिचय देता है। मुख्य समस्या मशीन लर्निंग और बहुभिन्नरूपी अवस्था तैयारी में अनुप्रयोगों के लिए KANs का एक कुशल क्वांटम कार्यान्वयन विकसित करना है।

इनपुट/वर्तमान अवस्था:
एक QKAN का प्रारंभिक बिंदु $N$-आयामी वास्तविक वेक्टर $\vec{x} \in [-1,1]^N$ का एक ब्लॉक-एन्कोडिंग है। इसका मतलब है कि वेक्टर के घटकों को एक एकात्मक मैट्रिक्स, $U_x$, के विकर्ण प्रविष्टियों के भीतर एन्कोड किया गया है, जैसे कि $|| \langle 0|_a U_x |0\rangle_a - \text{diag}(x_1, \dots, x_N) || \le \epsilon_x$ । क्वांटम मशीन लर्निंग के लिए, यह इनपुट एक क्वांटम अवस्था के आयाम या एक मैट्रिक्स के विकर्ण प्रविष्टियाँ हो सकती हैं। बहुभिन्नरूपी अवस्था तैयारी के लिए, इनपुट आमतौर पर एक सदिशीकृत $D$-आयामी ग्रिड बिंदु होता है, जिसे एक विकर्ण ब्लॉक-एन्कोडिंग के रूप में भी प्रदान किया जाता है।

आउटपुट/लक्ष्य अवस्था:
वांछित अंतिम बिंदु अनुप्रयोग पर निर्भर करता है:
* एक क्वांटम लर्निंग मॉडल के रूप में: लक्ष्य $K$-आयामी आउटपुट वेक्टर $\Phi(\vec{x}) \in [-1,1]^K$ का एक विकर्ण ब्लॉक-एन्कोडिंग उत्पन्न करना है। इस आउटपुट वेक्टर के घटक, $\Phi(\vec{x})_q = \frac{1}{N} \sum_{p=1}^N \phi_{pq}(x_p)$, जहाँ $\phi_{pq}$ एकचर सक्रियण फलन हैं, को शास्त्रीय रूप से $\delta$-परिशुद्धता के एक योगात्मक मान तक अनुमानित किया जाना चाहिए।
* एक बहुभिन्नरूपी क्वांटम अवस्था-तैयारी प्रोटोकॉल के रूप में: उद्देश्य एक क्वांटम अवस्था $|\psi\rangle$ तैयार करना है जिसके आयाम इनपुट के एक बहुभिन्नरूपी फलन के अनुरूप हों, जैसे कि एक नियमित वर्ग ग्रिड पर एक $D$-आयामी गाऊसी वितरण। यह एक समान सुपरपोज़िशन पर अंतिम ब्लॉक-एन्कोडिंग लागू करके और फिर आयाम प्रवर्धन का उपयोग करके प्राप्त किया जाता है।

लुप्त कड़ी/गणितीय अंतर:
यह पत्र जिस मौलिक अंतर को पाटने का प्रयास करता है, वह है शास्त्रीय KANs की संरचनात्मक संरचना का क्वांटम कंप्यूटिंग प्रतिमान में कुशल और सटीक अनुवाद। शास्त्रीय KANs जटिल बहुभिन्नरूपी फलनों को एकचर फलनों की संरचनाओं और योगों में विघटित करते हैं। चुनौती इन गैर-रैखिक एकचर फलनों और उनके योगों को क्वांटम संचालन का उपयोग करके महसूस करने में निहित है, विशेष रूप से ब्लॉक-एन्कोडेड डेटा पर क्वांटम सिंगुलर वैल्यू ट्रांसफॉर्मेशन (QSVT) का लाभ उठाते हुए, जबकि एकात्मकता और त्रुटि प्रसार जैसी अंतर्निहित क्वांटम बाधाओं को दूर करते हैं। पत्र का उद्देश्य एक ठोस क्वांटम आर्किटेक्चर प्रदान करना है जो संभावित क्वांटम स्पीडअप के साथ इन संचालन को कर सकता है।

दुविधा और दर्दनाक व्यापार-बंद:
क्वांटम मशीन लर्निंग और अवस्था तैयारी में समान समस्याओं को हल करने का प्रयास करने वाले पिछले शोधकर्ताओं को कई दर्दनाक व्यापार-बंदों का सामना करना पड़ा है:
* क्वांटम स्पीडअप बनाम शास्त्रीय रीडआउट: जबकि क्वांटम एल्गोरिदम घातीय रूप से बड़े डेटा संरचनाओं (जैसे ब्लॉक-एन्कोडिंग) को कुशलतापूर्वक संसाधित कर सकते हैं, पूर्ण आउटपुट को शास्त्रीय रूप से निकालना किसी भी क्वांटम लाभ को नकार सकता है। QKANs के लिए, क्वांटम स्पीडअप की प्राप्ति शास्त्रीय पोस्ट-प्रोसेसिंग लागत के उप-घातीय रहने पर निर्भर करती है। इसका मतलब है कि आउटपुट आयाम $K$ को $O(\text{polylog}(N))$ तक प्रतिबंधित किया जाना चाहिए, क्योंकि घातीय संख्या में मानों का अनुमान लगाना स्वयं घातीय समय लेगा।
* उथली बनाम गहरी आर्किटेक्चर: QKANs को "चौड़ा-और-उथला" (wide-and-shallow) डिज़ाइन किया गया है। वे कुशल ब्लॉक-एन्कोडिंग उपलब्ध होने पर पॉलीलॉगरिदमिक लागत पर घातीय रूप से चौड़ी परतें महसूस कर सकते हैं, एक ऐसा क्षेत्र जो शास्त्रीय न्यूरल नेटवर्क्स के लिए दुर्गम है। हालांकि, कई परतों को संयोजित करने के लिए पुनरावर्ती QSVT-आधारित निर्माण सर्किट गहराई में घातीय ओवरहेड का कारण बनता है। यह QKANs को कम्प्यूटेशनल व्यवहार्यता बनाए रखने के लिए उथली, आमतौर पर $L=O(1)$ परतों तक सीमित करता है।
* परिशुद्धता बनाम क्वेरी जटिलता: क्वांटम लर्निंग मॉडल में आउटपुट अनुमान के लिए, उच्च परिशुद्धता (छोटे $\delta$) प्राप्त करने के लिए नियंत्रित विकर्ण ब्लॉक-एन्कोडिंग के लिए अधिक संख्या में क्वेरी की आवश्यकता होती है। विशेष रूप से, एक योगात्मक $\delta$ सन्निकटन के लिए $O(d^2/\delta)$ क्वेरी की आवश्यकता होती है। यदि एक गुणात्मक त्रुटि की आवश्यकता होती है, तो क्वेरी गणना $O(d^2/(\delta|a_q|))$ तक बढ़ जाती है, जिसका अर्थ है कि संभावित क्वांटम स्पीडअप केवल तभी संरक्षित रहता है जब आयाम $a_q$ घातीय रूप से क्षय नहीं होता है। यह वांछित सटीकता और आवश्यक कम्प्यूटेशनल संसाधनों (क्वेरी) के बीच एक व्यापार-बंद प्रस्तुत करता है।

बाधाएँ और विफलता मोड

QKANs को लागू करने की समस्या को कई कठोर, यथार्थवादी दीवारों द्वारा अविश्वसनीय रूप से कठिन बना दिया गया है:

  • एकात्मकता बाधा (Unitarity Constraint): क्वांटम यांत्रिकी यह निर्धारित करती है कि सभी संचालन एकात्मक होने चाहिए। यह एक सख्त बाधा लगाता है कि सभी वेक्टर तत्व (इनपुट, आउटपुट और भार) ब्लॉक-एन्कोडिंग के रूप में एन्कोड किए जाने पर एक के परिमाण में सीमित होने चाहिए। यह एक मौलिक भौतिक बाधा है जिसके लिए डेटा के सावधानीपूर्वक सामान्यीकरण और स्केलिंग की आवश्यकता होती है।
  • इनपुट का कुशल ब्लॉक-एन्कोडिंग: QKAN की गेट जटिलता $N$-आयामी इनपुट वेक्टर के प्रारंभिक ब्लॉक-एन्कोडिंग के निर्माण की लागत के साथ रैखिक रूप से स्केल करती है। QKANs को क्वांटम स्पीडअप प्रदान करने के लिए, इनपुट को कुशल ब्लॉक-एन्कोडिंग स्वीकार करना चाहिए जिन्हें $O(\text{polylog}(N))$ समय में तैयार किया जा सके। यदि इनपुट एन्कोडिंग के लिए स्वयं $O(N)$ गेट की आवश्यकता होती है, तो शास्त्रीय एल्गोरिदम पर क्वांटम लाभ खो जाता है। यह एक महत्वपूर्ण डेटा-संचालित बाधा है।
  • पुनरावर्ती त्रुटि प्रसार: इनपुट और भार के ब्लॉक-एन्कोडिंग में अपूर्णताएं जमा हो जाती हैं। एक बहु-परत QKAN में, ये त्रुटियां प्रत्येक बाद की परत के साथ पुनरावर्ती रूप से फैलती हैं, जिससे अंतिम आउटपुट ब्लॉक-एन्कोडिंग में एक प्रवर्धित त्रुटि होती है। यह गहरी QKANs के लिए उच्च परिशुद्धता प्राप्त करना अत्यंत चुनौतीपूर्ण बनाता है और उनकी व्यावहारिक गहराई को सीमित करता है।
  • गहरी आर्किटेक्चर के लिए घातीय सर्किट गहराई: QKAN के निर्माण की पुनरावर्ती प्रकृति, जहां एक परत का आउटपुट ब्लॉक-एन्कोडिंग अगले के लिए इनपुट के रूप में कार्य करता है, परतों की संख्या $L$ पर सर्किट गहराई की घातीय निर्भरता की ओर ले जाता है। यह कम्प्यूटेशनल बाधा QKANs को उथली आर्किटेक्चर ($L=O(1)$) तक गंभीर रूप से सीमित करती है, भले ही गहरी नेटवर्क के सैद्धांतिक लाभ हों।
  • सहायक क्वबिट सीमाएँ: QKAN निर्माण के लिए आवश्यक सहायक क्वबिट्स की कुल संख्या परतों की संख्या $L$ के साथ रैखिक रूप से बढ़ती है। हालांकि घातीय स्केलिंग नहीं है, यह वर्तमान और निकट-भविष्य के क्वांटम उपकरणों के लिए एक हार्डवेयर मेमोरी सीमा हो सकती है।
  • बहुपद सन्निकटन सीमाएँ: QSVT, गैर-रैखिक परिवर्तनों को लागू करने के लिए एक मुख्य तंत्र, लक्ष्य फलनों के बहुपद सन्निकटन पर निर्भर करता है। सभी फलनों को निम्न-डिग्री बहुपद द्वारा कुशलतापूर्वक अनुमानित नहीं किया जा सकता है, जो कुछ कार्यों के लिए QKANs की अभिव्यक्ति और सटीकता को सीमित करता है। उदाहरण के लिए, गाऊसी अवस्था तैयारी के लिए घातीय फलन का सन्निकटन समग्र सटीकता को प्रभावित करते हुए पर्याप्त उच्च बहुपद डिग्री की आवश्यकता होती है।
  • वास्तविक-मान प्रतिबंध: वर्तमान कार्य स्पष्ट रूप से अपने दायरे को वास्तविक-मान इनपुट, आउटपुट और भार तक सीमित करता है। जटिल संख्याओं में सामान्यीकरण संभव है, लेकिन इसे भविष्य के काम के लिए छोड़ दिया गया है, जो मॉडल की प्रयोज्यता में वर्तमान सीमा को इंगित करता है।
  • ग्रेडिएंट अनुमान की लागत: पैरामीटर-शिफ्ट नियमों का उपयोग करके QKANs को प्रशिक्षित करने के लिए विश्लेषणात्मक ग्रेडिएंट प्राप्त करने के लिए कम्प्यूटेशनल रूप से महंगा है। लागत एक एकल-परत QKAN के लिए $O(d)$ क्वेरी और एक $L$-परत QKAN के लिए $O(d^2L)$ के रूप में स्केल करती है, जहां $d$ चेबीशेव बहुपद की अधिकतम डिग्री है। परतों के साथ यह घातीय स्केलिंग गहरी QKANs को प्रशिक्षित करना अविश्वसनीय रूप से कठिन और संसाधन-गहन बनाती है।

यह दृष्टिकोण क्यों

चुनाव की अनिवार्यता

क्वांटम कोल्मोगोरोव-आर्नोल्ड नेटवर्क्स (QKAN) को अपनाना केवल एक विकल्प नहीं था, बल्कि क्वांटम डोमेन में बहुभिन्नरूपी फलन सन्निकटन और अवस्था तैयारी की अनूठी मांगों से प्रेरित एक अंतर्निहित आवश्यकता थी। लेखकों की यह अहसास कि पारंपरिक "अत्याधुनिक" (SOTA) विधियाँ अपर्याप्त थीं, कई प्रमुख अवलोकनों से उत्पन्न हुई।

सबसे पहले, शास्त्रीय कोल्मोगोरोव-आर्नोल्ड नेटवर्क्स (KANs) ने पहले ही पारंपरिक मल्टी-लेयर परसेप्ट्रॉन (MLPs) की तुलना में व्याख्यात्मकता और सटीकता के मामले में गुणात्मक लाभ प्रदर्शित किया था, विशेष रूप से प्रतीकात्मक फलनों से जुड़े वैज्ञानिक अनुप्रयोगों में। इन लाभों को क्वांटम कंप्यूटेशन में अनुवादित करने के लिए, एक क्वांटम-देशी दृष्टिकोण आवश्यक था। मानक क्वांटम मशीन लर्निंग मॉडल, जैसे कि पैरामीट्रिक क्वांटम सर्किट का उपयोग करने वाले विविध क्वांटम एल्गोरिदम (VQAs), या CNNs और ट्रांसफॉर्मर के क्वांटम संस्करण, आम तौर पर विभिन्न आर्किटेक्चरल सिद्धांतों पर निर्भर करते हैं जो स्वाभाविक रूप से KANs की संरचनात्मक संरचना को कैप्चर नहीं करते हैं।

महत्वपूर्ण "आह!" क्षण तब हुआ जब KANs के लिए केंद्रीय गैर-रैखिक सक्रियण फलनों को क्वांटम ढांचे के भीतर लागू करने के तरीके पर विचार किया गया, जबकि क्वांटम स्पीडअप बनाए रखा गया। क्वांटम अवस्थाओं पर सीधे शास्त्रीय गैर-रैखिकता का अनुकरण करना आम तौर पर अक्षम है। क्वांटम सिंगुलर वैल्यू ट्रांसफॉर्मेशन (QSVT) एकमात्र व्यवहार्य समाधान के रूप में उभरा क्योंकि यह ब्लॉक-एन्कोडेड मैट्रिसेस के सिंगुलर वैल्यूज़ पर बहुपद परिवर्तनों को लागू करने के लिए एक शक्तिशाली और बहुमुखी मेटा-एल्गोरिथम प्रदान करता है। यह क्षमता ठीक वही है जो KANs के एकचर सक्रियण फलनों को क्वांटम सेटिंग में महसूस करने के लिए आवश्यक है। QSVT के बिना, क्वांटम डेटा (ब्लॉक-एन्कोडिंग के रूप में दर्शाया गया) पर इस तरह की गैर-रैखिकता को कुशलतापूर्वक लागू करना असाध्य होगा या किसी भी संभावित क्वांटम लाभ को नकार देगा। पत्र स्पष्ट रूप से कहता है कि QKAN "ब्लॉक-एन्कोडेड मैट्रिसेस के आइगेनवैल्यूज़ को न्यूरॉन्स के रूप में मानता है और चेबीशेव बहुपद के रैखिक संयोजनों, या अन्य आधार फलनों के माध्यम से नेटवर्क किनारों पर पैरामीट्रिक सक्रियण फलनों को लागू करता है जिन्हें QSVT का उपयोग करके कुशलतापूर्वक महसूस किया जा सकता है," जो QSVT को मुख्य प्रवर्तक के रूप में उजागर करता है।

तुलनात्मक श्रेष्ठता

QKAN जबरदस्त संरचनात्मक लाभ प्रदर्शित करता है जो इसे विशिष्ट समस्या वर्गों के लिए पिछले स्वर्ण मानकों की तुलना में गुणात्मक रूप से श्रेष्ठ स्थिति में रखता है। सबसे महत्वपूर्ण लाभ इसकी "चौड़ी-और-उथली" वास्तुकला में निहित है। जबकि QKAN परतों को पुनरावर्ती रूप से संयोजित करने से गहराई में घातीय ओवरहेड होता है, वास्तुकला को उथली विन्यासों ($L = O(1)$) तक सीमित करता है, इस उथली गहराई की भरपाई घातीय रूप से चौड़ी परतों को पॉलीलॉगरिदमिक लागत पर महसूस करने की क्षमता से की जाती है, बशर्ते इनपुट के कुशल ब्लॉक-एन्कोडिंग उपलब्ध हों। यह शासन शास्त्रीय न्यूरल नेटवर्क्स के लिए मौलिक रूप से दुर्गम है, जिन्हें समान ऑपरेशन के लिए $O(N)$ रनटाइम की आवश्यकता होगी।

उदाहरण के लिए, QKAN $N$-आयामी क्वांटम अवस्था को $O(\text{polylog}(N))$ समय में बहुभिन्नरूपी फलन की गणना करके संसाधित कर सकता है, यह मानते हुए कि लक्ष्य फलन का एक कुशल बहुपद सन्निकटन है। यह समान ऑपरेशन के लिए शास्त्रीय $O(N)$ रनटाइम पर एक महत्वपूर्ण क्वांटम स्पीडअप प्रदान करता है। यह दक्षता QKAN की ब्लॉक-एन्कोडिंग और QSVT पर निर्भरता से उत्पन्न होती है, जो घातीय रूप से बड़े एकात्मक ऑपरेटरों को कुशलतापूर्वक हेरफेर करने की अनुमति देते हैं।

इसके अलावा, QKAN शास्त्रीय KANs के व्याख्यात्मकता लाभों को विरासत में मिला है। व्यक्तिगत सक्रियण फलनों का निरीक्षण करने और शून्य फलनों के समान दिखने वाले को छांटने की क्षमता, विरल संरचनात्मक संरचनाओं की खोज और नए भौतिक नियमों की खोज की क्षमता प्रदान करती है, जो अक्सर ब्लैक-बॉक्स डीप लर्निंग मॉडल में कमी वाली एक गुणात्मक लाभ है। QSVT ढांचे की बहुमुखी प्रतिभा का मतलब यह भी है कि QKAN चेबीशेव बहुपद तक सीमित नहीं है, बल्कि विभिन्न अनुप्रयोगों के अनुरूप लचीलापन प्रदान करते हुए आधार फलनों की एक विस्तृत श्रृंखला को लागू कर सकता है। पत्र उच्च-आयामी शोर को संभालने में लाभ या $O(N^2)$ से $O(N)$ तक मेमोरी जटिलता में कमी का स्पष्ट रूप से विवरण नहीं देता है, लेकिन ब्लॉक-एन्कोडिंग दृष्टिकोण स्वाभाविक रूप से जानकारी को संपीड़ित करता है, और चौड़ी परतों के लिए पॉलीलॉगरिदमिक स्केलिंग बड़े इनपुट के लिए संसाधनों के अत्यधिक कुशल उपयोग का अर्थ है।

बाधाओं के साथ संरेखण

चुना गया QKAN विधि क्वांटम कंप्यूटेशन की अंतर्निहित बाधाओं और समस्या परिभाषा के साथ एक आदर्श "विवाह" प्रदर्शित करती है।

  1. कुशल इनपुट एन्कोडिंग: क्वांटम एल्गोरिदम को स्पीडअप प्राप्त करने के लिए एक प्राथमिक बाधा इनपुट डेटा की कुशल तैयारी या एन्कोडिंग है। QKAN इनपुट वैक्टर के ब्लॉक-एन्कोडिंग पर संचालन करके पूरी तरह से संरेखित होता है। इसकी गेट जटिलता इन ब्लॉक-एन्कोडिंग के निर्माण की लागत के साथ रैखिक रूप से स्केल करती है, जो स्वाभाविक रूप से क्वांटम इनपुट (जैसे, एक क्वांटम अवस्था के आयाम या हैमिल्टनियन के ब्लॉक-एन्कोडिंग) के लिए $O(\text{polylog}(N))$ जितनी कुशल हो सकती है। यह सुनिश्चित करता है कि इनपुट बाधा क्वांटम लाभ को नकार न दे।

  2. एकात्मकता और सीमित मान: क्वांटम कंप्यूटेशन के लिए सख्ती से संचालन को एकात्मक होने की आवश्यकता होती है। QSVT पर आधारित QKAN का डिज़ाइन स्वाभाविक रूप से इसका सम्मान करता है। ब्लॉक-एन्कोडिंग प्रतिनिधित्व स्वयं सुनिश्चित करता है कि वैक्टर को एकात्मक मैट्रिसेस के भीतर एन्कोड किया गया है, और इन वैक्टर के तत्व एक के परिमाण में सीमित हैं, जो क्वांटम अवस्थाओं की आयाम बाधाओं को संतुष्ट करते हैं।

  3. उथली गहराई की आवश्यकता: QSVT का उपयोग करके QKAN परतों के पुनरावर्ती निर्माण से प्रत्येक अतिरिक्त परत के साथ सर्किट गहराई में घातीय ओवरहेड होता है। यह बाधा स्वाभाविक रूप से QKAN को एक उथली वास्तुकला ($L=O(1)$) तक सीमित करती है। सीमित गहराई के लिए घातीय चौड़ाई की भरपाई के रूप में, यह बाधा स्वाभाविक रूप से QKAN को "चौड़ा-और-उथला" मॉडल के रूप में परिभाषित करती है, जहां घातीय चौड़ाई सीमित गहराई की भरपाई करती है, समाधान के गुणों को इस कठोर आवश्यकता के साथ संरेखित करती है।

  4. वास्तविक-मान संचालन: पत्र स्पष्ट रूप से इनपुट, आउटपुट और भार के लिए वास्तविक मानों के साथ अपनी चर्चा को सीमित करता है। चेबीशेव बहुपद और इसके ब्लॉक-एन्कोडिंग ढांचे के साथ QKAN का निर्माण वास्तविक-मान फलनों को संभालने के लिए अच्छी तरह से अनुकूल है, हालांकि जटिल संख्याओं में सामान्यीकरण को भविष्य के काम के रूप में नोट किया गया है।

विकल्पों का अस्वीकरण

यह पत्र QKAN की अनूठी आर्किटेक्चरल और कार्यात्मक भिन्नताओं को उजागर करके अन्य लोकप्रिय क्वांटम मशीन लर्निंग दृष्टिकोणों के अस्वीकरण का अर्थ है।

सबसे पहले, QKAN "विविध आर्किटेक्चर" (VQAs) से प्रस्थान करता है, जो अक्सर अनुभवजन्य होते हैं और पैरामीट्रिक क्वांटम सर्किट में मापदंडों को अनुकूलित करने पर निर्भर करते हैं। जबकि VQAs निकट-अवधि के क्वांटम उपकरणों के लिए उपयुक्त हैं, QKAN "अधिक शक्तिशाली क्वांटम रैखिक बीजगणित टूलसेट में कदम रखता है," जो अनुभवजन्य अनुकूलन के बजाय सटीक निर्माण के माध्यम से दोष-सहिष्णु क्वांटम स्पीडअप पर ध्यान केंद्रित करने का सुझाव देता है। विशेष रूप से बहुभिन्नरूपी क्वांटम अवस्थाओं को कुशलतापूर्वक तैयार करने या संरचनात्मक संरचना वाले फलनों का अनुमान लगाने की समस्या के लिए, QKAN का QSVT-आधारित दृष्टिकोण क्वांटम लाभ के लिए एक अधिक सीधा और संभावित रूप से अधिक मजबूत मार्ग प्रदान करता है।

दूसरे, QKAN की संरचनात्मक संरचना, शास्त्रीय KANs से प्रेरित, क्वांटम एमएलपी की निश्चित, सघन परतों, या क्वांटम सीएनएन या ट्रांसफॉर्मर के विशिष्ट आगमनात्मक पूर्वाग्रहों से मौलिक रूप से भिन्न है। ये वैकल्पिक आर्किटेक्चर KAN की फलनों को एकचर फलनों की संरचनाओं और योगों के रूप में दर्शाने की क्षमता को स्वाभाविक रूप से कैप्चर नहीं कर सकते हैं, न ही वे समान व्याख्यात्मकता लाभ प्रदान करेंगे। पत्र का यह कहना कि QKAN "पिछले आर्किटेक्चर के विपरीत है" इस अंतर को रेखांकित करता है।

हालांकि पत्र स्पष्ट रूप से यह विवरण नहीं देता है कि, उदाहरण के लिए, क्वांटम GANs या क्वांटम प्रसार मॉडल क्यों विफल होंगे, पॉलीलॉगरिदमिक लागत पर घातीय रूप से चौड़ी परतों को प्राप्त करने और वैज्ञानिक खोज के लिए इसकी व्याख्यात्मकता पर जोर देने से यह पता चलता है कि इन विशिष्ट लाभों के सर्वोपरि होने की समस्या डोमेन है। अन्य विधियां क्वांटम स्पीडअप, ब्लॉक-एन्कोडेड डेटा के कुशल संचालन और अंतर्निहित व्याख्यात्मकता के विशिष्ट संयोजन की पेशकश नहीं कर सकती हैं।

FIG. 9. Step 5. Sum the individual activation functions over N input nodes for each output node, creating the desired diagonal block-encoding UΦ of the K-dimensional output vector Φ(⃗x). This is achieved by sandwiching the block-encoding from Step 4 with two n-qubit Hadamard gates. The dimension reduction occurs as the n qubits originally used for input block-encoding are moved to the auxiliary register

गणितीय और तार्किक तंत्र

मास्टर समीकरण

क्वांटम कोल्मोगोरोव-आर्नोल्ड नेटवर्क (QKAN) परत का मुख्य गणितीय इंजन, विशेष रूप से CHEB-QKAN संस्करण, इसे इनपुट वेक्टर $\vec{x}$ को आउटपुट वेक्टर $\Phi(\vec{x})$ में कैसे बदलता है, इसमें समाहित है। इस परिवर्तन को $K$-आयामी वेक्टर के एक विकर्ण ब्लॉक-एन्कोडिंग के रूप में व्यक्त किया जाता है, जहां प्रत्येक घटक एकचर सक्रियण फलनों का योग होता है। सक्रियण फलन स्वयं चेबीशेव बहुपद के रैखिक संयोजनों के रूप में परिभाषित होते हैं।

एक एकल QKAN परत का आउटपुट इस प्रकार दिया गया है:
$$ \Phi(\vec{x}) = \text{diag}\left( \frac{1}{N} \sum_{p=1}^N \phi_{p1}(x_p), \dots, \frac{1}{N} \sum_{p=1}^N \phi_{pK}(x_p) \right)^T $$
यहां, प्रत्येक एकचर सक्रियण फलन $\phi_{pq}(x)$ को चेबीशेव बहुपद के पहले प्रकार के रैखिक संयोजन के रूप में परिभाषित किया गया है:
$$ \phi_{pq}(x) = \frac{1}{d+1} \sum_{r=0}^d w_{pq}^{(r)} T_r(x) $$

पद-दर-पद विच्छेदन

आइए प्रत्येक घटक की भूमिका और गणितीय परिभाषा को समझने के लिए इन समीकरणों का विश्लेषण करें:

  • $\Phi(\vec{x})$: यह एक एकल QKAN परत का आउटपुट दर्शाता है।
    • गणितीय परिभाषा: यह एक $K$-आयामी वेक्टर है जिसके घटक एकत्रित और रूपांतरित इनपुट सुविधाएँ हैं। क्वांटम संदर्भ में, इसे एक विकर्ण मैट्रिक्स के रूप में ब्लॉक-एन्कोड किया गया है, जिसका अर्थ है कि इसके घटक एक बड़े एकात्मक ऑपरेटर के विकर्ण पर दिखाई देते हैं।
    • भौतिक/तार्किक भूमिका: यह "संसाधित जानकारी" है जो QKAN परत उत्पन्न करती है। यह एक शास्त्रीय न्यूरल नेटवर्क में एक परत के आउटपुट के अनुरूप सक्रिय सुविधाओं के रूप में कार्य करता है, लेकिन एक क्वांटम-संगत प्रारूप में।
  • $\text{diag}(\dots)^T$: यह ऑपरेटर एक वेक्टर से एक विकर्ण मैट्रिक्स का निर्माण करता है।
    • गणितीय परिभाषा: एक वेक्टर $\vec{v} = (v_1, \dots, v_K)$ को देखते हुए, $\text{diag}(\vec{v})$ अपने मुख्य विकर्ण पर $v_1, \dots, v_K$ के साथ एक $K \times K$ विकर्ण मैट्रिक्स बनाता है। ट्रांसपोज़ $T$ इंगित करता है कि इनपुट वेक्टर वैचारिक रूप से एक कॉलम वेक्टर है।
    • भौतिक/तार्किक भूमिका: QKAN में, वैक्टर को विकर्ण ब्लॉक-एन्कोडिंग के रूप में दर्शाया जाता है। यह ऑपरेशन स्पष्ट रूप से बताता है कि परत का आउटपुट एक विकर्ण ब्लॉक-एन्कोडिंग है, जो बाद की QKAN परतों के इनपुट के रूप में इसके पुनरावर्ती उपयोग के लिए महत्वपूर्ण है।
  • $N$: इनपुट वेक्टर $\vec{x}$ का आयाम।
    • गणितीय परिभाषा: एक पूर्णांक, आमतौर पर दो की घात, $N=2^n$, जहाँ $n$ इनपुट को एन्कोड करने के लिए उपयोग किए जाने वाले क्वबिट्स की संख्या है।
    • भौतिक/तार्किक भूमिका: शास्त्रीय KAN सादृश्य में इनपुट सुविधाओं या "नोड्स" की संख्या का प्रतिनिधित्व करता है। $N$ से विभाजन योग के लिए एक सामान्यीकरण कारक के रूप में कार्य करता है, यह सुनिश्चित करता है कि आउटपुट एक सीमित सीमा के भीतर बना रहे, जो ब्लॉक-एन्कोडिंग के लिए महत्वपूर्ण है।
  • $K$: आउटपुट वेक्टर $\Phi(\vec{x})$ का आयाम।
    • गणितीय परिभाषा: एक पूर्णांक, आमतौर पर दो की घात, $K=2^k$, जहाँ $k$ आउटपुट एन्कोडिंग के लिए क्वबिट्स की संख्या है।
    • भौतिक/तार्किक भूमिका: शास्त्रीय KAN सादृश्य में आउटपुट सुविधाओं या "नोड्स" की संख्या का प्रतिनिधित्व करता है।
  • $\sum_{p=1}^N$: इनपुट नोड्स पर एक योग।
    • गणितीय परिभाषा: यह ऑपरेटर प्रत्येक $p$ के लिए $1$ से $N$ तक $\phi_{pq}(x_p)$ के मानों का योग करता है।
    • भौतिक/तार्किक भूमिका: यह एक मौलिक एकत्रीकरण कदम है। प्रत्येक आउटपुट नोड $q$ के लिए, यह सभी इनपुट नोड्स $p$ से रूपांतरित जानकारी को जोड़ता है। यह योग कोल्मोगोरोव-आर्नोल्ड प्रतिनिधित्व प्रमेय के एकचर फलनों को संयोजित करने के सिद्धांत का प्रत्यक्ष अनुवाद है। यहां गुणन के बजाय जोड़ का चुनाव KAN आर्किटेक्चर में निहित है, जो फलनों को संरचनाओं के योग के रूप में मॉडल करता है, आउटपुट परत पर सुविधाओं का एक रैखिक संयोजन प्रदान करता है।
  • $\phi_{pq}(x_p)$: एक एकचर सक्रियण फलन।
    • गणितीय परिभाषा: एक फलन जो एक एकल वास्तविक इनपुट $x_p \in [-1,1]$ लेता है और इसे एक वास्तविक आउटपुट पर मैप करता है। यह इनपुट नोड $p$ और आउटपुट नोड $q$ के प्रत्येक जोड़े के लिए विशिष्ट रूप से परिभाषित है।
    • भौतिक/तार्किक भूमिका: ये नेटवर्क के "किनारे" हैं, जो व्यक्तिगत इनपुट घटकों पर गैर-रैखिक परिवर्तन लागू करते हैं। वे QKAN के मूल प्रशिक्षण योग्य तत्व हैं, जो गैर-रैखिकता का परिचय देने और जटिल संबंधों को सीखने के लिए जिम्मेदार हैं।
  • $x_p$: इनपुट वेक्टर $\vec{x}$ का $p$-वां घटक।
    • गणितीय परिभाषा: एक वास्तविक संख्या, $x_p \in [-1,1]$, एक एकल इनपुट सुविधा का प्रतिनिधित्व करती है।
    • भौतिक/तार्किक भूमिका: यह कच्चा इनपुट डेटा बिंदु है जो QKAN परत में प्रवेश करता है।
  • $d$: उपयोग किए जाने वाले चेबीशेव बहुपद की अधिकतम डिग्री।
    • गणितीय परिभाषा: एक गैर-ऋणात्मक पूर्णांक।
    • भौतिक/तार्किक भूमिका: यह पैरामीटर सक्रियण फलनों $\phi_{pq}(x)$ की जटिलता और अभिव्यक्ति को नियंत्रित करता है। एक उच्च $d$ अधिक जटिल गैर-रैखिक परिवर्तनों की अनुमति देता है।
  • $\frac{1}{d+1} \sum_{r=0}^d$: चेबीशेव बहुपद डिग्री पर एक सामान्यीकृत योग।
    • गणितीय परिभाषा: यह $d+1$ चेबीशेव बहुपद का एक रैखिक संयोजन है, जिसे $1/(d+1)$ द्वारा सामान्यीकृत किया गया है।
    • भौतिक/तार्किक भूमिका: यह समग्र सक्रियण फलन $\phi_{pq}(x)$ का निर्माण करने के लिए विभिन्न आधार फलनों को जोड़ता है। सामान्यीकरण फलन आउटपुट को सीमित रखने में मदद करता है। योग (रैखिक संयोजन) का उपयोग विभिन्न फलनों के लचीले सन्निकटन की अनुमति देता है, जो गुणांक $w_{pq}^{(r)}$ को समायोजित करके किया जाता है।
  • $w_{pq}^{(r)}$: एक भार गुणांक।
    • गणितीय परिभाषा: एक वास्तविक संख्या, $w_{pq}^{(r)} \in [-1,1]$।
    • भौतिक/तार्किक भूमिका: ये QKAN के प्रशिक्षण योग्य पैरामीटर हैं। वे प्रत्येक चेबीशेव बहुपद $T_r(x)$ के सक्रियण फलन $\phi_{pq}(x)$ में योगदान को निर्धारित करते हैं, प्रभावी रूप से गैर-रैखिकता को आकार देते हैं।
  • $T_r(x)$: पहला प्रकार का $r$-वां चेबीशेव बहुपद।
    • गणितीय परिभाषा: $T_r(x) = \cos(r \arccos(x))$, $x \in [-1,1]$ के लिए परिभाषित।
    • भौतिक/तार्किक भूमिका: ये बहुपद सक्रियण फलनों के लिए आधार फलनों के रूप में काम करते हैं। उन्हें इसलिए चुना जाता है क्योंकि उन्हें क्वांटम सिंगुलर वैल्यू ट्रांसफॉर्मेशन (QSVT) का उपयोग करके क्वांटम कंप्यूटर पर कुशलतापूर्वक लागू किया जा सकता है, जिससे वे क्वांटम ढांचे के लिए एक प्राकृतिक फिट बन जाते हैं।

चरण-दर-चरण प्रवाह

एक एकल अमूर्त डेटा बिंदु, जैसे $x_p$, की कल्पना करें क्योंकि यह एक QKAN परत से गुजरता है, एक इनपुट घटक से अंतिम आउटपुट वेक्टर के हिस्से में रूपांतरित होता है। यह प्रक्रिया एक क्वांटम असेंबली लाइन की तरह है:

  1. इनपुट ब्लॉक-एन्कोडिंग: सबसे पहले, संपूर्ण $N$-आयामी इनपुट वेक्टर $\vec{x} = (x_1, \dots, x_N)$ को एक विकर्ण ब्लॉक-एन्कोडिंग $U_x$ के रूप में प्रस्तुत किया जाता है। इसका मतलब है कि प्रत्येक $x_p$ को एक बड़े एकात्मक मैट्रिक्स के भीतर एक विकर्ण तत्व के रूप में एन्कोड किया गया है। यह हमारा कच्चा माल है, जो क्वांटम कारखाने में प्रवेश कर रहा है।
  2. विस्तार और प्रतिकृति: इनपुट ब्लॉक-एन्कोडिंग $U_x$ को फिर $k = \log_2 K$ सहायक क्वबिट्स जोड़कर "विस्तारित" किया जाता है। वैचारिक रूप से, यह चरण प्रत्येक इनपुट घटक $x_p$ को $K$ विभिन्न "चैनलों" में से प्रत्येक के लिए प्रतिकृति करता है, प्रत्येक आउटपुट नोड $q$ के लिए एक। यह सुनिश्चित करता है कि प्रत्येक इनपुट प्रत्येक आउटपुट को प्रभावित कर सके।
  3. चेबीशेव बहुपद परिवर्तन: प्रत्येक प्रतिकृति $x_p$ और प्रत्येक बहुपद डिग्री $r$ के लिए $0$ से $d$ तक, एक क्वांटम सिंगुलर वैल्यू ट्रांसफॉर्मेशन (QSVT) लागू किया जाता है। यह प्रभावी रूप से $p$ और $r$ के सभी मानों के लिए $T_r(x_p)$ की गणना करता है, अभी भी ब्लॉक-एन्कोडेड रूप में। यह कच्चे माल को विशेष मशीनों के माध्यम से भेजने जैसा है जो उस पर विभिन्न गणितीय फलनों (चेबीशेव बहुपद) को लागू करती हैं।
  4. भारित स्केलिंग: अगला, प्रत्येक ब्लॉक-एन्कोडेड $T_r(x_p)$ को उसके संबंधित भार गुणांक $w_{pq}^{(r)}$ से गुणा किया जाता है। ये भार भी विकर्ण ब्लॉक-एन्कोडिंग के रूप में प्रदान किए जाते हैं। यह गुणन क्वांटम रैखिक बीजगणित उप-रूटीन का उपयोग करके किया जाता है। यह चरण रूपांतरित सुविधाओं को सीखे गए मापदंडों के अनुसार स्केल करता है, जैसे प्रत्येक सिग्नल की तीव्रता को समायोजित करना।
  5. आधार फलन संयोजन (LCU): एक विशिष्ट इनपुट-आउटपुट जोड़ी $(p,q)$ के लिए, सभी भारित चेबीशेव बहुपद $w_{pq}^{(r)} T_r(x_p)$ ( $r=0, \dots, d$ के लिए) को रैखिक रूप से संयोजित किया जाता है। यह भारित ब्लॉक-एन्कोडिंग को लागू करने वाले नियंत्रण क्वबिट्स के एक समान सुपरपोज़िशन को तैयार करने सहित एक रैखिक संयोजन इकाई (LCU) प्रक्रिया का उपयोग करके प्राप्त किया जाता है। यह मशीन प्रत्येक इनपुट नोड से योगदान को एकत्रित करती है ताकि पूर्ण गैर-रैखिक सक्रियण फलन $\phi_{pq}(x_p)$ का निर्माण किया जा सके।
  6. इनपुट नोड एकत्रीकरण (हैडमार्ड योग): अंत में, प्रत्येक आउटपुट नोड $q$ के लिए, मान $\phi_{pq}(x_p)$ ( $p=1, \dots, N$ के लिए) का योग किया जाता है। यह हैडमार्ड गेट्स को 'इनपुट' क्वबिट्स पर सैंडविच करके किया जाता है, जो $\phi_{pq}(x_p)$ के ब्लॉक-एन्कोडिंग को नियंत्रित करता है। यह ऑपरेशन प्रभावी रूप से प्रत्येक विशिष्ट आउटपुट नोड $q$ के लिए सभी इनपुट नोड्स से योगदान को औसत करता है, आउटपुट वेक्टर $\Phi(\vec{x})$ के $q$-वें घटक का उत्पादन करता है। इनपुट क्वबिट्स को फिर एक सहायक रजिस्टर में अवशोषित किया जाता है, जिससे समग्र आयाम कम हो जाता है।
  7. आउटपुट ब्लॉक-एन्कोडिंग: इन परिचालनों का परिणाम $K$-आयामी आउटपुट वेक्टर $\Phi(\vec{x})$ का एक विकर्ण ब्लॉक-एन्कोडिंग है। यह अंतिम उत्पाद तब एक और QKAN परत में फीड करने या शास्त्रीय आउटपुट के लिए मापने के लिए तैयार होता है।

अनुकूलन गतिकी

QKAN तंत्र अपने प्रशिक्षण योग्य मापदंडों, भार गुणांक $w_{pq}^{(r)}$ को समायोजित करके एक पूर्वनिर्धारित लागत फलन को कम करके सीखता है। इस सीखने की प्रक्रिया में कई प्रमुख गतिकी शामिल हैं:

  1. भार का पैरामीट्रिकरण: भार $w_{pq}^{(r)}$ सीधे शास्त्रीय संख्याएं नहीं हैं, बल्कि विकर्ण ब्लॉक-एन्कोडिंग $U_{w^{(r)}}$ में एन्कोड किए गए हैं। पत्र इस पैरामीट्रिकरण के लिए दो प्राथमिक विधियों की रूपरेखा तैयार करता है:

    • आयाम एन्कोडिंग: भार को एक पैरामीट्रिक क्वांटम अवस्था $|w(\theta)\rangle = U(\theta)|0\rangle$ के वास्तविक आयामों से प्राप्त किया जा सकता है। यहां, $U(\theta)$ एक पैरामीट्रिक क्वांटम सर्किट (PQC) है जिसके गेट कोण $\theta$ वास्तविक प्रशिक्षण योग्य पैरामीटर हैं। यह विधि स्वाभाविक रूप से भार पर $L_2$ सामान्यीकरण बाधा लगाती है, जो नियमितीकरण के एक रूप के रूप में कार्य करती है।
    • हैडमार्ड उत्पाद एन्कोडिंग: वैकल्पिक रूप से, एक पैरामीट्रिक एकात्मक $U(\theta)$ को चेबीशेव बहुपद ब्लॉक-एन्कोडिंग के साथ हैडमार्ड उत्पाद के माध्यम से जोड़ा जा सकता है। यह अनुमान लगाया गया है कि यह दृष्टिकोण अधिक अभिव्यक्ति प्रदान करता है, जिससे भार पर $L_\infty$ मानदंड बाधा की अनुमति मिलती है।
      पैरामीट्रिकरण विधि की पसंद सीखे जाने योग्य फलनों के स्थान और मॉडल के नियमितीकरण गुणों को आकार देती है।
  2. हानि फलन और परिदृश्य: QKAN को एक क्वांटम लर्निंग मॉडल के रूप में डिज़ाइन किया गया है, जो एक लागत फलन के अस्तित्व का अर्थ है जो QKAN के आउटपुट और लक्ष्य मानों के बीच विसंगति को मापता है (जैसे, प्रतिगमन या वर्गीकरण के लिए)। "हानि परिदृश्य" पैरामीटर $\theta$ के स्थान पर इस लागत फलन द्वारा परिभाषित सतह है। पत्र स्पष्ट रूप से लागत फलन का विवरण नहीं देता है, लेकिन यह आम तौर पर निकाले गए आउटपुट आयामों का एक फलन होगा। आधार फलनों (चेबीशेव बहुपद) और पैरामीट्रिकरण विधि की पसंद इस परिदृश्य की चिकनाई और जटिलता को प्रभावित करती है।

  3. ग्रेडिएंट गणना: हानि परिदृश्य को नेविगेट करने और इसके न्यूनतम को खोजने के लिए, मॉडल को मापदंडों $\theta$ के संबंध में हानि के ग्रेडिएंट की गणना करने की आवश्यकता होती है।

    • विश्लेषणात्मक ग्रेडिएंट: पत्र पैरामीटर-शिफ्ट नियमों का उपयोग करने का सुझाव देता है, जो विविध क्वांटम एल्गोरिदम में एक सामान्य तकनीक है, विश्लेषणात्मक ग्रेडिएंट की गणना करने के लिए। QKAN के पुनरावर्ती और संरचनात्मक निर्माण (QSVT, LCU, और ब्लॉक-एन्कोडिंग उत्पादों को शामिल करते हुए) के कारण, वही PQC पैरामीटर $\theta$ सर्किट के विभिन्न भागों में पुन: उपयोग किए जाते हैं। इसका मतलब है कि ग्रेडिएंट को व्यक्तिगत उप-शब्दों से योगदान का योग करके प्राप्त किया जा सकता है। हालांकि, यह दृष्टिकोण एक एकल-परत QKAN के लिए $O(d)$ क्वेरी और एक $L$-परत QKAN के लिए घातीय, $O(d^2L)$ के रूप में स्केल करता है, जो एक महत्वपूर्ण कम्प्यूटेशनल लागत है।
    • ग्रेडिएंट अनुमान: विश्लेषणात्मक ग्रेडिएंट की उच्च लागत से बचने के लिए, लेखक परिमित अंतर विधियों या समकालिक गड़बड़ी स्टोकेस्टिक सन्निकटन (SPSA) जैसी ग्रेडिएंट अनुमान तकनीकों का उपयोग करने का प्रस्ताव करते हैं। SPSA विशेष रूप से आकर्षक है क्योंकि इसकी कम्प्यूटेशनल लागत मापदंडों की संख्या से काफी हद तक स्वतंत्र है, जो विशेष रूप से कई प्रशिक्षण योग्य मापदंडों वाले मॉडल के लिए ग्रेडिएंट का अनुमान लगाने का एक अधिक कुशल तरीका प्रदान करता है।
  4. पैरामीटर अपडेट और अभिसरण: एक बार ग्रेडिएंट (या उनके अनुमान) प्राप्त हो जाने के बाद, ग्रेडिएंट डिसेंट या एडम जैसे शास्त्रीय अनुकूलन एल्गोरिदम का उपयोग मापदंडों $\theta$ को पुनरावृत्त रूप से अपडेट करने के लिए किया जाता है। ये ऑप्टिमाइज़र हानि फलन को कम करने की दिशा में मापदंडों को समायोजित करते हैं। क्वांटम प्राकृतिक ग्रेडिएंट विधियों का भी संभावित रूप से तेज अभिसरण के लिए उपयोग किया जा सकता है, जिसमें क्वांटम फिशर सूचना मैट्रिक्स की गणना शामिल है। पुनरावृत्त अपडेट तब तक जारी रहते हैं जब तक कि मॉडल हानि परिदृश्य में एक संतोषजनक न्यूनतम पर अभिसरण नहीं कर लेता। गाऊसी अवस्था तैयारी के संख्यात्मक चित्रण से पता चलता है कि बहुपद डिग्री $d$ के साथ $L_2$ त्रुटि घातीय रूप से घटती है, जो फलन सन्निकटन के लिए अच्छे अभिसरण व्यवहार का संकेत देती है। हालांकि, परतों की संख्या $L$ के साथ क्वेरी जटिलता की घातीय स्केलिंग का मतलब है कि QKAN उथली आर्किटेक्चर के लिए सबसे उपयुक्त है, जो बहुत जटिल, गहरी फलनों को सीखने की इसकी क्षमता को प्रभावित कर सकता है।

FIG. 1. Construction of a CHEB-QKAN layer with the corresponding quantum circuit. The input to the QKAN model is a diagonal block-encoding of an N-dimensional real vector ⃗x. The CHEB-QKAN layer applies univariate activation functions ϕpq to each input component xp, where p ∈[N] indexes input nodes and q ∈[K] indexes output nodes. The output vector is computed as a sum over activated input nodes. This operation yields a block-encoded real K-dimensional output vector. The quantum circuit implementation requires 1 + log2(d + 1) qubits for the construction and linear combination of weighted Chebyshev polynomials, aw + ax qubits for the block-encodings of input and weights, n = log2 N qubits for input vector encoding, and k = log2 K qubits for output. The circuit consists of a series of multi-controlled block-encodings of Chebyshev polynomials, interspersed with diagonal block- encodings of the corresponding real weights. The entire circuit represents a block-encoding of the K-dimensional vector corresponding to the CHEB-QKAN layer, with auxiliary qubits initialized and measured in the |0⟩state

परिणाम, सीमाएँ और निष्कर्ष

प्रयोगात्मक डिजाइन और आधार रेखाएँ

क्वांटम कोल्मोगोरोव-आर्नोल्ड नेटवर्क (QKAN) आर्किटेक्चर को कठोरता से मान्य करने के लिए, लेखकों ने एक विशिष्ट, फिर भी दृष्टांत, अनुप्रयोग पर ध्यान केंद्रित किया: बहुभिन्नरूपी क्वांटम अवस्था तैयारी। प्रयोगात्मक डिजाइन को प्रतिस्पर्धी क्वांटम मॉडल को आमने-सामने बेंचमार्क में हराने के लिए स्थापित नहीं किया गया था, बल्कि यह निश्चित प्रमाण प्रदान करने के लिए था कि QKAN का मुख्य संरचनात्मक तंत्र, क्वांटम सिंगुलर वैल्यू ट्रांसफॉर्मेशन (QSVT) का लाभ उठाते हुए, सटीक रूप से जटिल बहुभिन्नरूपी फलनों को महसूस कर सकता है। इस संदर्भ में "पीड़ित" स्वयं आदर्श लक्ष्य फलन था - एक D-आयामी गाऊसी वितरण - जिसे QKAN ने उच्च निष्ठा के साथ अनुमानित करने का लक्ष्य रखा था।

प्रयोग विशेष रूप से $32 \times 32$ ग्रिड पर एक 2D गाऊसी क्वांटम अवस्था तैयार करने पर केंद्रित था, जो प्रति आयाम $n=5$ क्वबिट्स के अनुरूप था, जिसमें $\beta=6$ का चुना हुआ पैरामीटर था। इस सेटअप ने QKAN के प्रदर्शन के स्पष्ट संख्यात्मक चित्रण की अनुमति दी। आर्किटेक्चर ने दो-परत QKAN का उपयोग किया। पहली परत को प्रत्येक ग्रिड बिंदु के लिए फलन $x^2 + y^2 - 1$ को सटीक रूप से गणना करने के लिए डिज़ाइन किया गया था, जो प्रभावी रूप से एक स्थानांतरित वर्ग त्रिज्या को एन्कोड करता है। दूसरी परत ने फिर चेबीशेव बहुपद के विभिन्न डिग्री का उपयोग करके घातीय क्षय फलन, $e^{-\beta(x+1)}$ के बहुपद सन्निकटन को लागू किया। यह दो-परत संरचना QKAN के संरचनात्मक सिद्धांत का एक प्रत्यक्ष उदाहरण थी, जहां एक परत का आउटपुट ( $x^2 + y^2 - 1$ का ब्लॉक-एन्कोडिंग) अगले के लिए इनपुट के रूप में कार्य करता था। प्रयोग को इस बात का कठोरता से प्रमाण देने के लिए आर्किटेक्ट किया गया था कि QSVT के माध्यम से गैर-रैखिक परिवर्तनों को लागू करने और परतों को संयोजित करने के बारे में गणितीय दावों को एक मूर्त, सटीक क्वांटम अवस्था में अनुवादित किया जा सकता है।

साक्ष्य क्या साबित करते हैं

संख्यात्मक चित्रण बहुभिन्नरूपी क्वांटम अवस्था तैयारी में QKAN आर्किटेक्चर की प्रभावकारिता के लिए सम्मोहक साक्ष्य प्रदान करता है। मुख्य निष्कर्ष चित्र 10 में प्रस्तुत किए गए हैं:

  1. बहुपद सन्निकटन सटीकता (चित्र 10a): पत्र पहले अंतराल $[-1,1]$ पर डिग्री-3 चेबीशेव बहुपद $P_3(x)$ के साथ गैर-रैखिक घातीय फलन $e^{-\beta(x+1)}$ के सन्निकटन की सटीकता को प्रदर्शित करता है। यह महत्वपूर्ण है क्योंकि ये बहुपद सन्निकटन QKAN के भीतर सक्रियण फलनों का आधार बनते हैं, जिन्हें QSVT के माध्यम से महसूस किया जाता है। प्लॉट स्पष्ट रूप से निर्दिष्ट सीमा के भीतर लक्ष्य फलन और इसके बहुपद सन्निकटन के बीच एक करीबी फिट दिखाता है, जो इन गैर-रैखिकता के कार्यान्वयन की व्यवहार्यता की पुष्टि करता है।

  2. निरपेक्ष आयाम त्रुटि (चित्र 10b): डिग्री-3 बहुपद $P_3(x)$ का उपयोग करके तैयार किए गए सामान्यीकृत 2D गाऊसी अवस्था के लिए $32 \times 32$ ग्रिड पर निरपेक्ष आयाम त्रुटि, $| \psi_{\text{exp}}(i,j) - \psi_{\text{QKAN}}(i,j) |$, को नेत्रहीन रूप से प्रस्तुत किया गया है। यह हीटमैप-जैसी प्लॉट एक प्रत्यक्ष, निर्विवाद दृश्य प्रमाण प्रदान करता है कि QKAN-तैयार अवस्था आदर्श गाऊसी अवस्था से कितनी अच्छी तरह मेल खाती है। त्रुटि आम तौर पर कम होती है, जिसमें सबसे बड़े अंतर वितरण के केंद्र के पास देखे जाते हैं। यह स्वयं बहुपद सन्निकटन के व्यवहार के अनुरूप है, जहां त्रुटियां उस क्षेत्र में अधिकतम थीं। यह कठोर साक्ष्य दिखाता है कि QKAN तंत्र इनपुट ग्रिड बिंदुओं को अपनी परतों के माध्यम से सफलतापूर्वक अनुवादित करता है ताकि वांछित गाऊसी वितरण के निकट आयाम उत्पन्न हो सकें।

  3. घातीय त्रुटि क्षय (चित्र 10c): शायद सबसे निर्णायक साक्ष्य बहुपद डिग्री $d$ के फलन के रूप में $L_2$-त्रुटि, $|| \psi_{\text{exp}} - \psi_{\text{QKAN}} ||_2$ है। प्लॉट घातीय क्षय को प्रकट करता है क्योंकि बहुपद डिग्री बढ़ती है। यह घातीय सुधार तब तक जारी रहता है जब तक कि त्रुटि मशीन परिशुद्धता, लगभग $10^{-14}-10^{-15}$, $d=20$ के लिए संतृप्त नहीं हो जाती। यह परिणाम सैद्धांतिक सीमाओं के सत्यापन और QKAN की क्षमता का एक शक्तिशाली सत्यापन है जो अपने सक्रियण फलनों की जटिलता को बढ़ाकर उच्च-निष्ठा सन्निकटन प्राप्त कर सकता है। यह क्रूरता से साबित करता है कि गैर-रैखिक परिवर्तनों के लिए QSVT के माध्यम से बहुपद सन्निकटन का उपयोग करने का मुख्य तंत्र इच्छानुसार काम करता है, जिससे नियंत्रणीय और उच्च-परिशुद्धता अवस्था तैयारी संभव होती है। अनुभवजन्य त्रुटि और सैद्धांतिक सीमाओं के बीच समझौता भविष्य के काम के लिए QKAN के दावों को और मजबूत करता है।

संक्षेप में, साक्ष्य साबित करते हैं कि QKAN, अपनी संरचनात्मक ब्लॉक-एन्कोडिंग संरचना और QSVT-सक्षम गैर-रैखिक सक्रियण के माध्यम से, जटिल बहुभिन्नरूपी क्वांटम अवस्थाओं को सटीक रूप से तैयार कर सकता है, जो क्वांटम मशीन लर्निंग और अवस्था तैयारी के लिए एक शक्तिशाली नया प्रतिमान प्रदर्शित करता है।

सीमाएँ और भविष्य की दिशाएँ

जबकि QKAN एक आशाजनक नई दिशा प्रस्तुत करता है, पत्र ईमानदारी से कई सीमाओं पर चर्चा करता है और भविष्य के शोध के लिए एक समृद्ध परिदृश्य खोलता है।

वर्तमान सीमाएँ:

  1. विरासत में मिली KAN सीमाएँ: QKAN अपने शास्त्रीय समकक्ष से कुछ चेतावनियों को विरासत में मिला है। कोल्मोगोरोव-आर्नोल्ड प्रतिनिधित्व प्रमेय (KART) दो-परत विघटन की गारंटी देता है, लेकिन शास्त्रीय KANs, और विस्तार से QKANs, जरूरी नहीं कि KART के सार्वभौमिक प्रतिनिधित्व गुण को विरासत में लें। इसका मतलब है कि इस बात की कोई गारंटी नहीं है कि एक गहरी QKAN किसी भी दिए गए बहुभिन्नरूपी फलन का प्रतिनिधित्व कर सकती है, खासकर यदि इसमें QKAN के डिजाइन के अनुकूल संरचनात्मक संरचना की कमी हो। KANs की पूरी क्षमता, यहां तक ​​कि शास्त्रीय रूप से भी, अभी भी अनुसंधान का एक सक्रिय क्षेत्र है, विशेष रूप से प्रतीकात्मक प्रतिगमन के लिए।

  2. उथली वास्तुकला बाधा: बहु-परत QKANs के लिए एक महत्वपूर्ण सीमा प्रत्येक परत की संख्या के साथ क्वेरी जटिलता का घातीय स्केलिंग है। पुनरावर्ती QSVT-आधारित निर्माण का मतलब है कि पिछली परत से प्रत्येक आउटपुट ब्लॉक-एन्कोडिंग अगली के लिए मौलिक निर्माण खंड बन जाती है, जिससे सर्किट गहराई में घातीय ओवरहेड होता है। यह मौलिक रूप से QKAN को "उथली, यद्यपि चौड़ी" वास्तुकला तक सीमित करता है, जिसका अर्थ है $L = O(1)$ परतें। जबकि उथली गहराई को घातीय रूप से चौड़ी परतों द्वारा क्षतिपूर्ति की जा सकती है जब कुशल ब्लॉक-एन्कोडिंग उपलब्ध हों, यह बाधा बहुत गहरी सीखने के कार्यों के लिए एक व्यावहारिक बाधा है।

  3. बहुपद सन्निकटन दायरा: क्वांटम कंप्यूटर बहुपद का प्रतिनिधित्व करने में उत्कृष्ट हैं, लेकिन सभी फलनों को कुशलतापूर्वक बहुपद द्वारा अनुमानित नहीं किया जा सकता है। इसका मतलब है कि QKAN के सक्रियण फलनों के लिए आधार फलनों का चुनाव महत्वपूर्ण है। जबकि QSVT बहुमुखी है, यह अभी भी बहुपद सन्निकटन पर निर्भर करता है, जो मनमाने फलनों को सीधे अनुमानित करने के लिए, उदाहरण के लिए, स्प्लिन्स की तुलना में कम शक्तिशाली हो सकता है। साइन फलन जैसे फलनों के सन्निकटन की परिशुद्धता, जो कुछ नियमितीकरण के लिए आवश्यक हो सकती है, जब पैरामीटर शून्य के करीब होते हैं तो सीमित हो सकती है।

  4. वास्तविक-मान प्रतिबंध: सरलता के लिए, वर्तमान कार्य इनपुट, आउटपुट और भार के लिए वास्तविक मानों तक अपने दायरे को सीमित करता है। जटिल संख्याओं में सामान्यीकरण संभव है, लेकिन यह जटिलता जोड़ता है और इसे भविष्य के काम के लिए छोड़ दिया गया है।

भविष्य की दिशाएँ और चर्चा विषय:

  1. उन्नत पैरामीट्रिकरण और प्रशिक्षण रणनीतियाँ:

    • भार पैरामीट्रिकरण से परे: पत्र केवल भार वैक्टर के अलावा QKAN के अन्य चरणों को पैरामीट्रिक करने का सुझाव देता है। उदाहरण के लिए, रैखिक संयोजन इकाई (LCU) चरण में, निश्चित हैडमार्ड ट्रांसफॉर्म के बजाय, राज्य तैयारी जोड़े के रूप में उपयोग किए जाने वाले एकात्मक को पैरामीट्रिक किया जा सकता है। यह विभिन्न डिग्री के चेबीशेव बहुपद के वैश्विक भार पर अधिक सूक्ष्म नियंत्रण की अनुमति देगा, जिससे अभिव्यक्ति क्षमता बढ़ सकती है।
    • अनुकूली आधार फलन चयन: वर्तमान में, चेबीशेव बहुपद QSVT के कारण एक प्राकृतिक विकल्प हैं। हालांकि, QSVT ढांचा किसी भी सीमित बहुपद को लागू करने की अनुमति देता है। एक आकर्षक दिशा स्वयं QSVT के कोणों को प्रशिक्षण योग्य पैरामीटर बनाना होगा। यह आधार फलनों के चयन को सीखने की प्रक्रिया का हिस्सा बनने देगा, बजाय एक निश्चित विकल्प पर निर्भर रहने के, संभावित रूप से विशिष्ट समस्याओं के लिए इष्टतम आधार सेट की खोज करेगा।
    • पुनरावृत्त मॉडल शोधन: एक प्रशिक्षण रणनीति में उच्च-डिग्री चेबीशेव बहुपद को योग में पुनरावर्ती रूप से जोड़ना और उनके वैश्विक भार को अनुकूलित करना शामिल हो सकता है। अनुकूलित भारों का निरीक्षण करके, कोई आवश्यक बहुपदों की इष्टतम संख्या निर्धारित कर सकता है, उदा., यदि एक नए जोड़े गए बहुपद का भार लुप्त हो जाता है। यह अधिक व्याख्यात्मक और कुशल मॉडल की ओर ले जा सकता है।
  2. प्रत्यक्ष क्वांटम इनपुट के लिए QKAN की खोज:

    • क्वांटम चरण वर्गीकरण: QKAN को प्रत्यक्ष क्वांटम इनपुट के लिए संभावित रूप से उपयुक्त के रूप में प्रस्तावित किया गया है, जैसे कि क्वांटम अवस्थाएँ जिनका विश्लेषण शास्त्रीय रूप से असाध्य है। उदाहरण के लिए, चरण वर्गीकरण कार्यों में, यदि एक अज्ञात क्वांटम चरण के अनुरूप एक अवस्था को कुशलतापूर्वक तैयार किया जा सकता है, तो QKAN को चरण को वर्गीकृत करने के लिए पर्यवेक्षित तरीके से प्रशिक्षित किया जा सकता है। इससे बहुभिन्नरूपी फलनों की गणना हो सकती है और भौतिक प्रणालियों में नए आदेश मापदंडों की खोज में सहायता मिल सकती है। यह एक सम्मोहक अनुप्रयोग है जहां QKAN की क्वांटम प्रकृति एक विशिष्ट लाभ प्रदान करती है।
  3. सामान्यीकरण और अभिव्यक्ति:

    • जटिल-मान QKANs: QKAN को जटिल संख्याओं को संभालने के लिए विस्तारित करने से इसके अनुप्रयोगों की सीमा क्वांटम समस्याओं और डेटा प्रकारों की एक विस्तृत श्रृंखला तक बढ़ जाएगी।
    • वैकल्पिक आधार फलन: जबकि चेबीशेव बहुपद कुशल हैं, अन्य आधार फलनों (जैसे, बी-स्प्लिन्स, वेवलेट्स, फूरियर विस्तार) की खोज जो QSVT द्वारा कुशलतापूर्वक अनुमानित की जा सकती हैं, विभिन्न प्रकार के फलनों के लिए QKAN की अभिव्यक्ति को बढ़ा सकती हैं। पत्र उल्लेख करता है कि बी-स्प्लिन्स को टुकड़े-वार अनुभागों को अलग करके और एलसीयू का उपयोग करके लागू किया जा सकता है, जो एक जटिल लेकिन संभावित रूप से फलदायी मार्ग है।
  4. उन्नत अवस्था तैयारी तकनीकें:

    • बहुभिन्नरूपी महत्व नमूनाकरण: पत्र नोट करता है कि महत्व नमूनाकरण के माध्यम से बहुभिन्नरूपी संस्करण के घातीय सुधार को प्राप्त करना, जैसा कि Rattew और Rebentrost [59] द्वारा प्रस्तावित किया गया है, बहुभिन्नरूपी सेटिंग में चुनौतियों के कारण एक खुला प्रश्न बना हुआ है। इसे दूर करने से अत्यधिक जटिल, गैर-समान बहुभिन्नरूपी अवस्थाओं को तैयार करने के लिए QKAN की उपयोगिता में काफी वृद्धि होगी।
  5. व्याख्यात्मकता और वैज्ञानिक खोज:

    • शास्त्रीय KANs का व्याख्यात्मकता लाभ, जहां व्यक्तिगत सक्रियण फलनों का निरीक्षण और छंटाई की जा सकती है, एक प्रमुख शक्ति है। इस व्याख्यात्मकता का QKAN में कैसे अनुवाद होता है, विशेष रूप से विरल संरचनात्मक संरचनाओं की पहचान करने या क्वांटम डेटा से नए भौतिक नियमों की खोज करने में, आगे के शोध का एक आकर्षक संभावना है। प्रशिक्षित भार वितरण से नमूना लेने की क्षमता छंटाई और मॉडल संपीड़न के लिए एक मार्ग प्रदान करती है।

ये चर्चा बिंदु इस बात पर प्रकाश डालते हैं कि QKAN केवल एक सैद्धांतिक निर्माण नहीं है, बल्कि विकास के लिए पर्याप्त क्षमता वाला एक मूलभूत ढांचा है, विशेष रूप से शास्त्रीय विधियों के लिए असाध्य समस्याओं के लिए क्वांटम कंप्यूटेशन की अनूठी क्षमताओं का लाभ उठाने में। इसकी पूरी क्षमता को साकार करने की यात्रा में इन सीमाओं को संबोधित करना और इन भविष्य की दिशाओं को रचनात्मक रूप से खोजना शामिल होगा।

FIG. 4. Example: 2D Gaussian state preparation via QKAN. Starting from a vectorized 2D grid of points {(xi, yi)} encoded as a diagonal block-encoding (left), the first QKAN layer applies Chebyshev polynomial T2 and sums over the two dimensions, computing 1 FIG. 10. Numerical illustration of Gaussian state preparation via QKAN. (a) Degree-3 polynomial P3(x) approxi- mating 1