EN KR JP CN RU IN
NeurIPS

हाइब्रिड बाउंड्री फिजिक्स-इन्फॉर्म्ड न्यूरल नेटवर्क्स द्वारा जटिल सीमाओं के साथ नेवियर-स्टोक्स समीकरणों का समाधान

Open PDF

पृष्ठभूमि और अकादमिक वंशक्रम

इस पत्र में संबोधित समस्या की सटीक उत्पत्ति को समझने के लिए, हमें द्रव यांत्रिकी (fluid mechanics) और आधुनिक कृत्रिम बुद्धिमत्ता (artificial intelligence) के प्रतिच्छेदन पर विचार करना होगा। दशकों से, वैज्ञानिक और इंजीनियर श्यान द्रवों (viscous fluids) के गतिशील व्यवहार का वर्णन करने के लिए नेवियर-स्टोक्स समीकरणों (Navier-Stokes equations - NSE) पर निर्भर रहे हैं—मूल रूप से, तरल पदार्थ और गैसें कैसे चलती हैं। पारंपरिक रूप से, इन अत्यधिक जटिल, अरैखिक समीकरणों को कम्प्यूटेशनल फ्लूइड डायनामिक्स (Computational Fluid Dynamics - CFD) का उपयोग करके हल किया जाता था। हालाँकि, CFD के लिए "मेश जनरेशन" नामक एक प्रक्रिया की आवश्यकता होती है, जहाँ भौतिक स्थान को छोटे आकृतियों के एक विशाल ग्रिड में विभाजित किया जाता है। जटिल, अनियमित आकृतियों के लिए इस मेश को बनाना अविश्वसनीय रूप से कठिन, समय लेने वाला है, और संख्यात्मक अस्थिरता (numerical instability) का कारण बन सकता है।

2019 में, एक महत्वपूर्ण सफलता मिली: फिजिक्स-इन्फॉर्म्ड न्यूरल नेटवर्क्स (Physics-Informed Neural Networks - PINNs) प्रस्तुत किए गए। PINNs बिना किसी मेश की आवश्यकता के इन समीकरणों को हल करने के लिए डीप लर्निंग का उपयोग करते हैं। वे भौतिकी के नियमों को सीधे न्यूरल नेटवर्क की सीखने की प्रक्रिया में एम्बेड करके ऐसा करते हैं। हालाँकि, जैसे ही शोधकर्ताओं ने वास्तविक दुनिया की द्रव समस्याओं पर PINNs लागू करना शुरू किया, एक नई, अत्यधिक विशिष्ट समस्या उत्पन्न हुई: जटिल सीमाओं (जैसे अनियमित बाधाओं के चारों ओर बहने वाला द्रव) से निपटना।

पिछली PINN विधियों की मौलिक सीमा—या "दर्द बिंदु"—वह है जिसे शोधकर्ता "लॉस कॉन्फ्लिक्ट प्रॉब्लम" (loss conflict problem) कहते हैं। एक पारंपरिक PINN में, AI से द्रव के भौतिक नियमों (PDE लॉस) और भौतिक सीमाओं के नियमों (बाउंड्री कंडीशन लॉस) को एक साथ सीखने के लिए कहा जाता है। चूंकि ये दोनों लक्ष्य एक ही गणितीय बाल्टी (लॉस फंक्शन) में डाले जाते हैं, नेटवर्क अक्सर उन्हें संतुलित करने के लिए संघर्ष करता है। जब ज्यामितीय सीमाएँ अत्यधिक जटिल हो जाती हैं, तो नेटवर्क भ्रमित हो जाता है। यह द्रव गतिकी को पूरी तरह से संतुष्ट कर सकता है लेकिन ठोस दीवारों का सम्मान करने में विफल हो सकता है, या इसके विपरीत। विश्लेषणात्मक गणित का उपयोग करके "हार्ड कंस्ट्रेंट्स" (hard constraints) को लागू करके इसे ठीक करने के पिछले प्रयास जटिल जंक्शनों के पास विकृत, अनियमित भविष्यवाणियों का कारण बने क्योंकि वे गणितीय फलन प्राकृतिक नहीं थे। लेखकों ने इन परस्पर विरोधी लक्ष्यों को अलग करने के लिए यह पत्र लिखा है, एक हाइब्रिड सिस्टम बनाया है जो सीमाओं और आंतरिक द्रव भौतिकी को अलग-अलग लेकिन सहयोगात्मक रूप से संभालता है।

यहां पेपर के कुछ अत्यधिक विशिष्ट डोमेन शब्द दिए गए हैं, जिन्हें एक पूर्ण नौसिखिए के लिए सहज ज्ञान युक्त उपमाओं में अनुवादित किया गया है:

  • नेवियर-स्टोक्स समीकरण (Navier-Stokes Equations - NSE):
    • उपमा: इन्हें पानी और हवा के अणुओं के लिए अंतिम, अटूट "यातायात नियम" के रूप में सोचें। जैसे यातायात नियम तय करते हैं कि कौन रास्ता देगा, आप कितनी तेजी से जा सकते हैं, और दुर्घटना के बिना चौराहे पर कैसे नेविगेट करना है, NSE ठीक उसी तरह तय करते हैं कि द्रव अणु भौतिकी के नियमों का उल्लंघन किए बिना कैसे प्रवाहित, घूम और दबाव और घर्षण के साथ परस्पर क्रिया कर सकते हैं।
  • फिजिक्स-इन्फॉर्म्ड न्यूरल नेटवर्क्स (Physics-Informed Neural Networks - PINN):
    • उपमा: एक छात्र को यथार्थवादी परिदृश्य चित्रित करना सिखाने की कल्पना करें। एक मानक न्यूरल नेटवर्क लाखों तस्वीरों को याद करता है और पिक्सेल पैटर्न की नकल करने की कोशिश करता है। एक PINN, हालांकि, एक छात्र है जिसे गुरुत्वाकर्षण और प्रकाश परिप्रेक्ष्य के वास्तविक नियमों को भी सिखाया गया है। क्योंकि वे अंतर्निहित नियमों को जानते हैं, वे कभी भी गलती से ऊपर की ओर बहने वाले झरने को चित्रित नहीं करेंगे, भले ही उन्होंने उस विशिष्ट झरने को पहले कभी न देखा हो।
  • लॉस कॉन्फ्लिक्ट प्रॉब्लम (Loss Conflict Problem):
    • उपमा: एक शेफ को काम पर रखने और उन्हें दो सख्त निर्देश देने की कल्पना करें: "व्यंजन को अविश्वसनीय रूप से मसालेदार बनाएं" और "सुनिश्चित करें कि यह बच्चों के लिए पूरी तरह से हल्का हो।" शेफ एक ही समय में दो पूरी तरह से विरोधाभासी मांगों के लिए अनुकूलन करने की कोशिश में लकवाग्रस्त हो जाता है, जिसके परिणामस्वरूप एक भयानक भोजन होता है। PINNs में, नेटवर्क एक ही समय में आंतरिक द्रव भौतिकी और जटिल सीमा नियमों को पूरी तरह से संतुष्ट करने की कोशिश में इसी तरह लकवाग्रस्त हो जाता है।
  • डिस्टेंस मेट्रिक नेटवर्क ($\mathcal{N_D}$) (Distance Metric Network):
    • उपमा: इसे एक आधुनिक कार पर पार्किंग प्रॉक्सिमिटी सेंसर के रूप में सोचें। जैसे ही आप पीछे हटते हैं, दीवार के करीब आने पर यह तेजी से बीप करता है। यह विशिष्ट उप-नेटवर्क एक स्थानिक सेंसर के रूप में कार्य करता है, जो मुख्य AI को ठीक-ठीक बताता है कि यह सीमा से कितनी दूर है, ताकि AI को ठीक-ठीक पता चल जाए कि "दीवार नियमों" बनाम "खुले पानी के नियमों" पर सख्त ध्यान देना कब शुरू करना है।

नीचे एक तालिका दी गई है जो प्रस्तावित HB-PINN मॉडल की यांत्रिकी को समझने के लिए आवश्यक प्रमुख गणितीय संकेतन, चर और पैरामीटर को व्यवस्थित करती है:

संकेतन प्रकार विवरण
$\mathbf{u}$ चर द्रव का वेग वेक्टर (क्षैतिज और ऊर्ध्वाधर घटक $u$ और $v$ सहित)।
$p$ चर स्थान और समय के किसी दिए गए बिंदु पर द्रव का दबाव।
$\rho$ पैरामीटर द्रव का घनत्व (असंपीड्य प्रवाह के लिए स्थिर रहता है)।
$\nu$ पैरामीटर गतिशील श्यानता गुणांक, जो द्रव के आंतरिक घर्षण या "मोटाई" का प्रतिनिधित्व करता है।
$q(\mathbf{x}, t)$ चर स्थानिक निर्देशांक $\mathbf{x}$ और समय $t$ पर भविष्यवाणी की जाने वाली किसी भी भौतिक मात्रा (जैसे, वेग या दबाव) के लिए एक सामान्य प्लेसहोल्डर।
$\mathcal{P}_q(\mathbf{x}, t)$ फलन पर्टिकुलर सॉल्यूशन नेटवर्क ($\mathcal{N_P}$) का आउटपुट, जिसे विशेष रूप से बाउंड्री कंडीशंस को संतुष्ट करने के लिए प्रशिक्षित किया जाता है।
$\mathcal{D}_q(\mathbf{x}, t)$ फलन डिस्टेंस मेट्रिक नेटवर्क ($\mathcal{N_D}$) का आउटपुट, जो किसी बिंदु से निकटतम सीमा तक की स्थानिक दूरी का प्रतिनिधित्व करता है।
$\mathcal{H}_q(\mathbf{x}, t)$ फलन प्राइमरी नेटवर्क ($\mathcal{N_H}$) का आउटपुट, जो विशुद्ध रूप से आंतरिक द्रव गतिकी (शासी PDE) को हल करने पर केंद्रित है।
$\mathcal{L}$ पैरामीटर लॉस फंक्शन, जो उस त्रुटि का प्रतिनिधित्व करता है जिसे नेटवर्क कम करने की कोशिश कर रहा है। इसे $\mathcal{L}_{PDE}$ (समीकरण त्रुटि) और $\mathcal{L}_{BC}$ (सीमा त्रुटि) जैसे भागों में विभाजित किया गया है।
$\lambda_i$ पैरामीटर वेटिंग गुणांक जिनका उपयोग नेटवर्क को यह बताने के लिए किया जाता है कि प्रशिक्षण के दौरान लॉस फंक्शन के किस हिस्से पर अधिक ध्यान केंद्रित करना अधिक महत्वपूर्ण है।
$\alpha$ पैरामीटर एक धनात्मक मान जो दूरी फलन की वृद्धि दर (तीव्रता) को नियंत्रित करता है, यह निर्धारित करता है कि नेटवर्क कितनी तेजी से सीमा नियमों से आंतरिक नियमों में परिवर्तित होता है।

समस्या परिभाषा और बाधाएँ

यह कल्पना करें कि किसी दांतेदार चट्टान के चारों ओर या पाइपों की एक जटिल प्रणाली से पानी कैसे बहता है, इसकी सटीक भविष्यवाणी करने का प्रयास किया जा रहा है। परंपरागत रूप से, इंजीनियर कम्प्यूटेशनल फ्लूइड डायनेमिक्स (CFD) का उपयोग करते हैं, जिसके लिए पूरे द्रव क्षेत्र पर एक सूक्ष्म, पूर्ण ग्रिड बनाने की आवश्यकता होती है—एक प्रक्रिया जिसे मेश जनरेशन कहा जाता है, जो कुख्यात रूप से थकाऊ और संख्यात्मक अस्थिरता के लिए प्रवण है।

फिजिक्स-इन्फॉर्म्ड न्यूरल नेटवर्क्स (PINNs) ने एक शानदार शॉर्टकट का वादा किया: ग्रिड को पूरी तरह से छोड़ दें और बस एक न्यूरल नेटवर्क को भौतिकी के नियमों को सिखाएं। हालांकि, वास्तविक दुनिया के, जटिल आकृतियों पर लागू होने पर, ये नेटवर्क एक विशाल गणितीय दीवार से टकराते हैं। आइए विस्तार से देखें कि ऐसा क्यों होता है और यह पेपर किस विशिष्ट समस्या को हल करने का प्रयास करता है।

प्रारंभिक बिंदु और लक्ष्य अवस्था

इनपुट (वर्तमान अवस्था):
हम स्थानिक-कालिक निर्देशांकों $(x, t)$ के एक सेट और द्रव गतिकी के शासी नियमों, जिन्हें असंपीड्य नेवियर-स्टोक्स समीकरण (NSE) के रूप में जाना जाता है, से शुरू करते हैं:
$$ \nabla \cdot \mathbf{u} = 0 $$
$$ \frac{\partial \mathbf{u}}{\partial t} + (\mathbf{u} \cdot \nabla)\mathbf{u} + \frac{1}{\rho}\nabla p - \nu \nabla^2 \mathbf{u} = 0 $$
इन समीकरणों के साथ, हमारे पास अत्यधिक जटिल सीमा शर्तें हैं—जैसे खंडित इनलेट या अनियमित अवरोधक संरचनाएं जहां द्रव वेग बिल्कुल शून्य होना चाहिए (नो-स्लिप कंडीशन)।

आउटपुट (लक्ष्य अवस्था):
वांछित अंतिम बिंदु एक प्रशिक्षित न्यूरल नेटवर्क है जो किसी भी दिए गए बिंदु पर वेग वेक्टर $\mathbf{u}$ ( $u$ और $v$ से बना) और द्रव दबाव $p$ को तुरंत और सटीक रूप से आउटपुट कर सकता है।

गणितीय अंतर:
लुप्त कड़ी एक विश्वसनीय गणितीय पुल है जो एक सतत न्यूरल नेटवर्क को सीमाओं पर तेज, अनियमित नियमों का सख्ती से पालन करने के लिए मजबूर करती है, बिना द्रव के अंदर होने वाली चिकनी, सतत भौतिकी की गणना करने की इसकी क्षमता को नष्ट किए।

दर्दनाक दुविधा

पिछले शोधकर्ताओं को "लॉस कॉन्फ्लिक्ट प्रॉब्लम" के रूप में जानी जाने वाली एक क्रूर ट्रेड-ऑफ में फंसाया गया है। इसे हल करने का प्रयास करते समय, एक पहलू में सुधार मौलिक रूप से दूसरे को तोड़ देता है:

  1. सॉफ्ट कंस्ट्रेंट जाल: पारंपरिक PINNs में, आप नेटवर्क को एक एकल, विशाल लॉस फ़ंक्शन को कम करने के लिए कहते हैं जिसमें भौतिकी त्रुटियां (PDE लॉस) और सीमा त्रुटियां दोनों शामिल हैं। लेकिन नेटवर्क अभिभूत हो जाता है। यह दोनों को एक साथ कम करने का प्रयास करता है, लेकिन जटिल सीमाएं जंगली गणितीय ग्रेडिएंट उत्पन्न करती हैं जो प्रशिक्षण के दौरान भौतिकी ग्रेडिएंट के खिलाफ सक्रिय रूप से लड़ती हैं। नेटवर्क अंततः समझौता करता है, जिसके परिणामस्वरूप गलत सीमाएं होती हैं जो पूरे द्रव सिमुलेशन को प्रदूषित करती हैं।
  2. हार्ड कंस्ट्रेंट जाल: इसे ठीक करने के लिए, वैज्ञानिकों ने "हार्ड-कंस्ट्रेंड" PINNs (जैसे hPINN) का प्रयास किया। उन्होंने एक विश्लेषणात्मक दूरी फ़ंक्शन का उपयोग करके गणितीय रूप से नेटवर्क के आउटपुट को सीमाओं पर बिल्कुल शून्य होने के लिए मजबूर किया। यहाँ दर्दनाक दुविधा है: जटिल ज्यामिति के लिए, ये सटीक गणितीय सूत्र अत्यधिक अप्राकृतिक हैं। नेटवर्क को इन कठोर गणितीय बाधाओं से गुजरने के लिए मजबूर करने से आंतरिक द्रव भविष्यवाणियां विकृत, अनियमित और असंतत हो जाती हैं। आप सीमा को पूरी तरह से ठीक करते हैं, लेकिन आप अंदर द्रव गतिकी को पूरी तरह से तोड़ देते हैं।

कठोर दीवारें और बाधाएं

इस समस्या को हल करना इतना कठिन क्या बनाता है? लेखकों को कई कठोर, यथार्थवादी दीवारों का सामना करना पड़ा:

  • ज्यामितीय अव्यवहार्यता: हार्ड कंस्ट्रेंट को काम करने के लिए, आपको एक दूरी फ़ंक्शन, $D_q(x, t)$ की आवश्यकता होती है, जो किसी भी बिंदु से सीमा तक की सटीक दूरी की गणना करता है। एक साधारण सपाट दीवार के लिए, यह एक बुनियादी बीजगणित समीकरण है। जटिल, खंडित, या अनियमित सीमाओं के लिए, एक सटीक विश्लेषणात्मक अभिव्यक्ति प्राप्त करना गणितीय रूप से असंभव है।
  • चरम ग्रेडिएंट पैथोलॉजी: एक मानक नेटवर्क को सीमाओं पर ध्यान देने के लिए मजबूर करने के लिए, शोधकर्ताओं को कृत्रिम रूप से सीमा लॉस भार को बढ़ाना पड़ता है (उदाहरण के लिए, सीमा भार $\lambda_2 = 1000$ निर्धारित करना जबकि भौतिकी भार $\lambda_1 = 1$ है)। यह एक भारी असंतुलन पैदा करता है। नेटवर्क किनारों को याद रखने पर अत्यधिक केंद्रित हो जाता है और द्रव के वास्तविक शासी समीकरणों को पूरी तरह से अनदेखा कर देता है।
  • अत्यधिक अरैखिक भौतिकी: नेवियर-स्टोक्स समीकरण अरैखिक संवहन त्वरण पद के कारण कुख्यात रूप से क्षमाशील नहीं हैं, जिसे गणितीय रूप से $(\mathbf{u} \cdot \nabla)\mathbf{u}$ के रूप में दर्शाया गया है। इस अरैखिकता के कारण, एक जटिल सीमा पर एक सूक्ष्म त्रुटि भी तेजी से बढ़ सकती है, जिससे पूरे प्रवाह क्षेत्र की भविष्यवाणी अस्थिर हो जाती है।
  • नेटवर्क क्षमता सीमाएं: एक एकल न्यूरल आर्किटेक्चर से एक जटिल सीमा पर आवश्यक तेज, उच्च-आवृत्ति संक्रमण और आंतरिक द्रव की चिकनी, निम्न-आवृत्ति भौतिकी को एक साथ सीखने के लिए कहना मानक अनुकूलन क्षमताओं से अधिक है। नेटवर्क के भार एक साथ दोनों व्यवहारों का आसानी से प्रतिनिधित्व नहीं कर सकते हैं।
Figure 40. Comparison of temperature results at t = 0.25, 0.5, 0.75, and 1.0 for the heat conduction problem: (a) sPINN predictions; (b) HB-PINN predictions; (c) ground truth (GT)

यह दृष्टिकोण क्यों

लेखकों ने हाइब्रिड बाउंड्री फिजिक्स-इन्फॉर्म्ड न्यूरल नेटवर्क (HB-PINN) का निर्माण क्यों किया, इसे वास्तव में समझने के लिए, हमें पहले उनके दृष्टिकोण से सोचना होगा और उस समस्या की मौलिक प्रकृति को देखना होगा जिसे वे हल करने का प्रयास कर रहे थे: नेवियर-स्टोक्स समीकरणों (NSE) का उपयोग करके द्रव गतिकी का मॉडलिंग।

यदि आप सोच रहे हैं कि लेखकों ने इस समस्या के लिए एक लोकप्रिय, ट्रेंडी मॉडल जैसे GAN, ट्रांसफार्मर, या डिफ्यूजन मॉडल का उपयोग क्यों नहीं किया, तो इसका उत्तर भौतिकी की सख्त बाधाओं में निहित है। हम पानी की प्रशंसनीय दिखने वाली तस्वीरें उत्पन्न करने या अनुक्रम में अगले शब्द की भविष्यवाणी करने का प्रयास नहीं कर रहे हैं। हमें अत्यधिक अरैखिक आंशिक अवकल समीकरणों (PDEs) को नियतात्मक रूप से हल करने की आवश्यकता है। जनरेटिव मॉडल शोर को डेटा वितरण पर मैप करते हैं, जो तब व्यावहारिक रूप से बेकार होता है जब आपको भौतिक संरक्षण कानूनों (जैसे द्रव्यमान और संवेग) का सख्त, गणितीय पालन करने की आवश्यकता होती है।

चूंकि पारंपरिक डीप लर्निंग यहाँ विफल हो जाती है, वैज्ञानिक समुदाय फिजिक्स-इन्फॉर्म्ड न्यूरल नेटवर्क्स (PINNs) पर निर्भर करता है। PINNs वास्तविक भौतिकी समीकरणों को न्यूरल नेटवर्क के लॉस फ़ंक्शन में एम्बेड करते हैं। हालाँकि, लेखकों को एक बड़ी बाधा का सामना करना पड़ा - ठीक उसी क्षण जब उन्हें एहसास हुआ कि वर्तमान "SOTA" PINNs वास्तविक दुनिया के अनुप्रयोगों के लिए मौलिक रूप से टूटे हुए थे।

यह समस्या तब उत्पन्न होती है जब द्रव जटिल बाधाओं (जैसे अवरुद्ध कैविटी या खंडित इनलेट) के चारों ओर बहता है। पारंपरिक PINNs (जिन्हें अक्सर सॉफ्ट-कन्स्ट्रेन्ड PINNs, या sPINNs कहा जाता है) एक ही, विशाल लॉस फ़ंक्शन में शासन करने वाले भौतिकी समीकरणों और सीमा शर्तों को एक साथ सीखने का प्रयास करते हैं। यह एक गंभीर "लॉस कॉन्फ्लिक्ट" बनाता है। सीमा शर्तों से ग्रेडिएंट्स और आंतरिक भौतिकी से ग्रेडिएंट्स बैकप्रॉपैगेशन के दौरान शाब्दिक रूप से एक-दूसरे से लड़ते हैं। नेटवर्क भ्रमित हो जाता है, और सटीकता गिर जाती है।

इसे ठीक करने के पिछले प्रयासों में हार्ड-कन्स्ट्रेन्ड PINNs (hPINNs) शामिल थे, जो नेटवर्क को सटीक, विश्लेषणात्मक गणितीय सूत्रों का उपयोग करके सीमाओं का सम्मान करने के लिए मजबूर करते हैं। लेकिन जैसा कि लेखकों ने स्पष्ट रूप से पेपर के परिशिष्ट डी में प्रदर्शित किया है, जब आपके पास जटिल, अनियमित ज्यामिति होती है, तो ये विश्लेषणात्मक कार्य टूट जाते हैं। वे अप्राकृतिक हो जाते हैं और द्रव डोमेन के अंदर अत्यधिक विकृत, असंतत और अनियमित आउटपुट का कारण बनते हैं।

इस दुविधा का सामना करते हुए - सॉफ्ट बाधाएं ग्रेडिएंट संघर्ष का कारण बनती हैं, और हार्ड बाधाएं जटिल आकृतियों पर गणितीय रूप से टूट जाती हैं - लेखकों ने महसूस किया कि एक वियोजित, मिश्रित वास्तुकला ही एकमात्र व्यवहार्य समाधान था।

उन्होंने समस्या को तीन अलग-अलग सबनेटवर्क का उपयोग करके विभाजित करने और जीतने के लिए HB-PINN डिज़ाइन किया:
1. $\mathcal{N_P}$ (पर्टिकुलर सॉल्यूशन नेटवर्क): एक नेटवर्क जिसे केवल सीमा शर्तों को संतुष्ट करने के लिए प्रशिक्षित किया गया है।
2. $\mathcal{N_D}$ (डिस्टेंस मीट्रिक नेटवर्क): एक नेटवर्क जो किसी भी बिंदु से सीमाओं तक स्थानिक दूरी सीखता है।
3. $\mathcal{N_H}$ (प्राइमरी नेटवर्क): मुख्य नेटवर्क जो पूरी तरह से आंतरिक भाग में शासन करने वाले PDE को हल करने के लिए समर्पित है।

उन्होंने इन नेटवर्कों को किसी भी भौतिक मात्रा $q$ (जैसे वेग या दबाव) के लिए एक शानदार मिश्रित सूत्रीकरण का उपयोग करके एक साथ जोड़ा:

$$N_q(\mathbf{x}, t) = \mathcal{N}_{\mathcal{P}_q}(\mathbf{x}, t) + \mathcal{N}_{\mathcal{D}_q}(\mathbf{x}, t) \cdot \mathcal{N}_{\mathcal{H}_u}(\mathbf{x}, t)$$

यहाँ बताया गया है कि यह विशिष्ट गणितीय मॉडल पिछले स्वर्ण मानक की तुलना में गुणात्मक रूप से बेहतर क्यों है। $\mathcal{N_P}$ और $\mathcal{N_D}$ को प्री-ट्रेन करके और फिर उनके वज़न को फ्रीज करके, दूरी फ़ंक्शन $\mathcal{N_D}$ एक स्थानिक गेटकीपर के रूप में कार्य करता है। सटीक सीमा पर, $\mathcal{N_D}$ शून्य के बराबर होता है, जिसका अर्थ है कि मुख्य नेटवर्क $\mathcal{N_H}$ पूरी तरह से शून्य हो जाता है, और आउटपुट 100% सीमा नेटवर्क $\mathcal{N_P}$ पर निर्भर करता है। जैसे ही आप सीमा से द्रव में दूर जाते हैं, $\mathcal{N_D}$ सुचारू रूप से 1 में परिवर्तित हो जाता है, जिससे मुख्य नेटवर्क $\mathcal{N_H}$ को नियंत्रण लेने और भौतिकी को हल करने की अनुमति मिलती है।

यह सुनिश्चित करने के लिए कि यह संक्रमण पूरी तरह से सुचारू है और नेटवर्क को अस्थिर नहीं करता है, उन्होंने दूरी मीट्रिक को परिष्कृत करने के लिए एक पावर-लॉ फ़ंक्शन पेश किया:

$$f(\hat{\mathcal{D}}_q) = 1 - (1 - \hat{\mathcal{D}}_q / \max(\hat{\mathcal{D}}_q))^\alpha$$

पैरामीटर $\alpha$ को ट्यून करके, वे ठीक से नियंत्रित कर सकते हैं कि नेटवर्क सीमा से आंतरिक भाग में कितनी तेज़ी से संक्रमण करता है।

जबकि पेपर स्पष्ट रूप से $O(N^2)$ से $O(N)$ तक मेमोरी कॉम्प्लेक्सिटी में कमी का दावा नहीं करता है (ईमानदारी से कहूं तो, यहाँ कम्प्यूटेशनल बाधा अनुकूलन है, न कि केवल मेमोरी स्केलिंग), यह एक संरचनात्मक लाभ प्रदर्शित करता है जो इसे अत्यधिक श्रेष्ठ बनाता है: ग्रेडिएंट पैथोलॉजी का पूर्ण उन्मूलन। चूंकि प्राथमिक नेटवर्क $\mathcal{N_H}$ को सीमाओं को संतुष्ट करने की चिंता करने की आवश्यकता नहीं है, यह विशेष रूप से PDE अवशिष्ट को कम करने पर ध्यान केंद्रित कर सकता है। इस संरचनात्मक वियोग के परिणामस्वरूप XPINN, SA-PINN, और PirateNet जैसे SOTA मॉडल की तुलना में माध्य वर्ग त्रुटि (MSE) में एक परिमाण-क्रम की कमी आती है।

यह दृष्टिकोण समस्या की कठोर आवश्यकताओं और समाधान के अद्वितीय गुणों के बीच एक आदर्श "विवाह" का प्रतिनिधित्व करता है। समस्या ने असंभव विश्लेषणात्मक गणित पर भरोसा किए बिना सख्त सीमा प्रवर्तन की मांग की; समाधान ने इसे एक न्यूरल नेटवर्क ($\mathcal{N_D}$) का उपयोग करके ज्यामिति का अनुमान लगाकर प्रदान किया, प्रभावी रूप से एक ज्यामितीय रूप से असंभव हार्ड बाधा को एक अत्यधिक लचीली, सीखने योग्य बाधा में बदल दिया।

Figure 3. Velocity distributions for the flow around a cylinder from different methods

गणितीय एवं तार्किक तंत्र

इस पत्र में प्रस्तुत सफलता को समझने के लिए, हमें पहले तरल पदार्थों के अनुकरण की मौलिक समस्या को देखना होगा। दशकों से, इंजीनियर यह समझने के लिए कम्प्यूटेशनल फ्लूइड डायनामिक्स (CFD) पर निर्भर रहे हैं कि हवा एक पंख के ऊपर कैसे बहती है या पानी एक पाइप से कैसे गुजरता है। इन पारंपरिक तरीकों के लिए "मेशिंग" की आवश्यकता होती है - अंतरिक्ष को लाखों छोटे ज्यामितीय ग्रिड में काटना। मेशिंग कम्प्यूटेशनल रूप से महंगा, थकाऊ और तब अस्थिरता का शिकार होता है जब सीमाएं (जैसे किसी बाधा का आकार) अत्यधिक जटिल हो जाती हैं।

हाल ही में, फिजिक्स-इन्फॉर्म्ड न्यूरल नेटवर्क्स (PINNs) एक क्रांतिकारी विकल्प के रूप में उभरे हैं। मेश का उपयोग करने के बजाय, PINNs समाधान का अनुमान लगाने के लिए डीप लर्निंग का उपयोग करते हैं, यदि उनका अनुमान भौतिकी के नियमों (विशेष रूप से, Navier-Stokes समीकरणों) का उल्लंघन करता है तो न्यूरल नेटवर्क को दंडित करते हैं। हालांकि, मानक PINNs एक बड़ी बाधा का सामना करते हैं: "लॉस कॉन्फ्लिक्ट"। जब कोई द्रव एक जटिल सीमा से टकराता है, तो न्यूरल नेटवर्क भ्रमित हो जाता है। यह एक साथ जटिल सीमा शर्तों (दीवारों) और द्रव गतिकी (आंतरिक) को संतुष्ट करने का प्रयास करता है। इन दो उद्देश्यों के लिए लड़ने वाले गणितीय ग्रेडिएंट एक-दूसरे को रद्द कर देते हैं, जिससे अत्यधिक गलत अनुकरण होते हैं।

इस पत्र के लेखकों ने हाइब्रिड बाउंड्री PINN (HB-PINN) बनाकर इस समस्या का समाधान किया। एक नेटवर्क को सब कुछ सीखने के लिए मजबूर करने के बजाय, उन्होंने एक मिश्रित आर्किटेक्चर बनाया जो सीमा बाधाओं को आंतरिक भौतिकी से सख्ती से अलग करता है।

यहां पूर्ण समीकरण है जो इस पूरे ढांचे को शक्ति प्रदान करता है:

$$ \mathcal{N}_q(\mathbf{x}, t) = \mathcal{N}_{\mathcal{P}_q}(\mathbf{x}, t) + \mathcal{N}_{\mathcal{D}_q}(\mathbf{x}, t) \cdot \mathcal{N}_{\mathcal{H}_q}(\mathbf{x}, t) $$

आइए इस समीकरण को टुकड़े-टुकड़े करके तोड़ें ताकि यह समझा जा सके कि यह डेटा में कैसे हेरफेर करता है।

  • $\mathcal{N}_q(\mathbf{x}, t)$:
    • गणितीय परिभाषा: किसी दिए गए स्थानिक निर्देशांक $\mathbf{x}$ और समय $t$ पर एक विशिष्ट भौतिक मात्रा $q$ (जो वेग $u$, वेग $v$, या दबाव $p$ हो सकती है) के लिए अंतिम मिश्रित आउटपुट फ़ंक्शन।
    • भौतिक/तार्किक भूमिका: यह तैयार उत्पाद है। यह अंतरिक्ष और समय में किसी भी दिए गए बिंदु पर द्रव की सटीक स्थिति का प्रतिनिधित्व करता है।
  • $\mathcal{N}_{\mathcal{P}_q}(\mathbf{x}, t)$:
    • गणितीय परिभाषा: विशेष समाधान नेटवर्क (Particular Solution Network) का आउटपुट।
    • भौतिक/तार्किक भूमिका: यह "सीमा प्रवर्तक" के रूप में कार्य करता है। यह एक पूर्व-प्रशिक्षित न्यूरल नेटवर्क है जिसका एकमात्र कार्य सीमा शर्तों को पूरी तरह से याद रखना और संतुष्ट करना है (जैसे, एक ठोस दीवार पर वेग का ठीक शून्य होना सुनिश्चित करना)।
  • $+$ (जोड़ ऑपरेटर):
    • गुणा के बजाय जोड़ क्यों? जोड़ सुपरपोज़िशन के सिद्धांत की अनुमति देता है। नेटवर्क $\mathcal{N}_{\mathcal{P}_q}$ को एक मूलभूत आधार रेखा के रूप में उपयोग करता है। यदि लेखकों ने यहां गुणा का उपयोग किया होता, तो सीमा नेटवर्क से शून्य मान एक ब्लैक होल की तरह कार्य करता, जो आंतरिक भाग में गणना की गई किसी भी भौतिकी को पूरी तरह से नष्ट कर देता। जोड़ मॉडल को यह कहने की अनुमति देता है: "इस सीमा आधार रेखा से शुरू करें, और इसके ऊपर आंतरिक द्रव गतिकी जोड़ें।"
  • $\mathcal{N}_{\mathcal{D}_q}(\mathbf{x}, t)$:
    • गणितीय परिभाषा: दूरी मीट्रिक नेटवर्क (Distance Metric Network) का आउटपुट, जिसे एक पावर-लॉ फ़ंक्शन द्वारा आकार दिया गया है।
    • भौतिक/तार्किक भूमिका: यह एक स्थानिक मास्क या एक "वॉल्यूम नॉब" है। यह सीमाओं पर ठीक $0$ का मान आउटपुट करता है और जैसे-जैसे आप द्रव के आंतरिक भाग में बढ़ते हैं, $1$ तक तेजी से बढ़ता है।
  • $\cdot$ (गुणा ऑपरेटर):
    • जोड़ के बजाय गुणा क्यों? यह एक स्थानिक गुणक या एक गेटिंग तंत्र के रूप में कार्य करता है। दूरी मीट्रिक को प्राथमिक भौतिकी नेटवर्क से गुणा करके, समीकरण दीवारों पर भौतिकी नेटवर्क को $0$ से गुणा करने के लिए मजबूर करता है। यह दीवारों पर आंतरिक भौतिकी इंजन को पूरी तरह से म्यूट कर देता है, यह सुनिश्चित करता है कि सीमा प्रवर्तक ($\mathcal{N}_{\mathcal{P}_q}$) किनारों पर $100\%$ पूर्ण अधिकार रखता है।
  • $\mathcal{N}_{\mathcal{H}_q}(\mathbf{x}, t)$:
    • गणितीय परिभाषा: प्राथमिक नेटवर्क (Primary Network) का आउटपुट।
    • भौतिक/तार्किक भूमिका: यह भारी-भरकम भौतिकी इंजन है। यह डोमेन के आंतरिक भाग में Navier-Stokes समीकरणों को हल करने के लिए समर्पित एक बड़ा न्यूरल नेटवर्क है।

चरण-दर-चरण प्रवाह

एकल अमूर्त डेटा बिंदु की कल्पना करें - अंतरिक्ष और समय में एक निर्देशांक, $(\mathbf{x}, t)$ - इस गणितीय असेंबली लाइन में प्रवेश कर रहा है।

सबसे पहले, निर्देशांक को डुप्लिकेट किया जाता है और एक साथ तीन अलग-अलग न्यूरल नेटवर्कों में फीड किया जाता है। पहले पथ में, विशेष समाधान नेटवर्क बिंदु का मूल्यांकन करता है और एक आधार भौतिक मान आउटपुट करता है जो निकटतम दीवार का पूरी तरह से सम्मान करता है। दूसरे पथ में, दूरी मीट्रिक नेटवर्क मापता है कि यह बिंदु सीमा से कितनी दूर है, एक प्रतिशत आउटपुट करता है (जैसे, यदि यह दीवार पर है तो $0.0$, यदि यह द्रव के अंदर गहरा है तो $0.99$)। तीसरे पथ में, प्राथमिक नेटवर्क उस बिंदु के लिए जटिल द्रव गतिकी की गणना करता है।

अगला, असेंबली लाइन विलीन हो जाती है। प्राथमिक नेटवर्क से कच्ची भौतिकी गणना को दूरी प्रतिशत से गुणा किया जाता है। यदि बिंदु दीवार पर है, तो भौतिकी गणना को शून्य से गुणा किया जाता है और छोड़ दिया जाता है। यदि यह खुले द्रव में है, तो इसे लगभग पूरी तरह से बरकरार रखा जाता है। अंत में, इस स्केल्ड भौतिकी गणना को आधार सीमा मान में जोड़ा जाता है। परिणाम एक सहज, भौतिक रूप से सटीक भविष्यवाणी है जो नेटवर्क के एक-दूसरे से लड़ने के बिना जटिल ज्यामिति का पूरी तरह से सम्मान करती है।

अनुकूलन गतिशीलता

यह समझने के लिए कि यह तंत्र वास्तव में कैसे सीखता है, हमें देखना होगा कि लॉस लैंडस्केप को कैसे आकार दिया जाता है। एक मानक PINN में, लॉस फ़ंक्शन सीमा त्रुटियों और भौतिकी त्रुटियों का एक गड़बड़ संयोजन होता है। ग्रेडिएंट (नेटवर्क को सही उत्तर की ओर इंगित करने वाले गणितीय तीर) लगातार टकराते हैं।

HB-PINN एक चरणबद्ध अनुकूलन गतिशीलता के माध्यम से इसे हल करता है। सबसे पहले, सीमा नेटवर्क ($\mathcal{N}_{\mathcal{P}}$) और दूरी नेटवर्क ($\mathcal{N}_{\mathcal{D}}$) को पूर्व-प्रशिक्षित किया जाता है और फिर फ्रीज कर दिया जाता है। उनके वजन को जगह पर लॉक कर दिया जाता है।

चूंकि सीमाओं को पहले से ही पूरी तरह से संभाला और लॉक किया गया है, प्राथमिक नेटवर्क ($\mathcal{N}_{\mathcal{H}}$) को केवल भौतिकी लॉस का उपयोग करके अनुकूलित किया जाता है:

$$ \mathcal{L}_{\mathcal{H}} = \frac{1}{N_{\text{PDE}}} \sum_{i=1}^{N_{\text{PDE}}} \left( \| \nabla \cdot \mathbf{\hat{u}} \|^2 + \left\| \frac{\partial \mathbf{\hat{u}}}{\partial t} + (\mathbf{\hat{u}} \cdot \nabla)\mathbf{\hat{u}} + \frac{1}{\rho}\nabla \hat{p} - \nu\nabla^2\mathbf{\hat{u}} \right\|^2 \right) $$

यहां, लेखक एक सतत स्थानिक अभिन्न के बजाय $N_{\text{PDE}}$ असतत कोलेशन बिंदुओं पर एक योग ($\sum$) का उपयोग करते हैं। क्यों? क्योंकि न्यूरल नेटवर्क डेटा के असतत बैचों के माध्यम से सीखते हैं। हम कंप्यूटर की मेमोरी में अनंत संख्या में बिंदुओं पर एक सच्चा सतत अभिन्न की गणना नहीं कर सकते हैं, इसलिए हम अभिन्न का अनुमान लगाने के लिए हजारों असतत बिंदुओं का नमूना लेते हैं और उनकी त्रुटियों को जोड़ते हैं।

नॉर्म्स के अंदर के पद ($\| ... \|^2$) असंपीड्य Navier-Stokes समीकरणों (द्रव्यमान संरक्षण और संवेग संरक्षण) के सटीक अवशेष हैं। चूंकि सीमा बाधाओं को जमे हुए उप-नेटवर्क द्वारा गणितीय रूप से गारंटीकृत किया जाता है, $\mathcal{L}_{\mathcal{H}}$ के लिए लॉस लैंडस्केप नाटकीय रूप से चिकना हो जाता है। ग्रेडिएंट अब पैथोलॉजिकल संघर्षों से ग्रस्त नहीं हैं। वे भौतिकी अवशेष को कम करने की ओर सख्ती से नीचे की ओर इंगित करते हैं। नेटवर्क तेजी से अभिसरण करता है, ज्यामितीय जटिलताओं के कारण स्थानीय न्यूनतम से बचता है, और केवल भौतिकी इंजन को अपनी सीखने की क्षमता का $100\%$ द्रव गतिकी पर केंद्रित करने की अनुमति देकर अत्याधुनिक सटीकता प्राप्त करता है।

Figure 2. The trained boundary prediction for the Case 1. NPu represents the result of the particular solution network for u, while NDu, NDv, and NDp respectively represent the results of the distance metric network for u, v, and p Figure 5. The trained boundary prediction for Case 2. NPu represents the result of the particular solution network for u, while NDu, NDv, and NDp respectively represent the results of the distance metric network for u, v, and p

परिणाम, सीमाएँ और निष्कर्ष

पृष्ठभूमि: नदी के नियम और उन्हें सीखने वाली AI

इस शोध पत्र को समझने के लिए, हमें पहले दो अवधारणाओं को समझना होगा: नेवियर-स्टोक्स समीकरण (NSE) और भौतिकी-सूचित तंत्रिका नेटवर्क (PINNs)।

कल्पना कीजिए कि आप नदी में एक चट्टान के चारों ओर पानी के प्रवाह की सटीक भविष्यवाणी करने का प्रयास कर रहे हैं। भौतिकी में, हम नेवियर-स्टोक्स समीकरणों का उपयोग करते हैं, जो अनिवार्य रूप से तरल पदार्थ और गैसों के लिए गति के मौलिक नियम हैं। वे गणना करते हैं कि दबाव, वेग और श्यानता कैसे परस्पर क्रिया करते हैं। हालाँकि, इन समीकरणों को हल करना कुख्यात रूप से कठिन है। परंपरागत रूप से, इंजीनियर कम्प्यूटेशनल फ्लूइड डायनामिक्स (CFD) का उपयोग करते हैं, जिसमें नदी को लाखों छोटे डिजिटल ग्रिड (मेश जनरेशन) में काटना और प्रत्येक ग्रिड के लिए गणित की गणना करना शामिल है। यह अत्यधिक सटीक है लेकिन अविश्वसनीय रूप से धीमा और कम्प्यूटेशनल रूप से महंगा है।

यहाँ PINNs का प्रवेश होता है। स्थान को ग्रिड में काटने के बजाय, हम एक कृत्रिम बुद्धिमत्ता (एक तंत्रिका नेटवर्क) से पानी के प्रवाह का अनुमान लगाने के लिए कहते हैं। लेकिन हम इसे केवल अंधाधुंध अनुमान लगाने नहीं देते; हम नेवियर-स्टोक्स समीकरणों को सीधे AI के "लॉस फ़ंक्शन" (इसके दंड प्रणाली) में एम्बेड करते हैं। यदि AI भौतिकी के नियमों का उल्लंघन करने वाला प्रवाह का अनुमान लगाता है, तो उसे दंडित किया जाता है। समय के साथ, यह एक जटिल ग्रिड की आवश्यकता के बिना भौतिक रूप से सटीक द्रव गतिकी की भविष्यवाणी करना सीखता है।

हालाँकि, इसमें एक समस्या है: सीमा शर्तें (BCs)। नदी के नियम सीमाओं पर बदलते हैं। उदाहरण के लिए, चट्टान की सतह को छूने वाले पानी का वेग बिल्कुल शून्य होता है (इसे नो-स्लिप कंडीशन कहा जाता है)।

प्रेरणा और बाधा: "लॉस कॉन्फ्लिक्ट"

यह शोध पत्र जिस मुख्य समस्या से निपटता है, वह यह है कि मानक PINNs मल्टीटास्किंग के लिए भयानक हैं।

जब एक मानक PINN द्रव समस्या को हल करने का प्रयास करता है, तो उसे दो दंडों को एक साथ कम करना पड़ता है:
1. PDE लॉस: "क्या मैं नदी के मध्य में बहने वाले पानी की भौतिकी का पालन कर रहा हूँ?"
2. BC लॉस: "क्या मैं उस नियम का पालन कर रहा हूँ कि पानी चट्टान की सतह पर ठीक से चलना बंद कर देता है?"

जब सीमाएँ सरल होती हैं (जैसे सीधी पाइप), तो AI इसे ठीक से संभाल लेता है। लेकिन जब सीमाएँ जटिल होती हैं—जैसे कई दांतेदार चट्टानें या खंडित इनलेट—तो AI को लॉस कॉन्फ्लिक्ट का सामना करना पड़ता है। सीमा नियमों और आंतरिक भौतिकी के लिए ग्रेडिएंट (AI को बताने वाले गणितीय धक्के कि कैसे सुधार करना है) एक-दूसरे से लड़ने लगते हैं। AI भ्रमित हो जाता है, समझौता करता है, और दोनों में विफल हो जाता है।

लेखकों को जिस बाधा को दूर करना था, वह एक ऐसा तरीका खोजना था जिससे AI की आंतरिक डोमेन में भौतिकी सीखने की क्षमता को बाधित किए बिना सीमा नियमों को सख्ती से लागू किया जा सके, साथ ही गणित को चिकना और अवकलनीय रखा जा सके ताकि तंत्रिका नेटवर्क वास्तव में इसे संसाधित कर सके।

गणितीय व्याख्या: उन्होंने क्या हल किया और कैसे

लेखकों ने समस्या को पूरी तरह से अलग करके इसे हल किया। एक AI को सब कुछ करने के लिए मजबूर करने के बजाय, उन्होंने एक हाइब्रिड बाउंड्री PINN (HB-PINN) बनाया जो तीन विशेष सबनेटवर्क का उपयोग करता है।

गणितीय रूप से, उन्होंने इस सुंदर संयुक्त समीकरण का उपयोग करके किसी भी भौतिक मात्रा $q(x, t)$ (जैसे वेग या दबाव) की भविष्यवाणी को फिर से परिभाषित किया:

$$q(x, t) = \mathcal{N}_{P_q}(x, t) + \mathcal{N}_{D_q}(x, t) \cdot \mathcal{N}_{H_q}(x, t)$$

आइए विस्तार से देखें कि इसका क्या मतलब है:

  1. $\mathcal{N}_{P_q}$ (विशेष समाधान नेटवर्क): इस नेटवर्क को एक प्राथमिक कार्य के साथ पूर्व-प्रशिक्षित किया जाता है: सीमा शर्तों को संतुष्ट करना। यह सीखता है कि दीवारों पर द्रव को क्या करना चाहिए।
  2. $\mathcal{N}_{D_q}$ (दूरी मीट्रिक नेटवर्क): यह चतुर हिस्सा है। यह गणना करता है कि कोई बिंदु सीमा से कितनी दूर है। यह सीमा पर ठीक $0$ आउटपुट करता है और खुले द्रव में जाने पर तेजी से $1$ तक बढ़ जाता है। उन्होंने इस संक्रमण को नियंत्रित करने के लिए एक विशिष्ट पावर-लॉ फ़ंक्शन का उपयोग किया:
    $$f(\hat{D}_q) = 1 - (1 - \hat{D}_q / \max(\hat{D}_q))^\alpha$$
  3. $\mathcal{N}_{H_q}$ (प्राथमिक नेटवर्क): यह नेटवर्क केवल द्रव के आंतरिक भाग में नेवियर-स्टोक्स समीकरणों पर केंद्रित है।

मुख्य समीकरण को फिर से देखें। सीमा पर, दूरी नेटवर्क $\mathcal{N}_{D_q}$ $0$ आउटपुट करता है। इसका मतलब है कि $0 \cdot \mathcal{N}_{H_q}$ $0$ हो जाता है, और आंतरिक नेटवर्क पूरी तरह से शांत हो जाता है। अंतिम उत्तर केवल $\mathcal{N}_{P_q}$ है, जो सीमा नियमों को पूरी तरह से संतुष्ट करता है! जैसे ही आप दीवार से दूर जाते हैं, $\mathcal{N}_{D_q}$ $1$ हो जाता है, जिससे प्राथमिक नेटवर्क $\mathcal{N}_{H_q}$ को कार्यभार संभालने और भौतिकी को हल करने की अनुमति मिलती है। लॉस कॉन्फ्लिक्ट को गणितीय रूप से समाप्त कर दिया जाता है।

प्रायोगिक वास्तुकला और "पीड़ित"

लेखकों ने जीत का दावा करने के लिए केवल कुछ संख्याओं को तालिका पर नहीं फेंका; उन्होंने एक क्रूर परीक्षण मैदान तैयार किया। उन्होंने तीन द्रव गतिकी परिदृश्यों की स्थापना की, जो एक अत्यधिक जटिल "खंडित इनलेट के साथ एक अवरुद्ध वर्ग गुहा" (मूल रूप से कई अवरुद्ध प्रवेश द्वारों और आंतरिक दीवारों वाला एक बॉक्स) के साथ समाप्त हुआ, जो स्थिर और क्षणिक (समय-परिवर्तनशील) दोनों स्थितियों में था।

इस प्रयोग में "पीड़ित" अत्याधुनिक भौतिकी AI के एक "कौन है कौन" थे:
* sPINN (मानक बेसलाइन)
* hPINN (हार्ड-कंस्ट्रेंड PINN, सीमाओं को ठीक करने का एक पिछला प्रयास)
* MFN-PINN (संशोधित फूरियर नेटवर्क)
* XPINN और SA-PINN (उन्नत डोमेन-डीकंपोजिशन और स्व-अनुकूली मॉडल)
* PirateNet (एक बहुत हालिया, अत्यधिक मजबूत वास्तुकला)

निर्णायक साक्ष्य:
HB-PINN की श्रेष्ठता का निर्विवाद प्रमाण केवल माध्य वर्ग त्रुटि (MSE) तालिकाओं में नहीं था—हालांकि त्रुटि में एक परिमाण-क्रम की कमी प्राप्त करना प्रभावशाली है। निर्णायक प्रमाण दृश्य अवशिष्ट मानचित्रों में था।

लेखकों ने पूर्ण ग्राउंड ट्रुथ के रूप में उच्च-निष्ठा कम्प्यूटेशनल फ्लूइड डायनामिक्स (CFD) का उपयोग किया। त्रुटियों (अवशिष्टों) के हीटमैप को देखते समय, पीड़ित मॉडल ने आंतरिक बाधाओं के कोनों और जटिल इनलेट के ठीक आसपास क्लस्टर किए गए बड़े, चकाचौंध लाल क्षेत्र (उच्च त्रुटि) दिखाए। बेसलाइन अजीब सीमाओं के पास भौतिकी का पता नहीं लगा सके। इसके विपरीत, HB-PINN के अवशिष्ट मानचित्र पूरे डोमेन में लगभग पूरी तरह से गहरे नीले (शून्य के करीब त्रुटि) थे।

इसके अलावा, उन्होंने रेनॉल्ड्स संख्या को 2000 तक बढ़ाकर कठिनाई को बढ़ाया (द्रव को अत्यधिक अराजक बनाते हुए)। जबकि बेसलाइन मॉडल की त्रुटियां आसमान छू गईं, HB-PINN ने अपनी संरचनात्मक अखंडता और सटीकता बनाए रखी, जो डिकपलिंग तंत्र को चरम वास्तविकता में काम करने का प्रमाण है।

भविष्य की चर्चा के विषय

इस शानदार शोध पत्र के आधार पर, भविष्य के शोध और आलोचनात्मक सोच के लिए यहां कुछ विविध दृष्टिकोण और विषय दिए गए हैं:

1. $\alpha$ पैरामीटर का स्वचालन
दूरी मीट्रिक नेटवर्क में, दीवार से आंतरिक भाग तक संक्रमण की तीक्ष्णता को $\alpha$ नामक पैरामीटर द्वारा नियंत्रित किया जाता है। लेखक नोट करते हैं कि वे वर्तमान में इस मान को अनुभवजन्य रूप से निर्धारित करते हैं (परीक्षण और त्रुटि द्वारा, यह पाते हुए कि $\alpha=5$ केस 2 के लिए अच्छा काम करता है)। क्या हम $\alpha$ को एक सीखने योग्य पैरामीटर बनाकर इस ढांचे को विकसित कर सकते हैं? यदि नेटवर्क स्थानीय द्रव अशांति के आधार पर सीमा परत की तीक्ष्णता को गतिशील रूप से अनुकूलित कर सकता है, तो यह मॉडल को पूरी तरह से स्व-ट्यूनिंग बना सकता है।

2. 3D और चलती सीमाओं तक स्केलिंग
यहां प्रयोग सख्ती से द्वि-आयामी हैं जिनमें स्थिर बाधाएं हैं। वास्तविक दुनिया की इंजीनियरिंग में (जैसे ड्रोन का प्रोपेलर या धड़कता हुआ मानव हृदय), सीमाएं 3D होती हैं और लगातार चलती रहती हैं। ईमानदारी से कहूं तो, मुझे पूरी तरह से यकीन नहीं है कि अत्यधिक जटिल 3D ज्यामिति में आगे बढ़ने पर दूरी मीट्रिक के नमूने के कम्प्यूटेशनल ओवरहेड सैद्धांतिक रूप से कैसे स्केल करता है, क्योंकि लेखक ज्यादातर 2D में अनुभवजन्य समय पर ध्यान केंद्रित करते हैं। चलती सीमाओं के साथ 4D स्पेस-टाइम निरंतरता में $\mathcal{N}_D$ की कुशलतापूर्वक गणना करने के तरीके पर चर्चा करना एक महत्वपूर्ण अगला कदम है।

3. पूर्व-प्रशिक्षण बनाम एंड-टू-एंड लर्निंग की लागत
HB-PINN के लिए प्राथमिक नेटवर्क ($\mathcal{N}_H$) को प्रशिक्षित करने से पहले विशेष समाधान नेटवर्क ($\mathcal{N}_P$) और दूरी नेटवर्क ($\mathcal{N}_D$) को पूर्व-प्रशिक्षित करने की आवश्यकता होती है। जबकि यह लॉस कॉन्फ्लिक्ट को हल करता है, यह एक बहु-चरणीय पाइपलाइन पेश करता है। क्या तीन अलग-अलग नेटवर्क को प्रशिक्षित करने की कम्प्यूटेशनल लागत सरल परिदृश्यों में उचित है? एक मूल्यवान चर्चा यह पता लगाना होगा कि क्या इन तीन नेटवर्क को एक उपन्यास गेटिंग तंत्र के साथ एक एकल वास्तुकला में एकीकृत किया जा सकता है जो अनुक्रमिक पूर्व-प्रशिक्षण की आवश्यकता के बिना समान गणितीय डिकपलिंग प्राप्त करता है।

Figure 30. Comparison of velocity results under different methods for steady-state flow in a square cavity with obstructed segmented inlet at Reynolds number Re = 500 Figure 32. Comparison of velocity results under different methods for steady-state flow in a square cavity with obstructed segmented inlet at Reynolds number Re = 1000 Figure 34. Comparison of velocity results under different methods for steady-state flow in a square cavity with obstructed segmented inlet at Reynolds number Re = 2000

अन्य क्षेत्रों के साथ समरूपताएँ

इस पत्र को समझने के लिए, कल्पना कीजिए कि आपको एक ऐसी दीवार पर एक अत्यंत विस्तृत भित्ति चित्र बनाने का कार्य सौंपा गया है जिसकी किनारे अविश्वसनीय रूप से दांतेदार और अनियमित हैं। यदि आप एक ही समय में जटिल केंद्रीय डिजाइन को चित्रित करने और अजीब किनारों का सटीक पता लगाने की कोशिश करते हैं, तो आपका मस्तिष्क अभिभूत हो जाता है। या तो आप केंद्र को बिगाड़ देते हैं, या आप रेखाओं के बाहर पेंट फैला देते हैं।

कम्प्यूटेशनल भौतिकी की दुनिया में, यह ठीक वही समस्या है जिसका सामना शोधकर्ताओं को फिजिक्स-इनफॉर्म्ड न्यूरल नेटवर्क्स (PINNs) का उपयोग करके द्रव गतिकी (जैसे अजीब आकार की कार के ऊपर हवा का प्रवाह या अवरुद्ध पाइप के माध्यम से पानी का प्रवाह) का अनुकरण करते समय करना पड़ता है। "भित्ति चित्र" नेवियर-स्टोक्स समीकरण (NSE) हैं, जो निर्धारित करते हैं कि श्यान द्रव कैसे चलते हैं। "दांतेदार किनारे" भौतिक वस्तुओं की जटिल सीमाएँ हैं। पारंपरिक PINNs एक एकल संयुक्त हानि फ़ंक्शन का उपयोग करके एक साथ द्रव भौतिकी और सीमा शर्तों को सीखने का प्रयास करते हैं:

$$\mathcal{L} = \lambda_1 \mathcal{L}_{PDE} + \lambda_2 \mathcal{L}_{BC}$$

चूंकि नेटवर्क को इन दो प्रतिस्पर्धी लक्ष्यों को संतुलित करना पड़ता है, इसलिए यह एक गंभीर "हानि संघर्ष" से ग्रस्त है। यह अक्सर किसी को भी पूरी तरह से संतुष्ट करने में विफल रहता है, जिससे संख्यात्मक अस्थिरता और अत्यधिक गलत सिमुलेशन होते हैं। जिस बाधा को दूर करना था, वह एक ऐसा तरीका खोजना था जिससे AI को खुले स्थान के अंदर भौतिकी की गणना करने की अपनी क्षमता को बर्बाद किए बिना भौतिक सीमाओं का पूरी तरह से सम्मान करने के लिए मजबूर किया जा सके।

इस पत्र के लेखकों ने एक चतुर "विभाजन और जीत" वास्तुकला का उपयोग करके कार्यों को पूरी तरह से अलग करके इस समस्या का समाधान किया। एक न्यूरल नेटवर्क द्वारा सब कुछ करने के बजाय, उन्होंने तीन विशिष्ट उप-नेटवर्क का उपयोग करके एक हाइब्रिड बाउंड्री PINN (HB-PINN) बनाया:

  1. $\mathcal{N}_P$ (पर्टिकुलर सॉल्यूशन नेटवर्क): इस नेटवर्क का एकमात्र काम किनारों पर सटीक शर्तों को सीखना है।
  2. $\mathcal{N}_D$ (डिस्टेंस मेट्रिक नेटवर्क): यह नेटवर्क गणना करता है कि कोई भी दिया गया बिंदु किनारे से कितनी दूर है। यह सीमा पर ठीक 0 आउटपुट करता है और जैसे-जैसे आप आंतरिक भाग में बढ़ते हैं, 1 तक सुचारू रूप से संक्रमण करता है।
  3. $\mathcal{N}_H$ (प्राइमरी नेटवर्क): यह नेटवर्क पूरी तरह से डोमेन के अंदर जटिल द्रव भौतिकी (PDE) को हल करने पर केंद्रित है।

वास्तविक प्रतिभा इस बात में निहित है कि उन्होंने गणितीय रूप से इन सबको एक साथ कैसे जोड़ा है। किसी भी भौतिक मात्रा $q$ (जैसे वेग या दबाव) के लिए अंतिम समाधान की गणना इस प्रकार की जाती है:

$$q(x, t) = \mathcal{P}_q(x, t) + \mathcal{D}_q(x, t) \cdot \mathcal{H}_q(x, t)$$

आइए इसे सहज रूप से व्याख्या करें। यदि आप ठीक सीमा पर हैं, तो दूरी $\mathcal{D}_q$ 0 है। समीकरण का पूरा दूसरा भाग गायब हो जाता है, केवल $q = \mathcal{P}_q$ बचता है। सीमा शर्त सख्ती से लागू होती है! लेकिन जैसे ही आप द्रव के अंदर जाते हैं, $\mathcal{D}_q$ 1 हो जाता है, जिससे प्राथमिक नेटवर्क $\mathcal{H}_q$ किनारों की चिंता किए बिना स्वतंत्र रूप से भौतिकी को निर्देशित कर सकता है। उन्होंने ज्यामिति को गणित में हार्डवायर करके हानि संघर्ष को पूरी तरह से समाप्त कर दिया।


एक मिश्रित फ़ंक्शन वास्तुकला जो एक सीमा-विशिष्ट आधार स्थिति को एक आंतरिक-अनुकूलन स्थिति के साथ योगात्मक रूप से जोड़कर सीमा बाधाओं को सख्ती से लागू करती है, जिसे स्थानिक निकटता मीट्रिक द्वारा गुणात्मक रूप से मास्क किया जाता है।

उपरोक्त कंकाल के आधार पर, हम विज्ञान और इंजीनियरिंग के पूरी तरह से अलग-अलग क्षेत्रों में दूर के चचेरे भाइयों की पहचान कर सकते हैं जहाँ यह सटीक तार्किक पैटर्न लंबे समय से चली आ रही चुनौतियों को पूरी तरह से दर्शाता है।

लक्षित क्षेत्र: मात्रात्मक वित्त (विदेशी डेरिवेटिव मूल्य निर्धारण)
संबंध: मात्रात्मक वित्त में, "बैरियर विकल्प" का मूल्य निर्धारण ब्लैक-स्कोल्स आंशिक अंतर समीकरण को हल करने की आवश्यकता है। हालांकि, इन विकल्पों में सख्त संविदात्मक सीमाएं होती हैं (जैसे, "यदि स्टॉक $150 तक पहुंचता है, तो विकल्प तुरंत बेकार हो जाता है")। क्वॉन्ट्स बाजार की निरंतर स्टोकेस्टिक अस्थिरता (आंतरिक PDE) को मॉडल करने की कोशिश करते हुए इन अचानक, हार्ड-कोडेड भुगतान बाधाओं (जटिल सीमा) को सख्ती से लागू करने में एक बड़े "हानि संघर्ष" का सामना करते हैं। बैरियर बाधा को आंतरिक मूल्य गतिशीलता से अलग करने का मूल तर्क HB-PINN द्रव गतिकी समस्या का एक आदर्श दर्पण प्रतिबिंब है।

लक्षित क्षेत्र: क्वांटम यांत्रिकी (तरंग फलन का परिरोध)
संबंध: जब भौतिक विज्ञानी एक अत्यधिक अनियमित, बहु-आयामी क्षमता कुएं (जैसे एक जटिल नैनोमैटेरियल में एक इलेक्ट्रॉन) में फंसे कण के लिए श्रोडिंगर समीकरण को हल करने का प्रयास करते हैं, तो उन्हें एक समान दुःस्वप्न का सामना करना पड़ता है। क्वांटम तरंग फलन कुएं की दीवारों (सीमा शर्त) पर ठीक शून्य होना चाहिए, लेकिन इसे कुएं के अंदर जटिल क्वांटम गतिकी के अनुसार विकसित होना चाहिए। आंतरिक तरंग विकास के साथ सीमा परिरोध को संतुलित करना गणितीय रूप से नेवियर-स्टोक्स समीकरणों के साथ द्रव सीमाओं को संतुलित करने के समान है।

क्या होगा यदि कोई वॉल स्ट्रीट मात्रात्मक विश्लेषक कल इस पत्र के सटीक मिश्रित समीकरण को "चोरी" कर ले? इस वास्तुकला को लागू करके, वे सख्त संविदात्मक बैरियर भुगतानों ($\mathcal{P}_q$) को जटिल ब्लैक-स्कोल्स अस्थिरता मॉडलिंग ($\mathcal{H}_q$) से पूरी तरह से अलग कर सकते हैं, एक वित्तीय "बैरियर से दूरी" मीट्रिक ($\mathcal{D}_q$) का उपयोग करके। सफलता अत्यधिक जटिल, बहु-परिसंपत्ति विदेशी डेरिवेटिव को वास्तविक समय में अल्ट्रा-उच्च सटीकता के साथ मूल्य निर्धारण करने की क्षमता होगी, जो वर्तमान में ट्रेडिंग फ्लोर पर उपयोग किए जाने वाले धीमे, कम्प्यूटेशनल रूप से महंगे मोंटे कार्लो सिमुलेशन को पूरी तरह से बायपास कर देगा।

अंततः, यह पद्धति साबित करती है कि चाहे आप द्रव के अशांत वेक, एक इलेक्ट्रॉन की संभाव्यता तरंग, या एक व्युत्पन्न की अस्थिर कीमत का मॉडल बना रहे हों, अंतर्निहित गणितीय वास्तुकला खूबसूरती से समान बनी हुई है, जो संरचनाओं की सार्वभौमिक लाइब्रेरी में एक और गहन ब्लूप्रिंट का योगदान करती है।