हम किसी भी उपयोगकर्ता डेटा को न तो रखते हैं और न ही उस तक पहुँचते हैं, और जब तक कोई वैध प्राधिकरण प्रवर्तन कार्रवाई की माँग न करे तब तक हम खातों को निलंबित नहीं करते।
NVFP4 क्वांटाइज्ड - लागत-प्रभावी एंटरप्राइज़ AI

Shannonलाइट 1.6

द्वारा संचालित लागत-प्रभावी एंटरप्राइज़ AIMistral Large 3के साथ675B कुल पैरामीटरऔर41B सक्रिय पैरामीटरग्रैन्युलर मिक्सचर-ऑफ-एक्सपर्ट्स आर्किटेक्चर के माध्यम से। पर पोस्ट-ट्रेन किया गया2,500 Claude Opus 4.5 आउटपुटअसाधारण निर्देश-पालन के लिए।NVFP4 क्वांटाइजेशनपर सिंगल-नोड डिप्लॉयमेंट सक्षम करता हैH100s या A100s.

675B
कुल पैरामीटर
41B
सक्रिय पैरामीटर
NVFP4
क्वांटाइजेशन
256K
संदर्भ
2.5B
विजन एनकोडर
लाइट संस्करण
Shannon Lite 1.6
v1.6.0-lite-nvfp4
तकनीकी विनिर्देश:
बेस मॉडल Mistral Large 3
आर्किटेक्चर ग्रैन्युलर MoE
कुल पैरामीटर 675B
सक्रिय पैरामीटर 41B
क्वांटाइजेशन NVFP4
पोस्ट-ट्रेनिंग Claude Opus 4.5
ट्रेनिंग सैंपल 2,500

Mistral Large 3: ग्रैन्युलर मिक्सचर-ऑफ-एक्सपर्ट्स

Shannon Lite 1.6 Mistral Large 3 पर आधारित है, जो एक अत्याधुनिक मल्टीमॉडल ग्रैन्युलर मिक्सचर-ऑफ-एक्सपर्ट्स मॉडल है जो विश्वसनीयता, लंबी-संदर्भ समझ और उत्पादन-ग्रेड प्रदर्शन के लिए शुरू से ही डिज़ाइन किया गया है। निर्देश पोस्ट-ट्रेन किया गया संस्करण चैट, एजेंटिक और निर्देश-आधारित उपयोग के मामलों के लिए फाइन-ट्यून किया गया है।

673B

भाषा मॉडल

ग्रैन्युलर MoE आर्किटेक्चर के साथ प्रति फॉरवर्ड पास 39B सक्रिय पैरामीटर

2.5B

विजन एनकोडर

छवि विश्लेषण और दृश्य समझ के लिए एकीकृत मल्टीमॉडल एनकोडर

256K

संदर्भ विंडो

व्यापक दस्तावेज़ समझ और RAG के लिए विस्तारित संदर्भ

12+

भाषाएँ

अंग्रेजी, फ्रेंच, स्पेनिश, जर्मन, चीनी, जापानी, कोरियाई, अरबी, और भी बहुत कुछ

लागत-प्रभावी एंटरप्राइज़ डिप्लॉयमेंट

Shannon Lite 1.6 NVIDIA की NVFP4 (4-बिट फ्लोटिंग पॉइंट) क्वांटाइजेशन तकनीक का लाभ उठाता है मेमोरी आवश्यकताओं को नाटकीय रूप से कम करने और मॉडल की गुणवत्ता को बनाए रखने के लिए। मल्टी-नोड जटिलता के बिना सुलभ GPU इंफ्रास्ट्रक्चर पर फ्रंटियर-क्लास AI डिप्लॉय करें।

💰

कम इंफ्रास्ट्रक्चर लागत

NVFP4 क्वांटाइजेशन BF16 की तुलना में मेमोरी फुटप्रिंट को लगभग 4 गुना कम करता है, जिससे कम GPUs पर डिप्लॉयमेंट संभव होता है और एंटरप्राइज़ AI के लिए TCO नाटकीय रूप से कम होता है।

सिंगल-नोड डिप्लॉयमेंट

H100s या A100s के एक सिंगल नोड पर पूर्ण 675B पैरामीटर मॉडल डिप्लॉय करें। कोई जटिल मल्टी-नोड ऑर्केस्ट्रेशन नहीं, कम नेटवर्किंग ओवरहेड, सरलीकृत संचालन।

मॉडल की गुणवत्ता बरकरार

उन्नत क्वांटाइजेशन तकनीकें तर्क, निर्देश-पालन और मल्टीमॉडल कार्यों में मॉडल के प्रदर्शन को न्यूनतम गुणवत्ता गिरावट के साथ बनाए रखती हैं।

Claude Opus 4.5 ज्ञान आसवन

Shannon Lite 1.6 को 2,500 सावधानीपूर्वक क्यूरेट किए गए आउटपुट का उपयोग करके सावधानीपूर्वक पोस्ट-ट्रेन किया गया हैClaude Opus 4.5, Anthropic का सबसे सक्षम मॉडल। यह ज्ञान आसवन दृष्टिकोण उन्नत तर्क पैटर्न, सूक्ष्म निर्देश व्याख्या और बेहतर प्रतिक्रिया गुणवत्ता को कैप्चर करता है।

Mistral Large 3 इंस्ट्रक्ट 2512 फाउंडेशन

Mistral के अत्याधुनिक इंस्ट्रक्ट मॉडल (संस्करण 2512) BF16 प्रेसिजन में निर्मित। यह फाउंडेशन प्रदान करता है उत्पादन-ग्रेड सहायकों, पुनर्प्राप्ति-संवर्धित प्रणालियों, वैज्ञानिक वर्कलोड और जटिल एंटरप्राइज़ वर्कफ़्लो के लिए डिज़ाइन की गई फ्रंटियर-स्तरीय क्षमताएँ।

BF16 बेस इंस्ट्रक्ट ट्यून किया गया उत्पादन के लिए तैयार Apache 2.0 लाइसेंस

Claude Opus 4.5 आउटपुट आसवन

Claude Opus 4.5 से 2,500 उच्च-गुणवत्ता वाले आउटपुट पर पोस्ट-ट्रेन किया गया, Anthropic की सबसे उन्नत तर्क क्षमताओं को कैप्चर करते हुए। क्यूरेटेड डेटासेट जटिल निर्देश-पालन, सूक्ष्म समझ, और विविध डोमेन में उच्च-गुणवत्ता वाली प्रतिक्रिया पीढ़ी पर केंद्रित है।

2,500 सैंपल क्यूरेटेड डेटासेट गुणवत्ता पर ध्यान विविध डोमेन

NVFP4 क्वांटाइजेशन प्रक्रिया

मेमोरी फ़ुटप्रिंट को कम करने और मॉडल की गुणवत्ता बनाए रखने के लिए प्रशिक्षण के बाद उन्नत NVIDIA FP4 क्वांटाइजेशन लागू किया गया। Claude Opus 4.5 के ज्ञान हस्तांतरण और निर्देश-पालन क्षमताओं को बनाए रखने के लिए विशेष रूप से प्रशिक्षित वज़न के लिए कैलिब्रेट किया गया।

NVFP4 4-बिट प्रेसिजन कैलिब्रेटेड गुणवत्ता संरक्षित

मूल्यांकन और सत्यापन

निर्देश-पालन बेंचमार्क, तर्क कार्यों और वास्तविक दुनिया के उद्यम परिदृश्यों में व्यापक मूल्यांकन। सुसंगत क्रॉस-डोमेन व्यवहार, स्थिर आउटपुट और उत्पादन वातावरण में विश्वसनीय प्रदर्शन के लिए मान्य।

बेंचमार्क किया गया क्रॉस-डोमेन उत्पादन मान्य स्थिर आउटपुट

लचीले GPU परिनियोजन विकल्प

NVFP4 क्वांटाइजेशन के साथ Shannon Lite 1.6 उद्योग-मानक NVIDIA GPU कॉन्फ़िगरेशन पर लागत प्रभावी परिनियोजन को सक्षम बनाता है, जिससे महंगे मल्टी-नोड क्लस्टर की आवश्यकता के बिना उद्यम परिनियोजन के लिए फ्रंटियर AI सुलभ हो जाता है।

NVIDIA H100 SXM

हॉपर आर्किटेक्चर और HBM3 मेमोरी के साथ इष्टतम प्रदर्शन

सिंगल नोड (8x H100)
NVFP4 प्रेसिजन
प्रति GPU 80GB HBM3
अधिकतम थ्रूपुट

NVIDIA A100 SXM

एम्पीयर आर्किटेक्चर GPUs पर सिद्ध विश्वसनीयता

सिंगल नोड (8x A100)
NVFP4 प्रेसिजन
प्रति GPU 80GB HBM2e
लागत प्रभावी

Shannon क्लाउड

शून्य अवसंरचना के साथ पूरी तरह से प्रबंधित परिनियोजन

तत्काल पहुंच
ऑटो स्केलिंग
REST API तैयार
99.9% SLA

एंटरप्राइज-रेडी AI सुविधाएँ

Shannon Lite 1.6 Mistral Large 3 से विरासत में मिली फ्रंटियर क्षमताओं को प्रदान करता है और Claude Opus 4.5 के प्रशिक्षण के बाद बढ़ाया गया है, जिसे विविध उद्यम परिदृश्यों में उत्पादन वर्कलोड के लिए अनुकूलित किया गया है।

मल्टीमॉडल विजन

एकीकृत 2.5B पैरामीटर विजन एन्कोडर छवि विश्लेषण, दृश्य प्रश्न उत्तर और छवियों के साथ दस्तावेज़ समझ को सक्षम बनाता है।

बहुभाषी उत्कृष्टता

अंग्रेजी, फ्रेंच, स्पेनिश, जर्मन, इतालवी, पुर्तगाली, डच, चीनी, जापानी, कोरियाई और अरबी सहित 12+ भाषाओं के लिए मूल समर्थन।

🤖

एजेंटिक क्षमताएं

स्वायत्त उपकरण उपयोग और वर्कफ़्लो स्वचालन के लिए मूल फ़ंक्शन कॉलिंग और संरचित JSON आउटपुट के साथ सर्वश्रेष्ठ-इन-क्लास एजेंटिक सुविधाएँ।

सिस्टम प्रॉम्प्ट पालन

सिस्टम प्रॉम्प्ट के लिए मजबूत पालन और समर्थन, सटीक व्यवहार नियंत्रण और सुसंगत व्यक्तित्व रखरखाव को सक्षम करना।

256K लंबी संदर्भ

व्यापक दस्तावेज़ समझ, विस्तारित वार्तालापों और पुनर्प्राप्ति-संवर्धित पीढ़ी (RAG) के लिए विस्तारित संदर्भ विंडो।

🔧

नेटिव फ़ंक्शन कॉलिंग

बाहरी उपकरणों, APIs और सेवाओं के साथ सहज एकीकरण के लिए विश्वसनीय JSON आउटपुट के साथ अंतर्निहित फ़ंक्शन कॉलिंग समर्थन।

उत्पादन वर्कलोड के लिए अनुकूलित

शक्तिशाली लंबी-संदर्भ प्रदर्शन, स्थिर और सुसंगत क्रॉस-डोमेन व्यवहार के साथ, Shannon Lite 1.6 विविध उद्यम और अनुसंधान परिदृश्यों में उत्कृष्ट प्रदर्शन करता है।

📄

लंबे दस्तावेज़ को समझना

256K संदर्भ विंडो के साथ व्यापक दस्तावेज़ों, अनुबंधों, रिपोर्टों और शोध पत्रों को संसाधित और विश्लेषण करें

🤖

उत्पादन AI सहायक

विश्वसनीय, सुसंगत प्रतिक्रियाओं और मजबूत निर्देश-पालन के साथ दैनिक-ड्राइवर AI सहायकों को शक्ति प्रदान करें

🔧

एजेंटिक वर्कफ़्लो

स्वायत्त कार्य निष्पादन और वर्कफ़्लो स्वचालन के लिए अत्याधुनिक उपकरण उपयोग और फ़ंक्शन कॉलिंग

🏢

एंटरप्राइज नॉलेज वर्क

सुसंगत, विश्वसनीय आउटपुट के साथ फ्रंटियर AI क्षमताओं की आवश्यकता वाले जटिल उद्यम वर्कफ़्लो

💻

सामान्य कोडिंग सहायक

कई भाषाओं में कोड जनरेशन, डीबगिंग, डॉक्यूमेंटेशन और सॉफ्टवेयर डेवलपमेंट सहायता

वैज्ञानिक अनुसंधान

अनुसंधान सहायता, साहित्य समीक्षा, वैज्ञानिक वर्कलोड प्रसंस्करण और परिकल्पना पीढ़ी

पुनर्प्राप्ति-संवर्धित पीढ़ी

विश्वसनीय संदर्भ एकीकरण और सटीक पुनर्प्राप्ति संश्लेषण के साथ RAG सिस्टम के लिए इष्टतम प्रदर्शन

🌍

बहुभाषी अनुप्रयोग

12+ समर्थित भाषाओं में सुसंगत गुणवत्ता की आवश्यकता वाले वैश्विक उद्यम अनुप्रयोग

Shannon Lite बनाम Shannon Pro

अपनी आवश्यकताओं के लिए सही Shannon मॉडल चुनें। Shannon Lite लागत प्रभावी उद्यम परिनियोजन प्रदान करता है, जबकि Shannon Pro उन्नत चेन-ऑफ-थॉट तर्क और कौशल समर्थन के साथ अधिकतम क्षमता प्रदान करता है।

सुविधा Shannon Lite 1.6 Shannon Pro 1.6
बेस मॉडल Mistral Large 3 (675B) Mistral Large 3 (675B)
सक्रिय पैरामीटर 41B (ग्रेनुलर MoE) 41B (ग्रेनुलर MoE)
प्रेसिजन NVFP4 (4-बिट) पूर्ण BF16 (16-बिट)
प्रशिक्षण-पश्चात डेटा 2,500 Claude Opus 4.5 आउटपुट KIMI K2 विचार प्रक्रिया के निशान
प्रशिक्षण-पश्चात विधि पर्यवेक्षित फाइन-ट्यूनिंग GRPO (ग्रुप रिलेटिव पॉलिसी ऑप्टिमाइजेशन)
तर्क मोड मानक विचार-श्रृंखला के निशान
कौशल समर्थन - केवल प्रोमूल कौशल
परिनियोजन H100/A100 (सिंगल नोड) B200/H200 (FP8)
इसके लिए सबसे अच्छा लागत प्रभावी एंटरप्राइज़ AI अधिकतम क्षमता + तर्क

क्या आपको उन्नत तर्क और कौशल चाहिए?

Shannon Pro 1.6 में पारदर्शी विचार-श्रृंखला तर्क के लिए GRPO प्रशिक्षण के साथ KIMI K2 विचार प्रक्रिया के निशान, साथ ही कस्टम AI वर्कफ़्लो के लिए मूल कौशल समर्थन शामिल हैं।

Shannon Pro का अन्वेषण करें

Shannon Lite 1.6 का अनुभव करें

लागत प्रभावी NVFP4 क्वांटाइजेशन के साथ फ्रंटियर AI क्षमताएं। सुलभ लागत पर एंटरप्राइज़-ग्रेड प्रदर्शन के लिए H100 या A100 इंफ्रास्ट्रक्चर पर परिनियोजित करें।

सभी शोध लिंक