Shannonلايت 1.6
ذكاء اصطناعي مؤسسي فعال من حيث التكلفة مدعوم بـMistral Large 3مع675 مليار معامل إجماليو41 مليار معامل نشطمن خلال بنية مزيج الخبراء الحبيبية. تم تدريبه لاحقًا على2,500 مخرج من Claude Opus 4.5للتتبع الاستثنائي للتعليمات.تكميم NVFP4يمكّن النشر على عقدة واحدة علىH100s أو A100s.
Mistral Large 3: مزيج الخبراء الحبيبي
تم بناء Shannon Lite 1.6 على Mistral Large 3، وهو نموذج مزيج خبراء حبيبي متعدد الوسائط ومتطور مصمم من الألف إلى الياء من أجل الموثوقية، وفهم السياق الطويل، والأداء على مستوى الإنتاج. تم ضبط الإصدار المدرب لاحقًا للتعليمات بدقة لحالات الاستخدام القائمة على الدردشة والوكالة والتعليمات.
نموذج اللغة
بنية مزيج الخبراء الحبيبية (MoE) مع 39 مليار معامل نشط لكل تمريرة أمامية
مشفّر الرؤية
مشفّر متعدد الوسائط مدمج لتحليل الصور والفهم البصري
نافذة السياق
سياق ممتد لفهم المستندات الشامل وRAG
اللغات
الإنجليزية، الفرنسية، الإسبانية، الألمانية، الصينية، اليابانية، الكورية، العربية، والمزيد
النشر المؤسسي الفعال من حيث التكلفة
يستفيد Shannon Lite 1.6 من تقنية تكميم NVFP4 (النقطة العائمة 4 بت) من NVIDIA لتقليل متطلبات الذاكرة بشكل كبير مع الحفاظ على جودة النموذج. انشر ذكاء اصطناعي من الفئة الرائدة على بنية تحتية لوحدات معالجة الرسوميات (GPU) يمكن الوصول إليها دون تعقيد العقد المتعددة.
تكلفة بنية تحتية مخفضة
يقلل تكميم NVFP4 من استهلاك الذاكرة بحوالي 4 أضعاف مقارنة بـ BF16، مما يتيح النشر على عدد أقل من وحدات معالجة الرسوميات (GPUs) ويخفض بشكل كبير التكلفة الإجمالية للملكية (TCO) للذكاء الاصطناعي المؤسسي.
النشر على عقدة واحدة
انشر النموذج الكامل ذو 675 مليار معامل على عقدة واحدة من H100s أو A100s. لا توجد تنسيق معقد متعدد العقد، وتقليل الحمل الزائد للشبكة، وعمليات مبسطة.
جودة النموذج المحفوظة
تقنيات التكميم المتقدمة تحافظ على أداء النموذج عبر مهام الاستدلال، وتتبع التعليمات، والمهام متعددة الوسائط مع الحد الأدنى من تدهور الجودة.
تقطير المعرفة لـ Claude Opus 4.5
تم تدريب Shannon Lite 1.6 بدقة لاحقًا باستخدام 2,500 مخرج منتقى بعناية منClaude Opus 4.5، النموذج الأكثر قدرة من Anthropic. يتبع هذا النهج لتقطير المعرفة أنماط الاستدلال المتقدمة، والتفسير الدقيق للتعليمات، وجودة الاستجابة الفائقة.
أساس Mistral Large 3 Instruct 2512
مبني على نموذج Instruct المتطور من Mistral (الإصدار 2512) بدقة BF16. يوفر هذا الأساس قدرات على مستوى الريادة مصممة للمساعدين على مستوى الإنتاج، وأنظمة الاسترجاع المعززة، وأعباء العمل العلمية، وسير العمل المؤسسي المعقد.
تقطير مخرجات Claude Opus 4.5
تم تدريبه لاحقًا على 2,500 مخرج عالي الجودة من Claude Opus 4.5، مما يلتقط قدرات الاستدلال الأكثر تقدمًا لدى Anthropic. تركز مجموعة البيانات المنسقة على تتبع التعليمات المعقدة، والفهم الدقيق، وتوليد استجابات عالية الجودة عبر مجالات متنوعة.
عملية تكميم NVFP4
تكميم NVIDIA FP4 متقدم مطبق بعد التدريب لتقليل استهلاك الذاكرة مع الحفاظ على جودة النموذج. معاير خصيصًا للأوزان المدربة لاحقًا للحفاظ على نقل المعرفة لـ Claude Opus 4.5 وقدرات اتباع التعليمات.
التقييم والتحقق
تقييم شامل عبر معايير اتباع التعليمات، ومهام الاستدلال، وسيناريوهات المؤسسات الواقعية. تم التحقق من سلوكه المتسق عبر المجالات، والمخرجات المستقرة، والأداء الموثوق به في بيئات الإنتاج.
خيارات نشر مرنة لوحدة معالجة الرسوميات (GPU)
Shannon Lite 1.6 مع تكميم NVFP4 يمكّن النشر الفعال من حيث التكلفة على تكوينات NVIDIA GPU القياسية في الصناعة، مما يجعل الذكاء الاصطناعي الرائد متاحًا لعمليات النشر في المؤسسات دون الحاجة إلى مجموعات متعددة العقد باهظة الثمن.
NVIDIA H100 SXM
أداء أمثل مع بنية Hopper وذاكرة HBM3
NVIDIA A100 SXM
موثوقية مثبتة على وحدات معالجة الرسوميات (GPUs) ذات بنية Ampere
Shannon Cloud
نشر مُدار بالكامل مع بنية تحتية صفرية
ميزات الذكاء الاصطناعي الجاهزة للمؤسسات
يقدم Shannon Lite 1.6 قدرات رائدة موروثة من Mistral Large 3 ومعززة من خلال تدريب Claude Opus 4.5 اللاحق، ومُحسّن لأعباء عمل الإنتاج عبر سيناريوهات مؤسسية متنوعة.
رؤية متعددة الوسائط
مشفّر رؤية مدمج بـ 2.5 مليار معلمة يمكّن تحليل الصور، والإجابة على الأسئلة المرئية، وفهم المستندات بالصور.
تميز متعدد اللغات
دعم أصلي لأكثر من 12 لغة بما في ذلك الإنجليزية، الفرنسية، الإسبانية، الألمانية، الإيطالية، البرتغالية، الهولندية، الصينية، اليابانية، الكورية، والعربية.
قدرات وكيلية
ميزات وكيلية الأفضل في فئتها مع استدعاء وظائف أصلي ومخرجات JSON منظمة لاستخدام الأدوات المستقل وأتمتة سير العمل.
الالتزام بموجهات النظام
التزام ودعم قوي لموجهات النظام، مما يتيح تحكمًا سلوكيًا دقيقًا وصيانة متسقة للشخصية.
سياق طويل 256 ألف
نافذة سياق ممتدة لفهم المستندات الشامل، والمحادثات الممتدة، والتوليد المعزز بالاسترجاع (RAG).
استدعاء وظائف أصلي
دعم مدمج لاستدعاء الوظائف مع مخرجات JSON موثوقة للتكامل السلس مع الأدوات الخارجية، واجهات برمجة التطبيقات (APIs)، والخدمات.
مُحسّن لأعباء عمل الإنتاج
بفضل أداء السياق الطويل القوي، والسلوك المستقر والمتسق عبر المجالات، يتفوق Shannon Lite 1.6 في سيناريوهات المؤسسات والبحث المتنوعة.
فهم المستندات الطويلة
معالجة وتحليل المستندات والعقود والتقارير والأوراق البحثية الشاملة باستخدام نافذة السياق 256 ألف
مساعدو الذكاء الاصطناعي للإنتاج
تشغيل مساعدي الذكاء الاصطناعي اليوميين باستجابات موثوقة ومتسقة واتباع قوي للتعليمات
سير عمل وكيلية
استخدام أدوات متطور واستدعاء وظائف لتنفيذ المهام المستقل وأتمتة سير العمل
عمل المعرفة للمؤسسات
سير عمل مؤسسية معقدة تتطلب قدرات ذكاء اصطناعي رائدة مع مخرجات متسقة وموثوقة
مساعد برمجة عام
توليد الكود، تصحيح الأخطاء، التوثيق، ومساعدة في تطوير البرمجيات عبر لغات متعددة
البحث العلمي
مساعدة بحثية، مراجعة الأدبيات، معالجة أعباء العمل العلمية، وتوليد الفرضيات
التوليد المعزز بالاسترجاع
أداء أمثل لأنظمة RAG مع تكامل سياق موثوق وتوليف استرجاع دقيق
تطبيقات متعددة اللغات
تطبيقات مؤسسية عالمية تتطلب جودة متسقة عبر أكثر من 12 لغة مدعومة
Shannon Lite مقابل Shannon Pro
اختر نموذج Shannon المناسب لاحتياجاتك. يقدم Shannon Lite نشرًا فعالاً من حيث التكلفة للمؤسسات، بينما Shannon Pro يوفر أقصى قدرة مع استدلال متقدم لسلسلة الأفكار ودعم المهارات.
| الميزة | Shannon Lite 1.6 | Shannon Pro 1.6 |
|---|---|---|
| النموذج الأساسي | Mistral Large 3 (675B) | Mistral Large 3 (675B) |
| المعلمات النشطة | 41 مليار (MoE حبيبي) | 41 مليار (MoE حبيبي) |
| الدقة | NVFP4 (4 بت) | BF16 كامل (16 بت) |
| بيانات ما بعد التدريب | 2,500 مخرج من Claude Opus 4.5 | آثار تفكير KIMI K2 |
| طريقة ما بعد التدريب | الضبط الدقيق تحت الإشراف | GRPO (تحسين السياسة النسبية للمجموعة) |
| وضع الاستدلال | قياسي | آثار سلسلة التفكير |
| دعم المهارات | - | للمحترفين فقطالمهارات الأصلية |
| النشر | H100/A100 (عقدة واحدة) | B200/H200 (FP8) |
| الأفضل لـ | ذكاء اصطناعي فعال من حيث التكلفة للمؤسسات | أقصى قدرة + استدلال |
جرب Shannon Lite 1.6
قدرات الذكاء الاصطناعي الرائدة مع تحديد كمي NVFP4 فعال من حيث التكلفة. انشر على بنية تحتية H100 أو A100 لأداء على مستوى المؤسسات بتكلفة معقولة.