نحن لا نحتفظ ببيانات أي مستخدم ولا نصل إليها، ولا نعلّق الحسابات إلا إذا طلبت جهة قانونية ذلك.
مُكمّم NVFP4 - ذكاء اصطناعي مؤسسي فعال من حيث التكلفة

Shannonلايت 1.6

ذكاء اصطناعي مؤسسي فعال من حيث التكلفة مدعوم بـMistral Large 3مع675 مليار معامل إجماليو41 مليار معامل نشطمن خلال بنية مزيج الخبراء الحبيبية. تم تدريبه لاحقًا على2,500 مخرج من Claude Opus 4.5للتتبع الاستثنائي للتعليمات.تكميم NVFP4يمكّن النشر على عقدة واحدة علىH100s أو A100s.

675B
المعاملات الإجمالية
41B
المعاملات النشطة
NVFP4
التكميم
256K
السياق
2.5B
مشفّر الرؤية
إصدار لايت
Shannon Lite 1.6
v1.6.0-lite-nvfp4
المواصفات الفنية:
النموذج الأساسي Mistral Large 3
البنية مزيج الخبراء الحبيبي
المعاملات الإجمالية 675B
المعاملات النشطة 41B
التكميم NVFP4
التدريب اللاحق Claude Opus 4.5
عينات التدريب 2,500

Mistral Large 3: مزيج الخبراء الحبيبي

تم بناء Shannon Lite 1.6 على Mistral Large 3، وهو نموذج مزيج خبراء حبيبي متعدد الوسائط ومتطور مصمم من الألف إلى الياء من أجل الموثوقية، وفهم السياق الطويل، والأداء على مستوى الإنتاج. تم ضبط الإصدار المدرب لاحقًا للتعليمات بدقة لحالات الاستخدام القائمة على الدردشة والوكالة والتعليمات.

673B

نموذج اللغة

بنية مزيج الخبراء الحبيبية (MoE) مع 39 مليار معامل نشط لكل تمريرة أمامية

2.5B

مشفّر الرؤية

مشفّر متعدد الوسائط مدمج لتحليل الصور والفهم البصري

256K

نافذة السياق

سياق ممتد لفهم المستندات الشامل وRAG

12+

اللغات

الإنجليزية، الفرنسية، الإسبانية، الألمانية، الصينية، اليابانية، الكورية، العربية، والمزيد

النشر المؤسسي الفعال من حيث التكلفة

يستفيد Shannon Lite 1.6 من تقنية تكميم NVFP4 (النقطة العائمة 4 بت) من NVIDIA لتقليل متطلبات الذاكرة بشكل كبير مع الحفاظ على جودة النموذج. انشر ذكاء اصطناعي من الفئة الرائدة على بنية تحتية لوحدات معالجة الرسوميات (GPU) يمكن الوصول إليها دون تعقيد العقد المتعددة.

💰

تكلفة بنية تحتية مخفضة

يقلل تكميم NVFP4 من استهلاك الذاكرة بحوالي 4 أضعاف مقارنة بـ BF16، مما يتيح النشر على عدد أقل من وحدات معالجة الرسوميات (GPUs) ويخفض بشكل كبير التكلفة الإجمالية للملكية (TCO) للذكاء الاصطناعي المؤسسي.

النشر على عقدة واحدة

انشر النموذج الكامل ذو 675 مليار معامل على عقدة واحدة من H100s أو A100s. لا توجد تنسيق معقد متعدد العقد، وتقليل الحمل الزائد للشبكة، وعمليات مبسطة.

جودة النموذج المحفوظة

تقنيات التكميم المتقدمة تحافظ على أداء النموذج عبر مهام الاستدلال، وتتبع التعليمات، والمهام متعددة الوسائط مع الحد الأدنى من تدهور الجودة.

تقطير المعرفة لـ Claude Opus 4.5

تم تدريب Shannon Lite 1.6 بدقة لاحقًا باستخدام 2,500 مخرج منتقى بعناية منClaude Opus 4.5، النموذج الأكثر قدرة من Anthropic. يتبع هذا النهج لتقطير المعرفة أنماط الاستدلال المتقدمة، والتفسير الدقيق للتعليمات، وجودة الاستجابة الفائقة.

أساس Mistral Large 3 Instruct 2512

مبني على نموذج Instruct المتطور من Mistral (الإصدار 2512) بدقة BF16. يوفر هذا الأساس قدرات على مستوى الريادة مصممة للمساعدين على مستوى الإنتاج، وأنظمة الاسترجاع المعززة، وأعباء العمل العلمية، وسير العمل المؤسسي المعقد.

أساس BF16 مُعدّل للتعليمات جاهز للإنتاج ترخيص Apache 2.0

تقطير مخرجات Claude Opus 4.5

تم تدريبه لاحقًا على 2,500 مخرج عالي الجودة من Claude Opus 4.5، مما يلتقط قدرات الاستدلال الأكثر تقدمًا لدى Anthropic. تركز مجموعة البيانات المنسقة على تتبع التعليمات المعقدة، والفهم الدقيق، وتوليد استجابات عالية الجودة عبر مجالات متنوعة.

2,500 عينة مجموعة بيانات منسقة التركيز على الجودة مجالات متنوعة

عملية تكميم NVFP4

تكميم NVIDIA FP4 متقدم مطبق بعد التدريب لتقليل استهلاك الذاكرة مع الحفاظ على جودة النموذج. معاير خصيصًا للأوزان المدربة لاحقًا للحفاظ على نقل المعرفة لـ Claude Opus 4.5 وقدرات اتباع التعليمات.

NVFP4 دقة 4 بت معاير الجودة محفوظة

التقييم والتحقق

تقييم شامل عبر معايير اتباع التعليمات، ومهام الاستدلال، وسيناريوهات المؤسسات الواقعية. تم التحقق من سلوكه المتسق عبر المجالات، والمخرجات المستقرة، والأداء الموثوق به في بيئات الإنتاج.

معاير عبر المجالات تم التحقق منه للإنتاج مخرجات مستقرة

خيارات نشر مرنة لوحدة معالجة الرسوميات (GPU)

Shannon Lite 1.6 مع تكميم NVFP4 يمكّن النشر الفعال من حيث التكلفة على تكوينات NVIDIA GPU القياسية في الصناعة، مما يجعل الذكاء الاصطناعي الرائد متاحًا لعمليات النشر في المؤسسات دون الحاجة إلى مجموعات متعددة العقد باهظة الثمن.

NVIDIA H100 SXM

أداء أمثل مع بنية Hopper وذاكرة HBM3

Single Node (8x H100)
دقة NVFP4
80 جيجابايت HBM3 لكل وحدة معالجة رسوميات (GPU)
أقصى إنتاجية

NVIDIA A100 SXM

موثوقية مثبتة على وحدات معالجة الرسوميات (GPUs) ذات بنية Ampere

عقدة واحدة (8x A100)
دقة NVFP4
80 جيجابايت HBM2e لكل وحدة معالجة رسوميات (GPU)
فعال من حيث التكلفة

Shannon Cloud

نشر مُدار بالكامل مع بنية تحتية صفرية

وصول فوري
توسيع تلقائي
جاهز لـ REST API
99.9% اتفاقية مستوى الخدمة (SLA)

ميزات الذكاء الاصطناعي الجاهزة للمؤسسات

يقدم Shannon Lite 1.6 قدرات رائدة موروثة من Mistral Large 3 ومعززة من خلال تدريب Claude Opus 4.5 اللاحق، ومُحسّن لأعباء عمل الإنتاج عبر سيناريوهات مؤسسية متنوعة.

رؤية متعددة الوسائط

مشفّر رؤية مدمج بـ 2.5 مليار معلمة يمكّن تحليل الصور، والإجابة على الأسئلة المرئية، وفهم المستندات بالصور.

تميز متعدد اللغات

دعم أصلي لأكثر من 12 لغة بما في ذلك الإنجليزية، الفرنسية، الإسبانية، الألمانية، الإيطالية، البرتغالية، الهولندية، الصينية، اليابانية، الكورية، والعربية.

🤖

قدرات وكيلية

ميزات وكيلية الأفضل في فئتها مع استدعاء وظائف أصلي ومخرجات JSON منظمة لاستخدام الأدوات المستقل وأتمتة سير العمل.

الالتزام بموجهات النظام

التزام ودعم قوي لموجهات النظام، مما يتيح تحكمًا سلوكيًا دقيقًا وصيانة متسقة للشخصية.

سياق طويل 256 ألف

نافذة سياق ممتدة لفهم المستندات الشامل، والمحادثات الممتدة، والتوليد المعزز بالاسترجاع (RAG).

🔧

استدعاء وظائف أصلي

دعم مدمج لاستدعاء الوظائف مع مخرجات JSON موثوقة للتكامل السلس مع الأدوات الخارجية، واجهات برمجة التطبيقات (APIs)، والخدمات.

مُحسّن لأعباء عمل الإنتاج

بفضل أداء السياق الطويل القوي، والسلوك المستقر والمتسق عبر المجالات، يتفوق Shannon Lite 1.6 في سيناريوهات المؤسسات والبحث المتنوعة.

📄

فهم المستندات الطويلة

معالجة وتحليل المستندات والعقود والتقارير والأوراق البحثية الشاملة باستخدام نافذة السياق 256 ألف

🤖

مساعدو الذكاء الاصطناعي للإنتاج

تشغيل مساعدي الذكاء الاصطناعي اليوميين باستجابات موثوقة ومتسقة واتباع قوي للتعليمات

🔧

سير عمل وكيلية

استخدام أدوات متطور واستدعاء وظائف لتنفيذ المهام المستقل وأتمتة سير العمل

🏢

عمل المعرفة للمؤسسات

سير عمل مؤسسية معقدة تتطلب قدرات ذكاء اصطناعي رائدة مع مخرجات متسقة وموثوقة

💻

مساعد برمجة عام

توليد الكود، تصحيح الأخطاء، التوثيق، ومساعدة في تطوير البرمجيات عبر لغات متعددة

البحث العلمي

مساعدة بحثية، مراجعة الأدبيات، معالجة أعباء العمل العلمية، وتوليد الفرضيات

التوليد المعزز بالاسترجاع

أداء أمثل لأنظمة RAG مع تكامل سياق موثوق وتوليف استرجاع دقيق

🌍

تطبيقات متعددة اللغات

تطبيقات مؤسسية عالمية تتطلب جودة متسقة عبر أكثر من 12 لغة مدعومة

Shannon Lite مقابل Shannon Pro

اختر نموذج Shannon المناسب لاحتياجاتك. يقدم Shannon Lite نشرًا فعالاً من حيث التكلفة للمؤسسات، بينما Shannon Pro يوفر أقصى قدرة مع استدلال متقدم لسلسلة الأفكار ودعم المهارات.

الميزة Shannon Lite 1.6 Shannon Pro 1.6
النموذج الأساسي Mistral Large 3 (675B) Mistral Large 3 (675B)
المعلمات النشطة 41 مليار (MoE حبيبي) 41 مليار (MoE حبيبي)
الدقة NVFP4 (4 بت) BF16 كامل (16 بت)
بيانات ما بعد التدريب 2,500 مخرج من Claude Opus 4.5 آثار تفكير KIMI K2
طريقة ما بعد التدريب الضبط الدقيق تحت الإشراف GRPO (تحسين السياسة النسبية للمجموعة)
وضع الاستدلال قياسي آثار سلسلة التفكير
دعم المهارات - للمحترفين فقطالمهارات الأصلية
النشر H100/A100 (عقدة واحدة) B200/H200 (FP8)
الأفضل لـ ذكاء اصطناعي فعال من حيث التكلفة للمؤسسات أقصى قدرة + استدلال

هل تحتاج إلى استدلال ومهارات متقدمة؟

يتميز Shannon Pro 1.6 بآثار تفكير KIMI K2 مع تدريب GRPO لاستدلال شفاف بسلسلة التفكير، بالإضافة إلى دعم المهارات الأصلية لسير عمل الذكاء الاصطناعي المخصص.

استكشف Shannon Pro

جرب Shannon Lite 1.6

قدرات الذكاء الاصطناعي الرائدة مع تحديد كمي NVFP4 فعال من حيث التكلفة. انشر على بنية تحتية H100 أو A100 لأداء على مستوى المؤسسات بتكلفة معقولة.

كل روابط الأبحاث