ShannonLite 1.6
AI për ndërmarrje me kosto efektive, mundësuar ngaMistral Large 3me675B parametra totalëdhe41B parametra aktivënëpërmjet arkitekturës granulare Mixture-of-Experts. I post-trajnuar në2,500 dalje të Claude Opus 4.5për ndjekje të shkëlqyer të udhëzimeve.Kuantizimi NVFP4mundëson vendosje me një nyje nëH100s ose A100s.
Mistral Large 3: Përzierje Granulare Ekspertësh
Shannon Lite 1.6 është ndërtuar mbi Mistral Large 3, një model multimodal granular Mixture-of-Experts i avancuar projektuar nga themeli për besueshmëri, kuptim të kontekstit të gjatë dhe performancë të nivelit të prodhimit. Versioni i post-trajnuar me udhëzime është i akorduar imët për raste përdorimi për biseda, agjentë dhe të bazuara në udhëzime.
Modeli i Gjuhës
Arkitekturë Granular MoE me 39B parametra aktivë për kalim përpara
Kodues Vizual
Kodues multimodal i integruar për analizë imazhi dhe kuptim vizual
Dritare Konteksti
Kontekst i zgjeruar për kuptim të plotë të dokumenteve dhe RAG
Gjuhë
Anglisht, Frëngjisht, Spanjisht, Gjermanisht, Kinezisht, Japonisht, Koreançe, Arabisht dhe më shumë
Vendosje për Ndërmarrje me Kosto Efektive
Shannon Lite 1.6 leverages NVIDIA's NVFP4 (4-bit floating point) quantization technology to dramatically reduce memory requirements while preserving model quality. Deploy frontier-class AI on accessible GPU infrastructure without multi-node complexity.
Kosto e Reduktuar e Infrastrukturës
Kuantizimi NVFP4 redukton gjurmën e memories me rreth 4 herë krahasuar me BF16, duke mundësuar vendosjen në më pak GPU dhe duke ulur ndjeshëm TCO-në për AI-në e ndërmarrjes.
Vendosje me Një Nyje
Vendosni modelin e plotë me 675B parametra në një nyje të H100s ose A100s. Pa orkestrim kompleks me shumë nyje, ulje të ngarkesës së rrjetit, operacione të thjeshtuara.
Cilësi e Ruajtur e Modelit
Teknikat e avancuara të kuantizimit ruajnë performancën e modelit në arsyetim, ndjekje udhëzimesh dhe detyra multimodale me degradim minimal të cilësisë.
Distilim i Njohurive Claude Opus 4.5
Shannon Lite 1.6 është post-trajnuar me përpikëri duke përdorur 2,500 dalje të kuruara me kujdes ngaClaude Opus 4.5, modeli më i aftë i Anthropic-ut. Kjo qasje e distilimit të njohurive kap modelet e avancuara të arsyetimit, interpretimin e nuancuar të udhëzimeve dhe cilësinë superiore të përgjigjeve.
Fondacioni Mistral Large 3 Instruct 2512
Ndërtuar mbi modelin Instruct të avancuar të Mistral-it (versioni 2512) në precizion BF16. Ky fondacion ofron aftësi të nivelit kufitar të projektuar për asistentë të nivelit të prodhimit, sisteme të zgjeruara me rikthim, ngarkesa pune shkencore dhe flukse pune komplekse të ndërmarrjeve.
Distilim i Daljeve Claude Opus 4.5
I post-trajnuar në 2,500 dalje me cilësi të lartë nga Claude Opus 4.5, duke kapur aftësitë më të avancuara të arsyetimit të Anthropic-ut. Seti i të dhënave i kuruar fokusohet në ndjekje komplekse udhëzimesh, kuptim të nuancuar dhe gjenerim përgjigjesh me cilësi të lartë nëpër fusha të ndryshme.
Procesi i Kuantizimit NVFP4
Kuantizim i avancuar NVIDIA FP4 i aplikuar pas trajnimit për të reduktuar gjurmën e memories duke ruajtur cilësinë e modelit. Kalibruar posaçërisht për peshat e trajnuara pas trajnimit për të ruajtur transferimin e njohurive dhe aftësitë e ndjekjes së udhëzimeve të Claude Opus 4.5.
Vlerësim & Validim
Vlerësim gjithëpërfshirës nëpër standarde të ndjekjes së udhëzimeve, detyra arsyetimi dhe skenarë realë të ndërmarrjeve. Validuar për sjellje të qëndrueshme ndër-domeniale, dalje të qëndrueshme dhe performancë të besueshme në mjedise prodhimi.
Opsione Fleksibël të Vendosjes së GPU-së
Shannon Lite 1.6 me kuantizim NVFP4 mundëson vendosje me kosto efektive në konfigurime standarde të industrisë të GPU-ve NVIDIA, duke e bërë AI-në kufitare të aksesueshme për vendosje në ndërmarrje pa kërkuar klastera të shtrenjtë me shumë nyje.
NVIDIA H100 SXM
Performancë optimale me arkitekturën Hopper dhe memorien HBM3
NVIDIA A100 SXM
Besueshmëri e provuar në GPU-të me arkitekturë Ampere
Shannon Cloud
Vendosje plotësisht e menaxhuar me zero infrastrukturë
Veçori të AI-së të Gatshme për Ndërmarrje
Shannon Lite 1.6 ofron aftësi kufitare të trashëguara nga Mistral Large 3 dhe të përmirësuara përmes trajnimit pas-trajnimit të Claude Opus 4.5, të optimizuara për ngarkesa pune prodhimi nëpër skenarë të ndryshëm ndërmarrjesh.
Vizion Multimodal
Koduesi i vizionit me 2.5B parametra i integruar mundëson analizën e imazheve, përgjigjen vizuale të pyetjeve dhe kuptimin e dokumenteve me imazhe.
Përsosmëri Shumëgjuhëshe
Mbështetje vendase për 12+ gjuhë duke përfshirë Anglishten, Frëngjishten, Spanjishten, Gjermanishten, Italishten, Portugalishten, Holandishten, Kinezishten, Japonishten, Koreane dhe Arabishten.
Aftësi Agjentike
Veçori agjentike më të mira në klasë me thirrje funksioni vendase dhe dalje JSON të strukturuar për përdorim autonom të mjeteve dhe automatizim të fluksit të punës.
Përmbajtje ndaj Kërkesave të Sistemit
Përmbajtje dhe mbështetje e fortë për kërkesat e sistemit, duke mundësuar kontroll të saktë të sjelljes dhe mirëmbajtje të qëndrueshme të personazhit.
Kontekst i Gjatë 256K
Dritare konteksti e zgjeruar për kuptim gjithëpërfshirës të dokumenteve, biseda të zgjeruara dhe gjenerim të shtuar me rikthim (RAG).
Thirrje Funksioni Vendase
Mbështetje e integruar për thirrje funksioni me dalje JSON të besueshme për integrim të qetë me mjete të jashtme, API dhe shërbime.
Optimizuar për Ngarkesa Pune Prodhimi
Me performancë të fuqishme me kontekst të gjatë, sjellje të qëndrueshme dhe konsistente ndër-domeniale, Shannon Lite 1.6 shkëlqen nëpër skenarë të ndryshëm ndërmarrjesh dhe kërkimorë.
Kuptimi i Dokumenteve të Gjata
Përpunoni dhe analizoni dokumente të gjera, kontrata, raporte dhe punime kërkimore me dritaren e kontekstit 256K
Asistentë AI për Prodhimi
Fuqizoni asistentët AI të përditshëm me përgjigje të besueshme, konsistente dhe ndjekje të fortë të udhëzimeve
Flukse Pune Agjentike
Përdorim i mjeteve dhe thirrje funksioni të nivelit më të lartë për ekzekutim autonom të detyrave dhe automatizim të fluksit të punës
Punë me Njohuri të Ndërmarrjes
Flukse pune komplekse të ndërmarrjes që kërkojnë aftësi kufitare të AI-së me dalje konsistente dhe të besueshme
Asistent i Përgjithshëm Kodimi
Gjenerim kodi, debugim, dokumentim dhe asistencë për zhvillimin e softuerit nëpër gjuhë të shumta
Kërkim Shkencor
Asistencë kërkimore, rishikim literature, përpunim i ngarkesave shkencore dhe gjenerim hipotezash
Gjenerim i Shtuar me Rikthim
Performancë optimale për sistemet RAG me integrim të besueshëm të kontekstit dhe sintezë të saktë të rikthimit
Aplikacione Shumëgjuhëshe
Aplikacione globale të ndërmarrjeve që kërkojnë cilësi konsistente nëpër 12+ gjuhë të mbështetura
Shannon Lite kundrejt Shannon Pro
Zgjidhni modelin e duhur Shannon për nevojat tuaja. Shannon Lite ofron vendosje me kosto efektive për ndërmarrje, ndërsa Shannon Pro ofron aftësi maksimale me arsyetim të avancuar zinxhir-mendimi dhe mbështetje për Aftësitë.
| Veçori | Shannon Lite 1.6 | Shannon Pro 1.6 |
|---|---|---|
| Model Baze | Mistral Large 3 (675B) | Mistral Large 3 (675B) |
| Parametra Aktivë | 41B (MoE Granular) | 41B (MoE Granular) |
| Saktësi | NVFP4 (4-bit) | BF16 i plotë (16-bit) |
| Të dhëna pas trajnimit | 2,500 dalje të Claude Opus 4.5 | Gjurmët e të Menduarit KIMI K2 |
| Metoda pas trajnimit | Rregullim i imët i mbikëqyrur | GRPO (Optimizimi i Politikës Relative të Grupit) |
| Mënyra e arsyetimit | Standard | Gjurmët e Zinxhirit të Mendimit |
| Mbështetje për Aftësitë | - | Vetëm ProAftësi Vendase |
| Vendosja | H100/A100 (Nyje e Vetme) | B200/H200 (FP8) |
| Më e mira për | AI e Korporatës me Kosto Efektive | Kapacitet Maksimal + Arsyetim |
Përjetoni Shannon Lite 1.6
Aftësi të AI kufitare me kuantizim NVFP4 me kosto efektive. Vendosni në infrastrukturën H100 ose A100 për performancë të nivelit të korporatës me kosto të përballueshme.