ShannonLite 1.6
Ekonomiškas įmonės DI, varomasMistral Large 3su675B bendrų parametrųir41B aktyvių parametrųper granuliuotą Ekspertų Mišinio architektūrą. Po apmokymo ant2 500 Claude Opus 4.5 išėjimųišskirtiniam instrukcijų vykdymui.NVFP4 kvantavimasleidžia diegti viename mazge antH100s arba A100s.
Mistral Large 3: Granuliuotas Ekspertų Mišinys
Shannon Lite 1.6 yra pastatytas ant Mistral Large 3, pažangiausio daugiamodalinio granuliuoto Ekspertų Mišinio modelio, sukurto nuo pat pradžių patikimumui, ilgo konteksto supratimui ir gamybos lygio našumui. Instrukcijomis po apmokymo versija yra tiksliai suderinta pokalbių, agentinių ir instrukcijomis pagrįstų naudojimo atvejų.
Kalbos modelis
Granuliuota MoE architektūra su 39B aktyviais parametrais vienam tiesioginiam praleidimui
Vaizdo kodavimo įrenginys
Integruotas daugiamodalinis kodavimo įrenginys vaizdų analizei ir vizualiniam supratimui
Konteksto langas
Išplėstas kontekstas išsamiam dokumentų supratimui ir RAG
Kalbos
Anglų, prancūzų, ispanų, vokiečių, kinų, japonų, korėjiečių, arabų ir kitos
Ekonomiškas įmonės diegimas
Shannon Lite 1.6 naudojasi NVIDIA NVFP4 (4 bitų slankiojo kablelio) kvantavimo technologija, siekdama drastiškai sumažinti atminties reikalavimus, išsaugant modelio kokybę. Diegti pažangiausios klasės DI prieinamoje GPU infrastruktūroje be kelių mazgų sudėtingumo.
Sumažintos infrastruktūros išlaidos
NVFP4 kvantavimas sumažina atminties pėdsaką maždaug 4 kartus, palyginti su BF16, leidžiant diegti ant mažiau GPU ir drastiškai sumažinant TCO įmonės DI.
Vieno mazgo diegimas
Diegti visą 675B parametrų modelį viename H100s arba A100s mazge. Jokio sudėtingo kelių mazgų orkestravimo, sumažintos tinklo sąnaudos, supaprastintos operacijos.
Išsaugota modelio kokybė
Pažangios kvantavimo technikos palaiko modelio našumą visose samprotavimo, instrukcijų vykdymo ir daugiamodalinių užduočių srityse su minimaliu kokybės pablogėjimu.
Claude Opus 4.5 Žinių distiliavimas
Shannon Lite 1.6 buvo kruopščiai apmokytas naudojant 2 500 kruopščiai atrinktų išėjimų išClaude Opus 4.5, pažangiausio Anthropic modelio. Šis žinių distiliavimo metodas fiksuoja pažangius samprotavimo modelius, niansuotą instrukcijų interpretavimą ir aukščiausios kokybės atsakymus.
Mistral Large 3 Instruct 2512 Pagrindas
Pastatytas ant pažangiausio Mistral Instruct modelio (versija 2512) BF16 tikslumu. Šis pagrindas suteikia pažangiausio lygio galimybes, sukurtas gamybos lygio asistentams, paieška papildytoms sistemoms, moksliniams darbams ir sudėtingiems įmonės darbo procesams.
Claude Opus 4.5 Išėjimų distiliavimas
Po apmokymo ant 2 500 aukštos kokybės išėjimų iš Claude Opus 4.5, fiksuojant pažangiausias Anthropic samprotavimo galimybes. Atrinktas duomenų rinkinys orientuojasi į sudėtingą instrukcijų vykdymą, niansuotą supratimą ir aukštos kokybės atsakymų generavimą įvairiose srityse.
NVFP4 kvantavimo procesas
Pažangi NVIDIA FP4 kvantizacija, taikoma po apmokymo, siekiant sumažinti atminties pėdsaką, išlaikant modelio kokybę. Kalibruota specialiai apmokytiems svoriams, siekiant išsaugoti Claude Opus 4.5 žinių perdavimą ir gebėjimus vykdyti instrukcijas.
Vertinimas ir patvirtinimas
Išsamus vertinimas pagal instrukcijų vykdymo etalonus, samprotavimo užduotis ir realaus pasaulio įmonių scenarijus. Patvirtinta nuosekliam elgesiui įvairiose srityse, stabiliems rezultatams ir patikimam veikimui gamybos aplinkoje.
Lanksčios GPU diegimo parinktys
Shannon Lite 1.6 su NVFP4 kvantizacija leidžia ekonomiškai efektyviai diegti pramonės standartinėse NVIDIA GPU konfigūracijose, padarant pažangųjį dirbtinį intelektą prieinamą įmonių diegimams, nereikalaujant brangių kelių mazgų klasterių.
NVIDIA H100 SXM
Optimalus našumas su Hopper architektūra ir HBM3 atmintimi
NVIDIA A100 SXM
Įrodytas patikimumas su Ampere architektūros GPU
Shannon Cloud
Visiškai valdomas diegimas be infrastruktūros
Įmonėms paruoštos DI funkcijos
Shannon Lite 1.6 suteikia pažangias galimybes, paveldėtas iš Mistral Large 3 ir patobulintas per Claude Opus 4.5 po apmokymo, optimizuotas gamybos darbo krūviams įvairiuose įmonių scenarijuose.
Daugiarūšė vizija
Integruotas 2,5 mlrd. parametrų vaizdo kodavimo įrenginys leidžia atlikti vaizdų analizę, vizualinį klausimų atsakymą ir dokumentų supratimą su vaizdais.
Daugiakalbė kompetencija
Gimtoji parama 12+ kalbų, įskaitant anglų, prancūzų, ispanų, vokiečių, italų, portugalų, olandų, kinų, japonų, korėjiečių ir arabų.
Agentinės galimybės
Geriausios klasės agentinės funkcijos su gimtuoju funkcijų iškvietimu ir struktūrizuota JSON išvestimi autonominiam įrankių naudojimui ir darbo eigos automatizavimui.
Sistemos raginimų laikymasis
Stiprus sistemos raginimų laikymasis ir palaikymas, leidžiantis tiksliai kontroliuoti elgesį ir nuosekliai palaikyti asmenybę.
256K ilgas kontekstas
Išplėstas konteksto langas išsamiam dokumentų supratimui, išplėstiniams pokalbiams ir paieška papildytai generacijai (RAG).
Gimtasis funkcijų iškvietimas
Integruotas funkcijų iškvietimo palaikymas su patikima JSON išvestimi, skirta sklandžiam integravimui su išoriniais įrankiais, API ir paslaugomis.
Optimizuota gamybos darbo krūviams
Su galingu ilgo konteksto našumu, stabiliu ir nuosekliu elgesiu įvairiose srityse, Shannon Lite 1.6 puikiai tinka įvairiems įmonių ir tyrimų scenarijams.
Ilgų dokumentų supratimas
Apdoroti ir analizuoti išsamius dokumentus, sutartis, ataskaitas ir mokslinius straipsnius su 256K konteksto langu
Gamybos DI asistentai
Palaikyti kasdienius DI asistentus patikimais, nuosekliais atsakymais ir stipriu instrukcijų vykdymu
Agentinės darbo eigos
Pažangiausias įrankių naudojimas ir funkcijų iškvietimas autonominiam užduočių vykdymui ir darbo eigos automatizavimui
Įmonės žinių darbas
Sudėtingos įmonės darbo eigos, reikalaujančios pažangių DI galimybių su nuosekliais, patikimais rezultatais
Bendrasis kodavimo asistentas
Kodo generavimas, derinimas, dokumentavimas ir programinės įrangos kūrimo pagalba keliomis kalbomis
Moksliniai tyrimai
Tyrimų pagalba, literatūros apžvalga, mokslinio darbo krūvio apdorojimas ir hipotezių generavimas
Paieška papildyta generacija
Optimalus našumas RAG sistemoms su patikima konteksto integracija ir tikslia paieškos sinteze
Daugiakalbės programos
Pasaulinės įmonės programos, reikalaujančios nuoseklios kokybės 12+ palaikomų kalbų
Shannon Lite prieš Shannon Pro
Pasirinkite tinkamą Shannon modelį savo poreikiams. Shannon Lite siūlo ekonomiškai efektyvų įmonės diegimą, o Shannon Pro suteikia maksimalias galimybes su pažangiu mąstymo grandinės samprotavimu ir įgūdžių palaikymu.
| Funkcija | Shannon Lite 1.6 | Shannon Pro 1.6 |
|---|---|---|
| Bazinis modelis | Mistral Large 3 (675B) | Mistral Large 3 (675B) |
| Aktyvūs parametrai | 41B (Granuliuotas MoE) | 41B (Granuliuotas MoE) |
| Tikslumas | NVFP4 (4 bitų) | Pilnas BF16 (16 bitų) |
| Duomenys po apmokymo | 2,500 Claude Opus 4.5 išėjimų | KIMI K2 mąstymo pėdsakai |
| Metodas po apmokymo | Prižiūrimas tikslinimas | GRPO (Grupės santykinės politikos optimizavimas) |
| Mąstymo režimas | Standartinis | Mąstymo grandinės pėdsakai |
| Įgūdžių palaikymas | - | Tik ProVietiniai įgūdžiai |
| Diegimas | H100/A100 (Vienas mazgas) | B200/H200 (FP8) |
| Geriausiai tinka | Ekonomiškas įmonės dirbtinis intelektas | Maksimalus pajėgumas + mąstymas |
Išbandykite Shannon Lite 1.6
Pažangios DI galimybės su ekonomiškais NVFP4 kvantavimu. Diegti H100 arba A100 infrastruktūroje įmonės lygio našumui prieinama kaina.