Mes nesaugome ir nepasiekiame jokios naudotojų informacijos, taip pat nesuspenduojame paskyrų, nebent law enforcement priverstų mus imtis veiksmų.

NVFP4 Kvantizuotas – Ekonomiškas įmonės DI

ShannonLite 1.6

Ekonomiškas įmonės DI, varomasMistral Large 3su675B bendrų parametrųir41B aktyvių parametrųper granuliuotą Ekspertų Mišinio architektūrą. Po apmokymo ant2 500 Claude Opus 4.5 išėjimųišskirtiniam instrukcijų vykdymui.NVFP4 kvantavimasleidžia diegti viename mazge antH100s arba A100s.

675B

Bendri parametrai

41B

Aktyvūs parametrai

NVFP4

Kvantavimas

256K

Kontekstas

2.5B

Vaizdo kodavimo įrenginys

Išbandykite Shannon Lite Peržiūrėti dokumentaciją

Lite leidimas

Shannon Lite 1.6

v1.6.0-lite-nvfp4

Bazinis modelis Mistral Large 3

Architektūra Granuliuotas MoE

Bendri parametrai 675B

Aktyvūs parametrai 41B

Kvantavimas NVFP4

Po apmokymo Claude Opus 4.5

Apmokymo pavyzdžiai 2,500

Techninė architektūra

Mistral Large 3: Granuliuotas Ekspertų Mišinys

Shannon Lite 1.6 yra pastatytas ant Mistral Large 3, pažangiausio daugiamodalinio granuliuoto Ekspertų Mišinio modelio, sukurto nuo pat pradžių patikimumui, ilgo konteksto supratimui ir gamybos lygio našumui. Instrukcijomis po apmokymo versija yra tiksliai suderinta pokalbių, agentinių ir instrukcijomis pagrįstų naudojimo atvejų.

673B

Kalbos modelis

Granuliuota MoE architektūra su 39B aktyviais parametrais vienam tiesioginiam praleidimui

2.5B

Vaizdo kodavimo įrenginys

Integruotas daugiamodalinis kodavimo įrenginys vaizdų analizei ir vizualiniam supratimui

256K

Konteksto langas

Išplėstas kontekstas išsamiam dokumentų supratimui ir RAG

12+

Kalbos

Anglų, prancūzų, ispanų, vokiečių, kinų, japonų, korėjiečių, arabų ir kitos

NVFP4 Kvantavimas

Ekonomiškas įmonės diegimas

Shannon Lite 1.6 naudojasi NVIDIA NVFP4 (4 bitų slankiojo kablelio) kvantavimo technologija, siekdama drastiškai sumažinti atminties reikalavimus, išsaugant modelio kokybę. Diegti pažangiausios klasės DI prieinamoje GPU infrastruktūroje be kelių mazgų sudėtingumo.

💰

Sumažintos infrastruktūros išlaidos

NVFP4 kvantavimas sumažina atminties pėdsaką maždaug 4 kartus, palyginti su BF16, leidžiant diegti ant mažiau GPU ir drastiškai sumažinant TCO įmonės DI.

Vieno mazgo diegimas

Diegti visą 675B parametrų modelį viename H100s arba A100s mazge. Jokio sudėtingo kelių mazgų orkestravimo, sumažintos tinklo sąnaudos, supaprastintos operacijos.

Išsaugota modelio kokybė

Pažangios kvantavimo technikos palaiko modelio našumą visose samprotavimo, instrukcijų vykdymo ir daugiamodalinių užduočių srityse su minimaliu kokybės pablogėjimu.

Po apmokymo metodika

Claude Opus 4.5 Žinių distiliavimas

Shannon Lite 1.6 buvo kruopščiai apmokytas naudojant 2 500 kruopščiai atrinktų išėjimų išClaude Opus 4.5, pažangiausio Anthropic modelio. Šis žinių distiliavimo metodas fiksuoja pažangius samprotavimo modelius, niansuotą instrukcijų interpretavimą ir aukščiausios kokybės atsakymus.

Mistral Large 3 Instruct 2512 Pagrindas

Pastatytas ant pažangiausio Mistral Instruct modelio (versija 2512) BF16 tikslumu. Šis pagrindas suteikia pažangiausio lygio galimybes, sukurtas gamybos lygio asistentams, paieška papildytoms sistemoms, moksliniams darbams ir sudėtingiems įmonės darbo procesams.

BF16 Bazė Instrukcijomis suderintas Paruoštas gamybai Apache 2.0 Licencija

Claude Opus 4.5 Išėjimų distiliavimas

Po apmokymo ant 2 500 aukštos kokybės išėjimų iš Claude Opus 4.5, fiksuojant pažangiausias Anthropic samprotavimo galimybes. Atrinktas duomenų rinkinys orientuojasi į sudėtingą instrukcijų vykdymą, niansuotą supratimą ir aukštos kokybės atsakymų generavimą įvairiose srityse.

2 500 Pavyzdžiai Atrinktas duomenų rinkinys Dėmesys kokybei Įvairios sritys

NVFP4 kvantavimo procesas

Pažangi NVIDIA FP4 kvantizacija, taikoma po apmokymo, siekiant sumažinti atminties pėdsaką, išlaikant modelio kokybę. Kalibruota specialiai apmokytiems svoriams, siekiant išsaugoti Claude Opus 4.5 žinių perdavimą ir gebėjimus vykdyti instrukcijas.

NVFP4 4 bitų tikslumas Kalibruota Kokybė išsaugota

Vertinimas ir patvirtinimas

Išsamus vertinimas pagal instrukcijų vykdymo etalonus, samprotavimo užduotis ir realaus pasaulio įmonių scenarijus. Patvirtinta nuosekliam elgesiui įvairiose srityse, stabiliems rezultatams ir patikimam veikimui gamybos aplinkoje.

Išbandyta etalonais Įvairių sričių Patvirtinta gamybai Stabilūs rezultatai

Diegimo infrastruktūra

Lanksčios GPU diegimo parinktys

Shannon Lite 1.6 su NVFP4 kvantizacija leidžia ekonomiškai efektyviai diegti pramonės standartinėse NVIDIA GPU konfigūracijose, padarant pažangųjį dirbtinį intelektą prieinamą įmonių diegimams, nereikalaujant brangių kelių mazgų klasterių.

NVIDIA H100 SXM

Optimalus našumas su Hopper architektūra ir HBM3 atmintimi

Vienas mazgas (8x H100)

NVFP4 tikslumas

80GB HBM3 vienam GPU

Maksimalus pralaidumas

NVIDIA A100 SXM

Įrodytas patikimumas su Ampere architektūros GPU

Vienas mazgas (8x A100)

NVFP4 tikslumas

80GB HBM2e vienam GPU

Ekonomiškai efektyvus

Shannon Cloud

Visiškai valdomas diegimas be infrastruktūros

Momentinė prieiga

Automatinis mastelio keitimas

Paruošta REST API

99.9% SLA

Modelio galimybės

Įmonėms paruoštos DI funkcijos

Shannon Lite 1.6 suteikia pažangias galimybes, paveldėtas iš Mistral Large 3 ir patobulintas per Claude Opus 4.5 po apmokymo, optimizuotas gamybos darbo krūviams įvairiuose įmonių scenarijuose.

Daugiarūšė vizija

Integruotas 2,5 mlrd. parametrų vaizdo kodavimo įrenginys leidžia atlikti vaizdų analizę, vizualinį klausimų atsakymą ir dokumentų supratimą su vaizdais.

Daugiakalbė kompetencija

Gimtoji parama 12+ kalbų, įskaitant anglų, prancūzų, ispanų, vokiečių, italų, portugalų, olandų, kinų, japonų, korėjiečių ir arabų.

🤖

Agentinės galimybės

Geriausios klasės agentinės funkcijos su gimtuoju funkcijų iškvietimu ir struktūrizuota JSON išvestimi autonominiam įrankių naudojimui ir darbo eigos automatizavimui.

Sistemos raginimų laikymasis

Stiprus sistemos raginimų laikymasis ir palaikymas, leidžiantis tiksliai kontroliuoti elgesį ir nuosekliai palaikyti asmenybę.

256K ilgas kontekstas

Išplėstas konteksto langas išsamiam dokumentų supratimui, išplėstiniams pokalbiams ir paieška papildytai generacijai (RAG).

🔧

Gimtasis funkcijų iškvietimas

Integruotas funkcijų iškvietimo palaikymas su patikima JSON išvestimi, skirta sklandžiam integravimui su išoriniais įrankiais, API ir paslaugomis.

Naudojimo atvejai

Optimizuota gamybos darbo krūviams

Su galingu ilgo konteksto našumu, stabiliu ir nuosekliu elgesiu įvairiose srityse, Shannon Lite 1.6 puikiai tinka įvairiems įmonių ir tyrimų scenarijams.

📄

Ilgų dokumentų supratimas

Apdoroti ir analizuoti išsamius dokumentus, sutartis, ataskaitas ir mokslinius straipsnius su 256K konteksto langu

🤖

Gamybos DI asistentai

Palaikyti kasdienius DI asistentus patikimais, nuosekliais atsakymais ir stipriu instrukcijų vykdymu

🔧

Agentinės darbo eigos

Pažangiausias įrankių naudojimas ir funkcijų iškvietimas autonominiam užduočių vykdymui ir darbo eigos automatizavimui

🏢

Įmonės žinių darbas

Sudėtingos įmonės darbo eigos, reikalaujančios pažangių DI galimybių su nuosekliais, patikimais rezultatais

💻

Bendrasis kodavimo asistentas

Kodo generavimas, derinimas, dokumentavimas ir programinės įrangos kūrimo pagalba keliomis kalbomis

Moksliniai tyrimai

Tyrimų pagalba, literatūros apžvalga, mokslinio darbo krūvio apdorojimas ir hipotezių generavimas

Paieška papildyta generacija

Optimalus našumas RAG sistemoms su patikima konteksto integracija ir tikslia paieškos sinteze

🌍

Daugiakalbės programos

Pasaulinės įmonės programos, reikalaujančios nuoseklios kokybės 12+ palaikomų kalbų

Modelių palyginimas

Shannon Lite prieš Shannon Pro

Pasirinkite tinkamą Shannon modelį savo poreikiams. Shannon Lite siūlo ekonomiškai efektyvų įmonės diegimą, o Shannon Pro suteikia maksimalias galimybes su pažangiu mąstymo grandinės samprotavimu ir įgūdžių palaikymu.

Funkcija	Shannon Lite 1.6	Shannon Pro 1.6
Bazinis modelis	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Aktyvūs parametrai	41B (Granuliuotas MoE)	41B (Granuliuotas MoE)
Tikslumas	NVFP4 (4 bitų)	Pilnas BF16 (16 bitų)
Duomenys po apmokymo	2,500 Claude Opus 4.5 išėjimų	KIMI K2 mąstymo pėdsakai
Metodas po apmokymo	Prižiūrimas tikslinimas	GRPO (Grupės santykinės politikos optimizavimas)
Mąstymo režimas	Standartinis	Mąstymo grandinės pėdsakai
Įgūdžių palaikymas	-	Tik ProVietiniai įgūdžiai
Diegimas	H100/A100 (Vienas mazgas)	B200/H200 (FP8)
Geriausiai tinka	Ekonomiškas įmonės dirbtinis intelektas	Maksimalus pajėgumas + mąstymas

Išbandykite Shannon Lite 1.6

Pažangios DI galimybės su ekonomiškais NVFP4 kvantavimu. Diegti H100 arba A100 infrastruktūroje įmonės lygio našumui prieinama kaina.

Pradėti naudoti Shannon Lite Palyginti su Pro

Visos research links

Atsakingo naudojimo politika Paslaugų teikimo sąlygos Shannon V1 Subalansuotas Shannon V1 Gilus Shannon V1.5 Mąstymas Shannon V1.5 Gilus Mąstymas Shannon 2 Lite Shannon 2 Pro Shannon Lite 1.6 Shannon Pro 1.6 Kaip apmokėme Mixtral naudojant GPT-5 Pro per OpenRouter distiliaciją Kaip apmokėme Shannon V1.5 mąstyti naudodami GRPO Įsilaužimo testavimas naudojant AI: Shannon AI dabar dirba su Claude Code Individualus Shannon Projektai Įgūdžiai

ShannonLite 1.6

Mistral Large 3: Granuliuotas Ekspertų Mišinys

Kalbos modelis

Vaizdo kodavimo įrenginys

Konteksto langas

Kalbos

Ekonomiškas įmonės diegimas

Sumažintos infrastruktūros išlaidos

Vieno mazgo diegimas

Išsaugota modelio kokybė

Claude Opus 4.5 Žinių distiliavimas

Mistral Large 3 Instruct 2512 Pagrindas

Claude Opus 4.5 Išėjimų distiliavimas

NVFP4 kvantavimo procesas

Vertinimas ir patvirtinimas

Lanksčios GPU diegimo parinktys

NVIDIA H100 SXM

NVIDIA A100 SXM

Shannon Cloud

Įmonėms paruoštos DI funkcijos

Daugiarūšė vizija

Daugiakalbė kompetencija

Agentinės galimybės

Sistemos raginimų laikymasis

256K ilgas kontekstas

Gimtasis funkcijų iškvietimas

Optimizuota gamybos darbo krūviams

Ilgų dokumentų supratimas

Gamybos DI asistentai

Agentinės darbo eigos

Įmonės žinių darbas

Bendrasis kodavimo asistentas

Moksliniai tyrimai

Paieška papildyta generacija

Daugiakalbės programos

Shannon Lite prieš Shannon Pro

Reikia pažangaus mąstymo ir įgūdžių?

Išbandykite Shannon Lite 1.6

Visos research links