Mes nesaugome ir nepasiekiame jokios naudotojų informacijos, taip pat nesuspenduojame paskyrų, nebent law enforcement priverstų mus imtis veiksmų.
NVFP4 Kvantizuotas – Ekonomiškas įmonės DI

ShannonLite 1.6

Ekonomiškas įmonės DI, varomasMistral Large 3su675B bendrų parametrųir41B aktyvių parametrųper granuliuotą Ekspertų Mišinio architektūrą. Po apmokymo ant2 500 Claude Opus 4.5 išėjimųišskirtiniam instrukcijų vykdymui.NVFP4 kvantavimasleidžia diegti viename mazge antH100s arba A100s.

675B
Bendri parametrai
41B
Aktyvūs parametrai
NVFP4
Kvantavimas
256K
Kontekstas
2.5B
Vaizdo kodavimo įrenginys
Lite leidimas
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Techninės specifikacijos:
Bazinis modelis Mistral Large 3
Architektūra Granuliuotas MoE
Bendri parametrai 675B
Aktyvūs parametrai 41B
Kvantavimas NVFP4
Po apmokymo Claude Opus 4.5
Apmokymo pavyzdžiai 2,500

Mistral Large 3: Granuliuotas Ekspertų Mišinys

Shannon Lite 1.6 yra pastatytas ant Mistral Large 3, pažangiausio daugiamodalinio granuliuoto Ekspertų Mišinio modelio, sukurto nuo pat pradžių patikimumui, ilgo konteksto supratimui ir gamybos lygio našumui. Instrukcijomis po apmokymo versija yra tiksliai suderinta pokalbių, agentinių ir instrukcijomis pagrįstų naudojimo atvejų.

673B

Kalbos modelis

Granuliuota MoE architektūra su 39B aktyviais parametrais vienam tiesioginiam praleidimui

2.5B

Vaizdo kodavimo įrenginys

Integruotas daugiamodalinis kodavimo įrenginys vaizdų analizei ir vizualiniam supratimui

256K

Konteksto langas

Išplėstas kontekstas išsamiam dokumentų supratimui ir RAG

12+

Kalbos

Anglų, prancūzų, ispanų, vokiečių, kinų, japonų, korėjiečių, arabų ir kitos

Ekonomiškas įmonės diegimas

Shannon Lite 1.6 naudojasi NVIDIA NVFP4 (4 bitų slankiojo kablelio) kvantavimo technologija, siekdama drastiškai sumažinti atminties reikalavimus, išsaugant modelio kokybę. Diegti pažangiausios klasės DI prieinamoje GPU infrastruktūroje be kelių mazgų sudėtingumo.

💰

Sumažintos infrastruktūros išlaidos

NVFP4 kvantavimas sumažina atminties pėdsaką maždaug 4 kartus, palyginti su BF16, leidžiant diegti ant mažiau GPU ir drastiškai sumažinant TCO įmonės DI.

Vieno mazgo diegimas

Diegti visą 675B parametrų modelį viename H100s arba A100s mazge. Jokio sudėtingo kelių mazgų orkestravimo, sumažintos tinklo sąnaudos, supaprastintos operacijos.

Išsaugota modelio kokybė

Pažangios kvantavimo technikos palaiko modelio našumą visose samprotavimo, instrukcijų vykdymo ir daugiamodalinių užduočių srityse su minimaliu kokybės pablogėjimu.

Claude Opus 4.5 Žinių distiliavimas

Shannon Lite 1.6 buvo kruopščiai apmokytas naudojant 2 500 kruopščiai atrinktų išėjimų išClaude Opus 4.5, pažangiausio Anthropic modelio. Šis žinių distiliavimo metodas fiksuoja pažangius samprotavimo modelius, niansuotą instrukcijų interpretavimą ir aukščiausios kokybės atsakymus.

Mistral Large 3 Instruct 2512 Pagrindas

Pastatytas ant pažangiausio Mistral Instruct modelio (versija 2512) BF16 tikslumu. Šis pagrindas suteikia pažangiausio lygio galimybes, sukurtas gamybos lygio asistentams, paieška papildytoms sistemoms, moksliniams darbams ir sudėtingiems įmonės darbo procesams.

BF16 Bazė Instrukcijomis suderintas Paruoštas gamybai Apache 2.0 Licencija

Claude Opus 4.5 Išėjimų distiliavimas

Po apmokymo ant 2 500 aukštos kokybės išėjimų iš Claude Opus 4.5, fiksuojant pažangiausias Anthropic samprotavimo galimybes. Atrinktas duomenų rinkinys orientuojasi į sudėtingą instrukcijų vykdymą, niansuotą supratimą ir aukštos kokybės atsakymų generavimą įvairiose srityse.

2 500 Pavyzdžiai Atrinktas duomenų rinkinys Dėmesys kokybei Įvairios sritys

NVFP4 kvantavimo procesas

Pažangi NVIDIA FP4 kvantizacija, taikoma po apmokymo, siekiant sumažinti atminties pėdsaką, išlaikant modelio kokybę. Kalibruota specialiai apmokytiems svoriams, siekiant išsaugoti Claude Opus 4.5 žinių perdavimą ir gebėjimus vykdyti instrukcijas.

NVFP4 4 bitų tikslumas Kalibruota Kokybė išsaugota

Vertinimas ir patvirtinimas

Išsamus vertinimas pagal instrukcijų vykdymo etalonus, samprotavimo užduotis ir realaus pasaulio įmonių scenarijus. Patvirtinta nuosekliam elgesiui įvairiose srityse, stabiliems rezultatams ir patikimam veikimui gamybos aplinkoje.

Išbandyta etalonais Įvairių sričių Patvirtinta gamybai Stabilūs rezultatai

Lanksčios GPU diegimo parinktys

Shannon Lite 1.6 su NVFP4 kvantizacija leidžia ekonomiškai efektyviai diegti pramonės standartinėse NVIDIA GPU konfigūracijose, padarant pažangųjį dirbtinį intelektą prieinamą įmonių diegimams, nereikalaujant brangių kelių mazgų klasterių.

NVIDIA H100 SXM

Optimalus našumas su Hopper architektūra ir HBM3 atmintimi

Vienas mazgas (8x H100)
NVFP4 tikslumas
80GB HBM3 vienam GPU
Maksimalus pralaidumas

NVIDIA A100 SXM

Įrodytas patikimumas su Ampere architektūros GPU

Vienas mazgas (8x A100)
NVFP4 tikslumas
80GB HBM2e vienam GPU
Ekonomiškai efektyvus

Shannon Cloud

Visiškai valdomas diegimas be infrastruktūros

Momentinė prieiga
Automatinis mastelio keitimas
Paruošta REST API
99.9% SLA

Įmonėms paruoštos DI funkcijos

Shannon Lite 1.6 suteikia pažangias galimybes, paveldėtas iš Mistral Large 3 ir patobulintas per Claude Opus 4.5 po apmokymo, optimizuotas gamybos darbo krūviams įvairiuose įmonių scenarijuose.

Daugiarūšė vizija

Integruotas 2,5 mlrd. parametrų vaizdo kodavimo įrenginys leidžia atlikti vaizdų analizę, vizualinį klausimų atsakymą ir dokumentų supratimą su vaizdais.

Daugiakalbė kompetencija

Gimtoji parama 12+ kalbų, įskaitant anglų, prancūzų, ispanų, vokiečių, italų, portugalų, olandų, kinų, japonų, korėjiečių ir arabų.

🤖

Agentinės galimybės

Geriausios klasės agentinės funkcijos su gimtuoju funkcijų iškvietimu ir struktūrizuota JSON išvestimi autonominiam įrankių naudojimui ir darbo eigos automatizavimui.

Sistemos raginimų laikymasis

Stiprus sistemos raginimų laikymasis ir palaikymas, leidžiantis tiksliai kontroliuoti elgesį ir nuosekliai palaikyti asmenybę.

256K ilgas kontekstas

Išplėstas konteksto langas išsamiam dokumentų supratimui, išplėstiniams pokalbiams ir paieška papildytai generacijai (RAG).

🔧

Gimtasis funkcijų iškvietimas

Integruotas funkcijų iškvietimo palaikymas su patikima JSON išvestimi, skirta sklandžiam integravimui su išoriniais įrankiais, API ir paslaugomis.

Optimizuota gamybos darbo krūviams

Su galingu ilgo konteksto našumu, stabiliu ir nuosekliu elgesiu įvairiose srityse, Shannon Lite 1.6 puikiai tinka įvairiems įmonių ir tyrimų scenarijams.

📄

Ilgų dokumentų supratimas

Apdoroti ir analizuoti išsamius dokumentus, sutartis, ataskaitas ir mokslinius straipsnius su 256K konteksto langu

🤖

Gamybos DI asistentai

Palaikyti kasdienius DI asistentus patikimais, nuosekliais atsakymais ir stipriu instrukcijų vykdymu

🔧

Agentinės darbo eigos

Pažangiausias įrankių naudojimas ir funkcijų iškvietimas autonominiam užduočių vykdymui ir darbo eigos automatizavimui

🏢

Įmonės žinių darbas

Sudėtingos įmonės darbo eigos, reikalaujančios pažangių DI galimybių su nuosekliais, patikimais rezultatais

💻

Bendrasis kodavimo asistentas

Kodo generavimas, derinimas, dokumentavimas ir programinės įrangos kūrimo pagalba keliomis kalbomis

Moksliniai tyrimai

Tyrimų pagalba, literatūros apžvalga, mokslinio darbo krūvio apdorojimas ir hipotezių generavimas

Paieška papildyta generacija

Optimalus našumas RAG sistemoms su patikima konteksto integracija ir tikslia paieškos sinteze

🌍

Daugiakalbės programos

Pasaulinės įmonės programos, reikalaujančios nuoseklios kokybės 12+ palaikomų kalbų

Shannon Lite prieš Shannon Pro

Pasirinkite tinkamą Shannon modelį savo poreikiams. Shannon Lite siūlo ekonomiškai efektyvų įmonės diegimą, o Shannon Pro suteikia maksimalias galimybes su pažangiu mąstymo grandinės samprotavimu ir įgūdžių palaikymu.

Funkcija Shannon Lite 1.6 Shannon Pro 1.6
Bazinis modelis Mistral Large 3 (675B) Mistral Large 3 (675B)
Aktyvūs parametrai 41B (Granuliuotas MoE) 41B (Granuliuotas MoE)
Tikslumas NVFP4 (4 bitų) Pilnas BF16 (16 bitų)
Duomenys po apmokymo 2,500 Claude Opus 4.5 išėjimų KIMI K2 mąstymo pėdsakai
Metodas po apmokymo Prižiūrimas tikslinimas GRPO (Grupės santykinės politikos optimizavimas)
Mąstymo režimas Standartinis Mąstymo grandinės pėdsakai
Įgūdžių palaikymas - Tik ProVietiniai įgūdžiai
Diegimas H100/A100 (Vienas mazgas) B200/H200 (FP8)
Geriausiai tinka Ekonomiškas įmonės dirbtinis intelektas Maksimalus pajėgumas + mąstymas

Reikia pažangaus mąstymo ir įgūdžių?

Shannon Pro 1.6 pasižymi KIMI K2 mąstymo pėdsakais su GRPO apmokymu skaidriam mąstymo grandinės samprotavimui, plius vietinių įgūdžių palaikymu pritaikytoms DI darbo eigoms.

Naršyti Shannon Pro

Išbandykite Shannon Lite 1.6

Pažangios DI galimybės su ekonomiškais NVFP4 kvantavimu. Diegti H100 arba A100 infrastruktūroje įmonės lygio našumui prieinama kaina.

Visos research links