ShannonLite 1.6
Rentabls uzņēmuma AI, ko darbinaMistral Large 3ar675B kopējiem parametriemun41B aktīvajiem parametriemizmantojot granulētu Ekspertu sajaukuma arhitektūru. Pēcapmācīts uz2,500 Claude Opus 4.5 izejāmizcilai instrukciju izpildei.NVFP4 kvantēšananodrošina viena mezgla izvietošanu uzH100s vai A100s.
Mistral Large 3: Granulēts Ekspertu sajaukums
Shannon Lite 1.6 ir veidots uz Mistral Large 3, mūsdienīga multimodāla granulēta Ekspertu sajaukuma modeļa, kas izstrādāts no pamatiem uzticamībai, ilgtermiņa konteksta izpratnei un ražošanas līmeņa veiktspējai. Instrukciju pēcapmācītā versija ir precizēta tērzēšanas, aģentu un instrukciju balstītiem lietošanas gadījumiem.
Valodu modelis
Granulēta MoE arhitektūra ar 39B aktīvajiem parametriem uz katru pāreju uz priekšu
Vīzijas kodētājs
Integrēts multimodāls kodētājs attēlu analīzei un vizuālai izpratnei
Konteksta logs
Paplašināts konteksts visaptverošai dokumentu izpratnei un RAG
Valodas
Angļu, franču, spāņu, vācu, ķīniešu, japāņu, korejiešu, arābu un citas
Rentabla uzņēmuma izvietošana
Shannon Lite 1.6 izmanto NVIDIA NVFP4 (4 bitu peldošā komata) kvantēšanas tehnoloģiju, lai ievērojami samazinātu atmiņas prasības, vienlaikus saglabājot modeļa kvalitāti. Izvietojiet robežlīmeņa AI uz pieejamas GPU infrastruktūras bez vairāku mezglu sarežģītības.
Samazinātas infrastruktūras izmaksas
NVFP4 kvantēšana samazina atmiņas nospiedumu aptuveni 4 reizes, salīdzinot ar BF16, ļaujot izvietot uz mazākām GPU un ievērojami samazinot TCO uzņēmuma AI.
Viena mezgla izvietošana
Izvietojiet pilnu 675B parametru modeli uz viena H100s vai A100s mezgla. Nav sarežģītas vairāku mezglu orķestrēšanas, samazinātas tīkla pieskaitāmās izmaksas, vienkāršotas darbības.
Saglabāta modeļa kvalitāte
Uzlabotas kvantēšanas tehnikas saglabā modeļa veiktspēju loģiskajā spriešanā, instrukciju izpildē un multimodālajos uzdevumos ar minimālu kvalitātes pasliktināšanos.
Claude Opus 4.5 Zināšanu destilācija
Shannon Lite 1.6 ir rūpīgi pēcapmācīts, izmantojot 2,500 rūpīgi atlasītas izejas noClaude Opus 4.5, Anthropic visspējīgākais modelis. Šī zināšanu destilācijas pieeja uztver uzlabotus spriešanas modeļus, niansētu instrukciju interpretāciju un izcilu atbildes kvalitāti.
Mistral Large 3 Instruct 2512 Pamats
Veidots uz Mistral mūsdienīgā Instruct modeļa (versija 2512) BF16 precizitātē. Šis pamats nodrošina robežlīmeņa iespējas, kas izstrādātas ražošanas līmeņa asistentiem, meklēšanas papildinātām sistēmām, zinātniskām darba slodzēm un sarežģītiem uzņēmuma darbplūsmām.
Claude Opus 4.5 Izejas destilācija
Pēcapmācīts uz 2,500 augstas kvalitātes izejām no Claude Opus 4.5, uztverot Anthropic vismodernākās spriešanas iespējas. Atlasītais datu kopums koncentrējas uz sarežģītu instrukciju izpildi, niansētu izpratni, un augstas kvalitātes atbilžu ģenerēšanu dažādās jomās.
NVFP4 Kvantēšanas process
Uzlabota NVIDIA FP4 kvantēšana, kas tiek pielietota pēc apmācības, lai samazinātu atmiņas patēriņu, vienlaikus saglabājot modeļa kvalitāti. Kalibrēta īpaši apmācītajiem svariem, lai saglabātu Claude Opus 4.5 zināšanu pārnesi un spēju sekot instrukcijām.
Novērtēšana un validācija
Visaptveroša novērtēšana, izmantojot instrukciju izpildes etalonus, spriešanas uzdevumus un reālās pasaules uzņēmumu scenārijus. Validēts konsekventai starpdomēnu uzvedībai, stabilām izvades datiem un uzticamai veiktspējai ražošanas vidēs.
Elastīgas GPU izvietošanas iespējas
Shannon Lite 1.6 ar NVFP4 kvantēšanu nodrošina rentablu izvietošanu uz nozares standarta NVIDIA GPU konfigurācijām, padarot robežlīmeņa AI pieejamu uzņēmumu izvietošanai, neprasot dārgus daudzkodolu klasterus.
NVIDIA H100 SXM
Optimāla veiktspēja ar Hopper arhitektūru un HBM3 atmiņu
NVIDIA A100 SXM
Pierādīta uzticamība Ampere arhitektūras GPU
Shannon Cloud
Pilnībā pārvaldīta izvietošana bez infrastruktūras
Uzņēmumiem gatavas AI funkcijas
Shannon Lite 1.6 nodrošina robežlīmeņa iespējas, kas mantotas no Mistral Large 3 un uzlabotas, izmantojot Claude Opus 4.5 pēcapmācību, optimizētas ražošanas darba slodzēm dažādos uzņēmumu scenārijos.
Daudzmodālu redze
Integrēts 2,5 miljardu parametru redzes kodētājs nodrošina attēlu analīzi, vizuālu jautājumu atbildēšanu un dokumentu izpratni ar attēliem.
Daudzvalodu izcilība
Vietējais atbalsts vairāk nekā 12 valodām, tostarp angļu, franču, spāņu, vācu, itāļu, portugāļu, holandiešu, ķīniešu, japāņu, korejiešu un arābu.
Aģentiskās iespējas
Labākās klases aģentiskās funkcijas ar vietējo funkciju izsaukšanu un strukturētu JSON izvadi autonomai rīku lietošanai un darbplūsmas automatizācijai.
Sistēmas uzvedņu ievērošana
Spēcīga sistēmas uzvedņu ievērošana un atbalsts, nodrošinot precīzu uzvedības kontroli un konsekventu personas uzturēšanu.
256K garš konteksts
Paplašināts konteksta logs visaptverošai dokumentu izpratnei, pagarinātām sarunām un meklēšanas papildinātai ģenerēšanai (RAG).
Vietējā funkciju izsaukšana
Iebūvēts funkciju izsaukšanas atbalsts ar uzticamu JSON izvadi netraucētai integrācijai ar ārējiem rīkiem, API un pakalpojumiem.
Optimizēts ražošanas darba slodzēm
Ar jaudīgu garā konteksta veiktspēju, stabilu un konsekventu starpdomēnu uzvedību, Shannon Lite 1.6 izceļas dažādos uzņēmumu un pētniecības scenārijos.
Garā dokumenta izpratne
Apstrādājiet un analizējiet plašus dokumentus, līgumus, ziņojumus un pētniecības darbus ar 256K konteksta logu
Ražošanas AI asistenti
Nodrošiniet ikdienas AI asistentus ar uzticamām, konsekventām atbildēm un spēcīgu instrukciju izpildi
Aģentiskās darbplūsmas
Mūsdienīga rīku lietošana un funkciju izsaukšana autonomai uzdevumu izpildei un darbplūsmas automatizācijai
Uzņēmuma zināšanu darbs
Sarežģītas uzņēmuma darbplūsmas, kas prasa robežlīmeņa AI iespējas ar konsekventām, uzticamām izvades datiem
Vispārējais kodēšanas asistents
Koda ģenerēšana, atkļūdošana, dokumentācija un programmatūras izstrādes palīdzība vairākās valodās
Zinātniskā pētniecība
Pētniecības palīdzība, literatūras apskats, zinātnisko darba slodžu apstrāde un hipotēžu ģenerēšana
Meklēšanas papildināta ģenerēšana
Optimāla veiktspēja RAG sistēmām ar uzticamu konteksta integrāciju un precīzu meklēšanas sintēzi
Daudzvalodu lietojumprogrammas
Globālas uzņēmumu lietojumprogrammas, kas prasa konsekventu kvalitāti vairāk nekā 12 atbalstītajās valodās
Shannon Lite pret Shannon Pro
Izvēlieties savām vajadzībām piemērotāko Shannon modeli. Shannon Lite piedāvā rentablu uzņēmuma izvietošanu, savukārt Shannon Pro nodrošina maksimālas iespējas ar uzlabotu domu ķēdes spriešanu un prasmju atbalstu.
| Funkcija | Shannon Lite 1.6 | Shannon Pro 1.6 |
|---|---|---|
| Bāzes modelis | Mistral Large 3 (675B) | Mistral Large 3 (675B) |
| Aktīvie parametri | 41B (Granulārs MoE) | 41B (Granulārs MoE) |
| Precizitāte | NVFP4 (4-bit) | Pilns BF16 (16-bit) |
| Pēcapmācības dati | 2500 Claude Opus 4.5 izvades | KIMI K2 Domāšanas pēdas |
| Pēcapmācības metode | Uzraudzīta precizēšana | GRPO (Grupas relatīvās politikas optimizācija) |
| Spriešanas režīms | Standarta | Domu ķēdes pēdas |
| Prasmju atbalsts | - | Tikai ProVietējās prasmes |
| Izvietošana | H100/A100 (Viens mezgls) | B200/H200 (FP8) |
| Vislabāk piemērots | Rentabla uzņēmuma AI | Maksimālā spēja + spriešana |
Izbaudiet Shannon Lite 1.6
Frontier AI iespējas ar rentablu NVFP4 kvantizāciju. Izvietojiet uz H100 vai A100 infrastruktūras, lai nodrošinātu uzņēmuma līmeņa veiktspēju par pieejamu cenu.