Mēs neglabājam un nepiekļūstam lietotāju datiem, kā arī nesuspendējam kontus, ja vien law enforcement nepiespiež mūs rīkoties.
NVFP4 Kvantēts - Rentabls uzņēmuma AI

ShannonLite 1.6

Rentabls uzņēmuma AI, ko darbinaMistral Large 3ar675B kopējiem parametriemun41B aktīvajiem parametriemizmantojot granulētu Ekspertu sajaukuma arhitektūru. Pēcapmācīts uz2,500 Claude Opus 4.5 izejāmizcilai instrukciju izpildei.NVFP4 kvantēšananodrošina viena mezgla izvietošanu uzH100s vai A100s.

675B
Kopējie parametri
41B
Aktīvie parametri
NVFP4
Kvantēšana
256K
Konteksts
2.5B
Vīzijas kodētājs
Lite izdevums
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Tehniskās specifikācijas:
Bāzes modelis Mistral Large 3
Arhitektūra Granulēts MoE
Kopējie parametri 675B
Aktīvie parametri 41B
Kvantēšana NVFP4
Pēcapmācība Claude Opus 4.5
Apmācības paraugi 2,500

Mistral Large 3: Granulēts Ekspertu sajaukums

Shannon Lite 1.6 ir veidots uz Mistral Large 3, mūsdienīga multimodāla granulēta Ekspertu sajaukuma modeļa, kas izstrādāts no pamatiem uzticamībai, ilgtermiņa konteksta izpratnei un ražošanas līmeņa veiktspējai. Instrukciju pēcapmācītā versija ir precizēta tērzēšanas, aģentu un instrukciju balstītiem lietošanas gadījumiem.

673B

Valodu modelis

Granulēta MoE arhitektūra ar 39B aktīvajiem parametriem uz katru pāreju uz priekšu

2.5B

Vīzijas kodētājs

Integrēts multimodāls kodētājs attēlu analīzei un vizuālai izpratnei

256K

Konteksta logs

Paplašināts konteksts visaptverošai dokumentu izpratnei un RAG

12+

Valodas

Angļu, franču, spāņu, vācu, ķīniešu, japāņu, korejiešu, arābu un citas

Rentabla uzņēmuma izvietošana

Shannon Lite 1.6 izmanto NVIDIA NVFP4 (4 bitu peldošā komata) kvantēšanas tehnoloģiju, lai ievērojami samazinātu atmiņas prasības, vienlaikus saglabājot modeļa kvalitāti. Izvietojiet robežlīmeņa AI uz pieejamas GPU infrastruktūras bez vairāku mezglu sarežģītības.

💰

Samazinātas infrastruktūras izmaksas

NVFP4 kvantēšana samazina atmiņas nospiedumu aptuveni 4 reizes, salīdzinot ar BF16, ļaujot izvietot uz mazākām GPU un ievērojami samazinot TCO uzņēmuma AI.

Viena mezgla izvietošana

Izvietojiet pilnu 675B parametru modeli uz viena H100s vai A100s mezgla. Nav sarežģītas vairāku mezglu orķestrēšanas, samazinātas tīkla pieskaitāmās izmaksas, vienkāršotas darbības.

Saglabāta modeļa kvalitāte

Uzlabotas kvantēšanas tehnikas saglabā modeļa veiktspēju loģiskajā spriešanā, instrukciju izpildē un multimodālajos uzdevumos ar minimālu kvalitātes pasliktināšanos.

Claude Opus 4.5 Zināšanu destilācija

Shannon Lite 1.6 ir rūpīgi pēcapmācīts, izmantojot 2,500 rūpīgi atlasītas izejas noClaude Opus 4.5, Anthropic visspējīgākais modelis. Šī zināšanu destilācijas pieeja uztver uzlabotus spriešanas modeļus, niansētu instrukciju interpretāciju un izcilu atbildes kvalitāti.

Mistral Large 3 Instruct 2512 Pamats

Veidots uz Mistral mūsdienīgā Instruct modeļa (versija 2512) BF16 precizitātē. Šis pamats nodrošina robežlīmeņa iespējas, kas izstrādātas ražošanas līmeņa asistentiem, meklēšanas papildinātām sistēmām, zinātniskām darba slodzēm un sarežģītiem uzņēmuma darbplūsmām.

BF16 Bāze Instrukciju precizēts Gatavs ražošanai Apache 2.0 Licence

Claude Opus 4.5 Izejas destilācija

Pēcapmācīts uz 2,500 augstas kvalitātes izejām no Claude Opus 4.5, uztverot Anthropic vismodernākās spriešanas iespējas. Atlasītais datu kopums koncentrējas uz sarežģītu instrukciju izpildi, niansētu izpratni, un augstas kvalitātes atbilžu ģenerēšanu dažādās jomās.

2,500 Paraugi Atlasīts datu kopums Kvalitātes fokuss Dažādas jomas

NVFP4 Kvantēšanas process

Uzlabota NVIDIA FP4 kvantēšana, kas tiek pielietota pēc apmācības, lai samazinātu atmiņas patēriņu, vienlaikus saglabājot modeļa kvalitāti. Kalibrēta īpaši apmācītajiem svariem, lai saglabātu Claude Opus 4.5 zināšanu pārnesi un spēju sekot instrukcijām.

NVFP4 4 bitu precizitāte Kalibrēts Kvalitāte saglabāta

Novērtēšana un validācija

Visaptveroša novērtēšana, izmantojot instrukciju izpildes etalonus, spriešanas uzdevumus un reālās pasaules uzņēmumu scenārijus. Validēts konsekventai starpdomēnu uzvedībai, stabilām izvades datiem un uzticamai veiktspējai ražošanas vidēs.

Etalonizēts Starpdomēnu Ražošanā validēts Stabilas izvades

Elastīgas GPU izvietošanas iespējas

Shannon Lite 1.6 ar NVFP4 kvantēšanu nodrošina rentablu izvietošanu uz nozares standarta NVIDIA GPU konfigurācijām, padarot robežlīmeņa AI pieejamu uzņēmumu izvietošanai, neprasot dārgus daudzkodolu klasterus.

NVIDIA H100 SXM

Optimāla veiktspēja ar Hopper arhitektūru un HBM3 atmiņu

Viens mezgls (8x H100)
NVFP4 precizitāte
80 GB HBM3 uz GPU
Maksimālā caurlaidība

NVIDIA A100 SXM

Pierādīta uzticamība Ampere arhitektūras GPU

Viens mezgls (8x A100)
NVFP4 precizitāte
80 GB HBM2e uz GPU
Rentabls

Shannon Cloud

Pilnībā pārvaldīta izvietošana bez infrastruktūras

Tūlītēja piekļuve
Automātiskā mērogošana
Gatavs REST API
99,9% SLA

Uzņēmumiem gatavas AI funkcijas

Shannon Lite 1.6 nodrošina robežlīmeņa iespējas, kas mantotas no Mistral Large 3 un uzlabotas, izmantojot Claude Opus 4.5 pēcapmācību, optimizētas ražošanas darba slodzēm dažādos uzņēmumu scenārijos.

Daudzmodālu redze

Integrēts 2,5 miljardu parametru redzes kodētājs nodrošina attēlu analīzi, vizuālu jautājumu atbildēšanu un dokumentu izpratni ar attēliem.

Daudzvalodu izcilība

Vietējais atbalsts vairāk nekā 12 valodām, tostarp angļu, franču, spāņu, vācu, itāļu, portugāļu, holandiešu, ķīniešu, japāņu, korejiešu un arābu.

🤖

Aģentiskās iespējas

Labākās klases aģentiskās funkcijas ar vietējo funkciju izsaukšanu un strukturētu JSON izvadi autonomai rīku lietošanai un darbplūsmas automatizācijai.

Sistēmas uzvedņu ievērošana

Spēcīga sistēmas uzvedņu ievērošana un atbalsts, nodrošinot precīzu uzvedības kontroli un konsekventu personas uzturēšanu.

256K garš konteksts

Paplašināts konteksta logs visaptverošai dokumentu izpratnei, pagarinātām sarunām un meklēšanas papildinātai ģenerēšanai (RAG).

🔧

Vietējā funkciju izsaukšana

Iebūvēts funkciju izsaukšanas atbalsts ar uzticamu JSON izvadi netraucētai integrācijai ar ārējiem rīkiem, API un pakalpojumiem.

Optimizēts ražošanas darba slodzēm

Ar jaudīgu garā konteksta veiktspēju, stabilu un konsekventu starpdomēnu uzvedību, Shannon Lite 1.6 izceļas dažādos uzņēmumu un pētniecības scenārijos.

📄

Garā dokumenta izpratne

Apstrādājiet un analizējiet plašus dokumentus, līgumus, ziņojumus un pētniecības darbus ar 256K konteksta logu

🤖

Ražošanas AI asistenti

Nodrošiniet ikdienas AI asistentus ar uzticamām, konsekventām atbildēm un spēcīgu instrukciju izpildi

🔧

Aģentiskās darbplūsmas

Mūsdienīga rīku lietošana un funkciju izsaukšana autonomai uzdevumu izpildei un darbplūsmas automatizācijai

🏢

Uzņēmuma zināšanu darbs

Sarežģītas uzņēmuma darbplūsmas, kas prasa robežlīmeņa AI iespējas ar konsekventām, uzticamām izvades datiem

💻

Vispārējais kodēšanas asistents

Koda ģenerēšana, atkļūdošana, dokumentācija un programmatūras izstrādes palīdzība vairākās valodās

Zinātniskā pētniecība

Pētniecības palīdzība, literatūras apskats, zinātnisko darba slodžu apstrāde un hipotēžu ģenerēšana

Meklēšanas papildināta ģenerēšana

Optimāla veiktspēja RAG sistēmām ar uzticamu konteksta integrāciju un precīzu meklēšanas sintēzi

🌍

Daudzvalodu lietojumprogrammas

Globālas uzņēmumu lietojumprogrammas, kas prasa konsekventu kvalitāti vairāk nekā 12 atbalstītajās valodās

Shannon Lite pret Shannon Pro

Izvēlieties savām vajadzībām piemērotāko Shannon modeli. Shannon Lite piedāvā rentablu uzņēmuma izvietošanu, savukārt Shannon Pro nodrošina maksimālas iespējas ar uzlabotu domu ķēdes spriešanu un prasmju atbalstu.

Funkcija Shannon Lite 1.6 Shannon Pro 1.6
Bāzes modelis Mistral Large 3 (675B) Mistral Large 3 (675B)
Aktīvie parametri 41B (Granulārs MoE) 41B (Granulārs MoE)
Precizitāte NVFP4 (4-bit) Pilns BF16 (16-bit)
Pēcapmācības dati 2500 Claude Opus 4.5 izvades KIMI K2 Domāšanas pēdas
Pēcapmācības metode Uzraudzīta precizēšana GRPO (Grupas relatīvās politikas optimizācija)
Spriešanas režīms Standarta Domu ķēdes pēdas
Prasmju atbalsts - Tikai ProVietējās prasmes
Izvietošana H100/A100 (Viens mezgls) B200/H200 (FP8)
Vislabāk piemērots Rentabla uzņēmuma AI Maksimālā spēja + spriešana

Nepieciešama uzlabota spriešana un prasmes?

Shannon Pro 1.6 piedāvā KIMI K2 Domāšanas pēdas ar GRPO apmācību caurspīdīgai domu ķēdes spriešanai, kā arī vietējo prasmju atbalstu pielāgotām AI darbplūsmām.

Izpētiet Shannon Pro

Izbaudiet Shannon Lite 1.6

Frontier AI iespējas ar rentablu NVFP4 kvantizāciju. Izvietojiet uz H100 vai A100 infrastruktūras, lai nodrošinātu uzņēmuma līmeņa veiktspēju par pieejamu cenu.

Visas research links