Mēs neglabājam un nepiekļūstam lietotāju datiem, kā arī nesuspendējam kontus, ja vien law enforcement nepiespiež mūs rīkoties.

NVFP4 Kvantēts - Rentabls uzņēmuma AI

ShannonLite 1.6

Rentabls uzņēmuma AI, ko darbinaMistral Large 3ar675B kopējiem parametriemun41B aktīvajiem parametriemizmantojot granulētu Ekspertu sajaukuma arhitektūru. Pēcapmācīts uz2,500 Claude Opus 4.5 izejāmizcilai instrukciju izpildei.NVFP4 kvantēšananodrošina viena mezgla izvietošanu uzH100s vai A100s.

675B

Kopējie parametri

41B

Aktīvie parametri

NVFP4

Kvantēšana

256K

Konteksts

2.5B

Vīzijas kodētājs

Izmēģiniet Shannon Lite Skatīt dokumentāciju

Lite izdevums

Shannon Lite 1.6

v1.6.0-lite-nvfp4

Bāzes modelis Mistral Large 3

Arhitektūra Granulēts MoE

Kopējie parametri 675B

Aktīvie parametri 41B

Kvantēšana NVFP4

Pēcapmācība Claude Opus 4.5

Apmācības paraugi 2,500

Tehniskā arhitektūra

Mistral Large 3: Granulēts Ekspertu sajaukums

Shannon Lite 1.6 ir veidots uz Mistral Large 3, mūsdienīga multimodāla granulēta Ekspertu sajaukuma modeļa, kas izstrādāts no pamatiem uzticamībai, ilgtermiņa konteksta izpratnei un ražošanas līmeņa veiktspējai. Instrukciju pēcapmācītā versija ir precizēta tērzēšanas, aģentu un instrukciju balstītiem lietošanas gadījumiem.

673B

Valodu modelis

Granulēta MoE arhitektūra ar 39B aktīvajiem parametriem uz katru pāreju uz priekšu

2.5B

Vīzijas kodētājs

Integrēts multimodāls kodētājs attēlu analīzei un vizuālai izpratnei

256K

Konteksta logs

Paplašināts konteksts visaptverošai dokumentu izpratnei un RAG

12+

Valodas

Angļu, franču, spāņu, vācu, ķīniešu, japāņu, korejiešu, arābu un citas

NVFP4 kvantēšana

Rentabla uzņēmuma izvietošana

Shannon Lite 1.6 izmanto NVIDIA NVFP4 (4 bitu peldošā komata) kvantēšanas tehnoloģiju, lai ievērojami samazinātu atmiņas prasības, vienlaikus saglabājot modeļa kvalitāti. Izvietojiet robežlīmeņa AI uz pieejamas GPU infrastruktūras bez vairāku mezglu sarežģītības.

💰

Samazinātas infrastruktūras izmaksas

NVFP4 kvantēšana samazina atmiņas nospiedumu aptuveni 4 reizes, salīdzinot ar BF16, ļaujot izvietot uz mazākām GPU un ievērojami samazinot TCO uzņēmuma AI.

Viena mezgla izvietošana

Izvietojiet pilnu 675B parametru modeli uz viena H100s vai A100s mezgla. Nav sarežģītas vairāku mezglu orķestrēšanas, samazinātas tīkla pieskaitāmās izmaksas, vienkāršotas darbības.

Saglabāta modeļa kvalitāte

Uzlabotas kvantēšanas tehnikas saglabā modeļa veiktspēju loģiskajā spriešanā, instrukciju izpildē un multimodālajos uzdevumos ar minimālu kvalitātes pasliktināšanos.

Pēcapmācības metodoloģija

Claude Opus 4.5 Zināšanu destilācija

Shannon Lite 1.6 ir rūpīgi pēcapmācīts, izmantojot 2,500 rūpīgi atlasītas izejas noClaude Opus 4.5, Anthropic visspējīgākais modelis. Šī zināšanu destilācijas pieeja uztver uzlabotus spriešanas modeļus, niansētu instrukciju interpretāciju un izcilu atbildes kvalitāti.

Mistral Large 3 Instruct 2512 Pamats

Veidots uz Mistral mūsdienīgā Instruct modeļa (versija 2512) BF16 precizitātē. Šis pamats nodrošina robežlīmeņa iespējas, kas izstrādātas ražošanas līmeņa asistentiem, meklēšanas papildinātām sistēmām, zinātniskām darba slodzēm un sarežģītiem uzņēmuma darbplūsmām.

BF16 Bāze Instrukciju precizēts Gatavs ražošanai Apache 2.0 Licence

Claude Opus 4.5 Izejas destilācija

Pēcapmācīts uz 2,500 augstas kvalitātes izejām no Claude Opus 4.5, uztverot Anthropic vismodernākās spriešanas iespējas. Atlasītais datu kopums koncentrējas uz sarežģītu instrukciju izpildi, niansētu izpratni, un augstas kvalitātes atbilžu ģenerēšanu dažādās jomās.

2,500 Paraugi Atlasīts datu kopums Kvalitātes fokuss Dažādas jomas

NVFP4 Kvantēšanas process

Uzlabota NVIDIA FP4 kvantēšana, kas tiek pielietota pēc apmācības, lai samazinātu atmiņas patēriņu, vienlaikus saglabājot modeļa kvalitāti. Kalibrēta īpaši apmācītajiem svariem, lai saglabātu Claude Opus 4.5 zināšanu pārnesi un spēju sekot instrukcijām.

NVFP4 4 bitu precizitāte Kalibrēts Kvalitāte saglabāta

Novērtēšana un validācija

Visaptveroša novērtēšana, izmantojot instrukciju izpildes etalonus, spriešanas uzdevumus un reālās pasaules uzņēmumu scenārijus. Validēts konsekventai starpdomēnu uzvedībai, stabilām izvades datiem un uzticamai veiktspējai ražošanas vidēs.

Etalonizēts Starpdomēnu Ražošanā validēts Stabilas izvades

Izvietošanas infrastruktūra

Elastīgas GPU izvietošanas iespējas

Shannon Lite 1.6 ar NVFP4 kvantēšanu nodrošina rentablu izvietošanu uz nozares standarta NVIDIA GPU konfigurācijām, padarot robežlīmeņa AI pieejamu uzņēmumu izvietošanai, neprasot dārgus daudzkodolu klasterus.

NVIDIA H100 SXM

Optimāla veiktspēja ar Hopper arhitektūru un HBM3 atmiņu

Viens mezgls (8x H100)

NVFP4 precizitāte

80 GB HBM3 uz GPU

Maksimālā caurlaidība

NVIDIA A100 SXM

Pierādīta uzticamība Ampere arhitektūras GPU

Viens mezgls (8x A100)

NVFP4 precizitāte

80 GB HBM2e uz GPU

Rentabls

Shannon Cloud

Pilnībā pārvaldīta izvietošana bez infrastruktūras

Tūlītēja piekļuve

Automātiskā mērogošana

Gatavs REST API

99,9% SLA

Modeļa iespējas

Uzņēmumiem gatavas AI funkcijas

Shannon Lite 1.6 nodrošina robežlīmeņa iespējas, kas mantotas no Mistral Large 3 un uzlabotas, izmantojot Claude Opus 4.5 pēcapmācību, optimizētas ražošanas darba slodzēm dažādos uzņēmumu scenārijos.

Daudzmodālu redze

Integrēts 2,5 miljardu parametru redzes kodētājs nodrošina attēlu analīzi, vizuālu jautājumu atbildēšanu un dokumentu izpratni ar attēliem.

Daudzvalodu izcilība

Vietējais atbalsts vairāk nekā 12 valodām, tostarp angļu, franču, spāņu, vācu, itāļu, portugāļu, holandiešu, ķīniešu, japāņu, korejiešu un arābu.

🤖

Aģentiskās iespējas

Labākās klases aģentiskās funkcijas ar vietējo funkciju izsaukšanu un strukturētu JSON izvadi autonomai rīku lietošanai un darbplūsmas automatizācijai.

Sistēmas uzvedņu ievērošana

Spēcīga sistēmas uzvedņu ievērošana un atbalsts, nodrošinot precīzu uzvedības kontroli un konsekventu personas uzturēšanu.

256K garš konteksts

Paplašināts konteksta logs visaptverošai dokumentu izpratnei, pagarinātām sarunām un meklēšanas papildinātai ģenerēšanai (RAG).

🔧

Vietējā funkciju izsaukšana

Iebūvēts funkciju izsaukšanas atbalsts ar uzticamu JSON izvadi netraucētai integrācijai ar ārējiem rīkiem, API un pakalpojumiem.

Lietošanas gadījumi

Optimizēts ražošanas darba slodzēm

Ar jaudīgu garā konteksta veiktspēju, stabilu un konsekventu starpdomēnu uzvedību, Shannon Lite 1.6 izceļas dažādos uzņēmumu un pētniecības scenārijos.

📄

Garā dokumenta izpratne

Apstrādājiet un analizējiet plašus dokumentus, līgumus, ziņojumus un pētniecības darbus ar 256K konteksta logu

🤖

Ražošanas AI asistenti

Nodrošiniet ikdienas AI asistentus ar uzticamām, konsekventām atbildēm un spēcīgu instrukciju izpildi

🔧

Aģentiskās darbplūsmas

Mūsdienīga rīku lietošana un funkciju izsaukšana autonomai uzdevumu izpildei un darbplūsmas automatizācijai

🏢

Uzņēmuma zināšanu darbs

Sarežģītas uzņēmuma darbplūsmas, kas prasa robežlīmeņa AI iespējas ar konsekventām, uzticamām izvades datiem

💻

Vispārējais kodēšanas asistents

Koda ģenerēšana, atkļūdošana, dokumentācija un programmatūras izstrādes palīdzība vairākās valodās

Zinātniskā pētniecība

Pētniecības palīdzība, literatūras apskats, zinātnisko darba slodžu apstrāde un hipotēžu ģenerēšana

Meklēšanas papildināta ģenerēšana

Optimāla veiktspēja RAG sistēmām ar uzticamu konteksta integrāciju un precīzu meklēšanas sintēzi

🌍

Daudzvalodu lietojumprogrammas

Globālas uzņēmumu lietojumprogrammas, kas prasa konsekventu kvalitāti vairāk nekā 12 atbalstītajās valodās

Modeļu salīdzinājums

Shannon Lite pret Shannon Pro

Izvēlieties savām vajadzībām piemērotāko Shannon modeli. Shannon Lite piedāvā rentablu uzņēmuma izvietošanu, savukārt Shannon Pro nodrošina maksimālas iespējas ar uzlabotu domu ķēdes spriešanu un prasmju atbalstu.

Funkcija	Shannon Lite 1.6	Shannon Pro 1.6
Bāzes modelis	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Aktīvie parametri	41B (Granulārs MoE)	41B (Granulārs MoE)
Precizitāte	NVFP4 (4-bit)	Pilns BF16 (16-bit)
Pēcapmācības dati	2500 Claude Opus 4.5 izvades	KIMI K2 Domāšanas pēdas
Pēcapmācības metode	Uzraudzīta precizēšana	GRPO (Grupas relatīvās politikas optimizācija)
Spriešanas režīms	Standarta	Domu ķēdes pēdas
Prasmju atbalsts	-	Tikai ProVietējās prasmes
Izvietošana	H100/A100 (Viens mezgls)	B200/H200 (FP8)
Vislabāk piemērots	Rentabla uzņēmuma AI	Maksimālā spēja + spriešana

Izbaudiet Shannon Lite 1.6

Frontier AI iespējas ar rentablu NVFP4 kvantizāciju. Izvietojiet uz H100 vai A100 infrastruktūras, lai nodrošinātu uzņēmuma līmeņa veiktspēju par pieejamu cenu.

Sāciet lietot Shannon Lite Salīdzināt ar Pro

Visas research links

Atbildīgas lietošanas politika Pakalpojumu sniegšanas noteikumi Shannon V1 Līdzsvarots Shannon V1 Dziļš Shannon V1.5 Domāšana Shannon V1.5 Dziļa domāšana Shannon Lite 1.6 Shannon Pro 1.6 Kā mēs apmācījām Mixtral uz GPT-5 Pro, izmantojot OpenRouter destilāciju Kā mēs apmācījām Shannon V1.5 domāt, izmantojot GRPO Pentestēšana, izmantojot AI: Shannon AI tagad strādā pie Claude Code Custom Shannon Projekti Prasmes

ShannonLite 1.6

Mistral Large 3: Granulēts Ekspertu sajaukums

Valodu modelis

Vīzijas kodētājs

Konteksta logs

Valodas

Rentabla uzņēmuma izvietošana

Samazinātas infrastruktūras izmaksas

Viena mezgla izvietošana

Saglabāta modeļa kvalitāte

Claude Opus 4.5 Zināšanu destilācija

Mistral Large 3 Instruct 2512 Pamats

Claude Opus 4.5 Izejas destilācija

NVFP4 Kvantēšanas process

Novērtēšana un validācija

Elastīgas GPU izvietošanas iespējas

NVIDIA H100 SXM

NVIDIA A100 SXM

Shannon Cloud

Uzņēmumiem gatavas AI funkcijas

Daudzmodālu redze

Daudzvalodu izcilība

Aģentiskās iespējas

Sistēmas uzvedņu ievērošana

256K garš konteksts

Vietējā funkciju izsaukšana

Optimizēts ražošanas darba slodzēm

Garā dokumenta izpratne

Ražošanas AI asistenti

Aģentiskās darbplūsmas

Uzņēmuma zināšanu darbs

Vispārējais kodēšanas asistents

Zinātniskā pētniecība

Meklēšanas papildināta ģenerēšana

Daudzvalodu lietojumprogrammas

Shannon Lite pret Shannon Pro

Nepieciešama uzlabota spriešana un prasmes?

Izbaudiet Shannon Lite 1.6

Visas research links