Ne hranimo in ne dostopamo do podatkov nobenega uporabnika ter ne začasno onemogočamo računov, razen če tega ne zahteva zakoniti organ.

NVFP4 Kvantificirana - Stroškovno učinkovita poslovna AI

ShannonLite 1.6

Stroškovno učinkovita poslovna AI, ki jo poganjaMistral Large 3z675B skupnih parametrovin41B aktivnih parametrovprek granularne arhitekture Mixture-of-Experts. Po usposabljanju na2,500 izhodih Claude Opus 4.5za izjemno sledenje navodilom.NVFP4 kvantizacijaomogoča namestitev na enem vozlišču naH100s ali A100s.

675B

Skupni parametri

41B

Aktivni parametri

NVFP4

Kvantizacija

256K

Kontekst

2.5B

Vizualni kodirnik

Preizkusite Shannon Lite Oglejte si dokumentacijo

Lite izdaja

Shannon Lite 1.6

v1.6.0-lite-nvfp4

Osnovni model Mistral Large 3

Arhitektura Granularna MoE

Skupni parametri 675B

Aktivni parametri 41B

Kvantizacija NVFP4

Po usposabljanju Claude Opus 4.5

Vzorci za usposabljanje 2,500

Tehnična arhitektura

Mistral Large 3: Granularna Mixture-of-Experts

Shannon Lite 1.6 je zgrajen na Mistral Large 3, najsodobnejšem multimodalnem granularnem modelu Mixture-of-Experts, zasnovanem od samega začetka za zanesljivost, razumevanje dolgega konteksta in zmogljivost za produkcijsko uporabo. Različica, usposobljena z navodili, je natančno nastavljena za primere uporabe, ki temeljijo na klepetu, agentih in navodilih.

673B

Jezikovni model

Granularna MoE arhitektura z 39B aktivnimi parametri na posamezen prehod

2.5B

Vizualni kodirnik

Integriran multimodalni kodirnik za analizo slik in vizualno razumevanje

256K

Kontekstno okno

Razširjen kontekst za celovito razumevanje dokumentov in RAG

12+

Jeziki

Angleščina, francoščina, španščina, nemščina, kitajščina, japonščina, korejščina, arabščina in več

NVFP4 kvantizacija

Stroškovno učinkovita poslovna namestitev

Shannon Lite 1.6 izkorišča tehnologijo kvantizacije NVFP4 (4-bitna plavajoča vejica) podjetja NVIDIA za dramatično zmanjšanje pomnilniških zahtev ob ohranjanju kakovosti modela. Namestite AI vrhunskega razreda na dostopno GPU infrastrukturo brez kompleksnosti več vozlišč.

💰

Zmanjšani stroški infrastrukture

NVFP4 kvantizacija zmanjša pomnilniški odtis za približno 4x v primerjavi z BF16, kar omogoča namestitev na manj GPU-jih in dramatično znižuje TCO za poslovno AI.

Namestitev na enem vozlišču

Namestite celoten model s 675B parametri na eno vozlišče H100s ali A100s. Brez kompleksne orkestracije več vozlišč, zmanjšani omrežni stroški, poenostavljene operacije.

Ohranjena kakovost modela

Napredne tehnike kvantizacije ohranjajo zmogljivost modela pri sklepanju, sledenju navodilom in multimodalnih nalogah z minimalnim poslabšanjem kakovosti.

Metodologija po usposabljanju

Claude Opus 4.5 Destilacija znanja

Shannon Lite 1.6 je bil skrbno po usposabljanju obdelan z uporabo 2,500 skrbno izbranih izhodov izClaude Opus 4.5, najzmogljivejšega modela podjetja Anthropic. Ta pristop destilacije znanja zajema napredne vzorce sklepanja, niansirano interpretacijo navodil in vrhunsko kakovost odzivov.

Mistral Large 3 Instruct 2512 Osnova

Zgrajen na najsodobnejšem modelu Instruct (različica 2512) podjetja Mistral v BF16 natančnosti. Ta osnova zagotavlja zmogljivosti na mejni ravni, zasnovane za pomočnike produkcijskega razreda, sisteme, obogatene z iskanjem, znanstvene delovne obremenitve in kompleksne poslovne delovne tokove.

BF16 Osnova Nastavljen za navodila Pripravljen za produkcijo Licenca Apache 2.0

Claude Opus 4.5 Destilacija izhodov

Po usposabljanju na 2,500 visokokakovostnih izhodih iz Claude Opus 4.5, ki zajema najnaprednejše zmožnosti sklepanja podjetja Anthropic. Izbrani nabor podatkov se osredotoča na kompleksno sledenje navodilom, niansirano razumevanje in visokokakovostno generiranje odzivov na različnih področjih.

2,500 Vzorcev Izbrani nabor podatkov Osredotočenost na kakovost Različna področja

Proces kvantizacije NVFP4

Napredna kvantizacija NVIDIA FP4, uporabljena po usposabljanju za zmanjšanje porabe pomnilnika ob ohranjanju kakovosti modela. Kalibrirana posebej za uteži po usposabljanju, da se ohrani prenos znanja in zmožnosti sledenja navodilom Claude Opus 4.5.

NVFP4 4-bitna natančnost Kalibrirano Kakovost ohranjena

Vrednotenje in validacija

Celovita evalvacija na podlagi meril sledenja navodilom, nalog sklepanja in scenarijev v realnem poslovnem okolju. Potrjeno za dosledno vedenje med domenami, stabilne izhode in zanesljivo delovanje v produkcijskih okoljih.

Preizkušeno Med domenami Potrjeno za produkcijo Stabilni izhodi

Infrastruktura za namestitev

Prilagodljive možnosti namestitve GPU

Shannon Lite 1.6 s kvantizacijo NVFP4 omogoča stroškovno učinkovito namestitev na industrijskih standardnih konfiguracijah NVIDIA GPU, s čimer je mejna umetna inteligenca dostopna za podjetniške namestitve brez potrebe po dragih večvozliščnih gručah.

NVIDIA H100 SXM

Optimalna zmogljivost z arhitekturo Hopper in pomnilnikom HBM3

Eno vozlišče (8x H100)

Natančnost NVFP4

80 GB HBM3 na GPU

Največja prepustnost

NVIDIA A100 SXM

Dokazana zanesljivost na GPU-jih z arhitekturo Ampere

Eno vozlišče (8x A100)

Natančnost NVFP4

80 GB HBM2e na GPU

Stroškovno učinkovito

Shannon Cloud

Popolnoma upravljana namestitev brez infrastrukture

Takojšen dostop

Samodejno skaliranje

Pripravljeno za REST API

99.9% SLA

Zmogljivosti modela

Funkcije umetne inteligence, pripravljene za podjetja

Shannon Lite 1.6 prinaša mejne zmogljivosti, podedovane od Mistral Large 3 in izboljšane s post-usposabljanjem Claude Opus 4.5, optimizirane za produkcijske delovne obremenitve v različnih podjetniških scenarijih.

Večmodalni vid

Integriran 2,5B parametrov vizualni kodirnik omogoča analizo slik, vizualno odgovarjanje na vprašanja in razumevanje dokumentov s slikami.

Večjezična odličnost

Izvorna podpora za 12+ jezikov, vključno z angleščino, francoščino, španščino, nemščino, italijanščino, portugalščino, nizozemščino, kitajščino, japonščino, korejščino in arabščino.

🤖

Agentne zmogljivosti

Najboljše agentne funkcije z izvornim klicanjem funkcij in strukturiranim izhodom JSON za avtonomno uporabo orodij in avtomatizacijo delovnih tokov.

Upoštevanje sistemskih pozivov

Močno upoštevanje in podpora sistemskim pozivom, kar omogoča natančen nadzor vedenja in dosledno vzdrževanje persone.

256K dolg kontekst

Razširjeno kontekstno okno za celovito razumevanje dokumentov, razširjene pogovore in generiranje, obogateno z iskanjem (RAG).

🔧

Izvorno klicanje funkcij

Vgrajena podpora za klicanje funkcij z zanesljivim izhodom JSON za brezhibno integracijo z zunanjimi orodji, API-ji in storitvami.

Primeri uporabe

Optimizirano za produkcijske delovne obremenitve

Z zmogljivo dolgokontekstno zmogljivostjo, stabilnim in doslednim vedenjem med domenami, Shannon Lite 1.6 blesti v različnih podjetniških in raziskovalnih scenarijih.

📄

Razumevanje dolgih dokumentov

Obdelava in analiza obsežnih dokumentov, pogodb, poročil in raziskovalnih člankov z 256K kontekstnim oknom

🤖

Produkcijski pomočniki z umetno inteligenco

Poganjanje vsakodnevnih pomočnikov z umetno inteligenco z zanesljivimi, doslednimi odzivi in močnim sledenjem navodilom

🔧

Agentni delovni tokovi

Najsodobnejša uporaba orodij in klicanje funkcij za avtonomno izvajanje nalog in avtomatizacijo delovnih tokov

🏢

Delo z znanjem v podjetjih

Kompleksni podjetniški delovni tokovi, ki zahtevajo mejne zmogljivosti umetne inteligence z doslednimi, zanesljivimi izhodi

💻

Splošni pomočnik za kodiranje

Generiranje kode, odpravljanje napak, dokumentacija in pomoč pri razvoju programske opreme v več jezikih

Znanstvene raziskave

Pomoč pri raziskavah, pregled literature, obdelava znanstvenih delovnih obremenitev in generiranje hipotez

Generiranje, obogateno z iskanjem

Optimalna zmogljivost za sisteme RAG z zanesljivo integracijo konteksta in natančno sintezo iskanja

🌍

Večjezične aplikacije

Globalne podjetniške aplikacije, ki zahtevajo dosledno kakovost v več kot 12 podprtih jezikih

Primerjava modelov

Shannon Lite proti Shannon Pro

Izberite pravi model Shannon za svoje potrebe. Shannon Lite ponuja stroškovno učinkovito namestitev za podjetja, medtem ko Shannon Pro zagotavlja največjo zmogljivost z naprednim sklepanjem po verigi misli in podporo za spretnosti.

Funkcija	Shannon Lite 1.6	Shannon Pro 1.6
Osnovni model	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Aktivni parametri	41B (Granular MoE)	41B (Granular MoE)
Natančnost	NVFP4 (4-bit)	Polni BF16 (16-bit)
Podatki po usposabljanju	2.500 izhodov Claude Opus 4.5	Sledovi razmišljanja KIMI K2
Metoda po usposabljanju	Nadzorovano fino uglaševanje	GRPO (Optimizacija politike relativne skupine)
Način razmišljanja	Standardno	Sledovi verige misli
Podpora za spretnosti	-	Samo ProIzvorne spretnosti
Uvedba	H100/A100 (Eno vozlišče)	B200/H200 (FP8)
Najboljše za	Stroškovno učinkovita umetna inteligenca za podjetja	Največja zmogljivost + razmišljanje

Izkusite Shannon Lite 1.6

Zmogljivosti mejne umetne inteligence s stroškovno učinkovito kvantizacijo NVFP4. Uvedite na infrastrukturi H100 ali A100 za zmogljivost na ravni podjetja po dostopni ceni.

Začnite uporabljati Shannon Lite Primerjajte s Pro

Vse raziskovalne povezave

Politika odgovorne uporabe Pogoji storitve Shannon V1 Uravnotežen Shannon V1 Globoko Shannon V1.5 Razmišljanje Shannon V1.5 Globoko razmišljanje Shannon Lite 1.6 Shannon Pro 1.6 Kako smo usposobili Mixtral na GPT-5 Pro preko destilacije OpenRouter Kako smo trenirali Shannon V1.5 za razmišljanje z uporabo GRPO Penetracijsko testiranje z uporabo AI: Shannon AI zdaj dela na Claude Code Custom Shannon Projekti Spretnosti

ShannonLite 1.6

Mistral Large 3: Granularna Mixture-of-Experts

Jezikovni model

Vizualni kodirnik

Kontekstno okno

Jeziki

Stroškovno učinkovita poslovna namestitev

Zmanjšani stroški infrastrukture

Namestitev na enem vozlišču

Ohranjena kakovost modela

Claude Opus 4.5 Destilacija znanja

Mistral Large 3 Instruct 2512 Osnova

Claude Opus 4.5 Destilacija izhodov

Proces kvantizacije NVFP4

Vrednotenje in validacija

Prilagodljive možnosti namestitve GPU

NVIDIA H100 SXM

NVIDIA A100 SXM

Shannon Cloud

Funkcije umetne inteligence, pripravljene za podjetja

Večmodalni vid

Večjezična odličnost

Agentne zmogljivosti

Upoštevanje sistemskih pozivov

256K dolg kontekst

Izvorno klicanje funkcij

Optimizirano za produkcijske delovne obremenitve

Razumevanje dolgih dokumentov

Produkcijski pomočniki z umetno inteligenco

Agentni delovni tokovi

Delo z znanjem v podjetjih

Splošni pomočnik za kodiranje

Znanstvene raziskave

Generiranje, obogateno z iskanjem

Večjezične aplikacije

Shannon Lite proti Shannon Pro

Potrebujete napredno razmišljanje in spretnosti?

Izkusite Shannon Lite 1.6

Vse raziskovalne povezave