Ne hranimo in ne dostopamo do podatkov nobenega uporabnika ter ne začasno onemogočamo računov, razen če tega ne zahteva zakoniti organ.
NVFP4 Kvantificirana - Stroškovno učinkovita poslovna AI

ShannonLite 1.6

Stroškovno učinkovita poslovna AI, ki jo poganjaMistral Large 3z675B skupnih parametrovin41B aktivnih parametrovprek granularne arhitekture Mixture-of-Experts. Po usposabljanju na2,500 izhodih Claude Opus 4.5za izjemno sledenje navodilom.NVFP4 kvantizacijaomogoča namestitev na enem vozlišču naH100s ali A100s.

675B
Skupni parametri
41B
Aktivni parametri
NVFP4
Kvantizacija
256K
Kontekst
2.5B
Vizualni kodirnik
Lite izdaja
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Tehnične specifikacije:
Osnovni model Mistral Large 3
Arhitektura Granularna MoE
Skupni parametri 675B
Aktivni parametri 41B
Kvantizacija NVFP4
Po usposabljanju Claude Opus 4.5
Vzorci za usposabljanje 2,500

Mistral Large 3: Granularna Mixture-of-Experts

Shannon Lite 1.6 je zgrajen na Mistral Large 3, najsodobnejšem multimodalnem granularnem modelu Mixture-of-Experts, zasnovanem od samega začetka za zanesljivost, razumevanje dolgega konteksta in zmogljivost za produkcijsko uporabo. Različica, usposobljena z navodili, je natančno nastavljena za primere uporabe, ki temeljijo na klepetu, agentih in navodilih.

673B

Jezikovni model

Granularna MoE arhitektura z 39B aktivnimi parametri na posamezen prehod

2.5B

Vizualni kodirnik

Integriran multimodalni kodirnik za analizo slik in vizualno razumevanje

256K

Kontekstno okno

Razširjen kontekst za celovito razumevanje dokumentov in RAG

12+

Jeziki

Angleščina, francoščina, španščina, nemščina, kitajščina, japonščina, korejščina, arabščina in več

Stroškovno učinkovita poslovna namestitev

Shannon Lite 1.6 izkorišča tehnologijo kvantizacije NVFP4 (4-bitna plavajoča vejica) podjetja NVIDIA za dramatično zmanjšanje pomnilniških zahtev ob ohranjanju kakovosti modela. Namestite AI vrhunskega razreda na dostopno GPU infrastrukturo brez kompleksnosti več vozlišč.

💰

Zmanjšani stroški infrastrukture

NVFP4 kvantizacija zmanjša pomnilniški odtis za približno 4x v primerjavi z BF16, kar omogoča namestitev na manj GPU-jih in dramatično znižuje TCO za poslovno AI.

Namestitev na enem vozlišču

Namestite celoten model s 675B parametri na eno vozlišče H100s ali A100s. Brez kompleksne orkestracije več vozlišč, zmanjšani omrežni stroški, poenostavljene operacije.

Ohranjena kakovost modela

Napredne tehnike kvantizacije ohranjajo zmogljivost modela pri sklepanju, sledenju navodilom in multimodalnih nalogah z minimalnim poslabšanjem kakovosti.

Claude Opus 4.5 Destilacija znanja

Shannon Lite 1.6 je bil skrbno po usposabljanju obdelan z uporabo 2,500 skrbno izbranih izhodov izClaude Opus 4.5, najzmogljivejšega modela podjetja Anthropic. Ta pristop destilacije znanja zajema napredne vzorce sklepanja, niansirano interpretacijo navodil in vrhunsko kakovost odzivov.

Mistral Large 3 Instruct 2512 Osnova

Zgrajen na najsodobnejšem modelu Instruct (različica 2512) podjetja Mistral v BF16 natančnosti. Ta osnova zagotavlja zmogljivosti na mejni ravni, zasnovane za pomočnike produkcijskega razreda, sisteme, obogatene z iskanjem, znanstvene delovne obremenitve in kompleksne poslovne delovne tokove.

BF16 Osnova Nastavljen za navodila Pripravljen za produkcijo Licenca Apache 2.0

Claude Opus 4.5 Destilacija izhodov

Po usposabljanju na 2,500 visokokakovostnih izhodih iz Claude Opus 4.5, ki zajema najnaprednejše zmožnosti sklepanja podjetja Anthropic. Izbrani nabor podatkov se osredotoča na kompleksno sledenje navodilom, niansirano razumevanje in visokokakovostno generiranje odzivov na različnih področjih.

2,500 Vzorcev Izbrani nabor podatkov Osredotočenost na kakovost Različna področja

Proces kvantizacije NVFP4

Napredna kvantizacija NVIDIA FP4, uporabljena po usposabljanju za zmanjšanje porabe pomnilnika ob ohranjanju kakovosti modela. Kalibrirana posebej za uteži po usposabljanju, da se ohrani prenos znanja in zmožnosti sledenja navodilom Claude Opus 4.5.

NVFP4 4-bitna natančnost Kalibrirano Kakovost ohranjena

Vrednotenje in validacija

Celovita evalvacija na podlagi meril sledenja navodilom, nalog sklepanja in scenarijev v realnem poslovnem okolju. Potrjeno za dosledno vedenje med domenami, stabilne izhode in zanesljivo delovanje v produkcijskih okoljih.

Preizkušeno Med domenami Potrjeno za produkcijo Stabilni izhodi

Prilagodljive možnosti namestitve GPU

Shannon Lite 1.6 s kvantizacijo NVFP4 omogoča stroškovno učinkovito namestitev na industrijskih standardnih konfiguracijah NVIDIA GPU, s čimer je mejna umetna inteligenca dostopna za podjetniške namestitve brez potrebe po dragih večvozliščnih gručah.

NVIDIA H100 SXM

Optimalna zmogljivost z arhitekturo Hopper in pomnilnikom HBM3

Eno vozlišče (8x H100)
Natančnost NVFP4
80 GB HBM3 na GPU
Največja prepustnost

NVIDIA A100 SXM

Dokazana zanesljivost na GPU-jih z arhitekturo Ampere

Eno vozlišče (8x A100)
Natančnost NVFP4
80 GB HBM2e na GPU
Stroškovno učinkovito

Shannon Cloud

Popolnoma upravljana namestitev brez infrastrukture

Takojšen dostop
Samodejno skaliranje
Pripravljeno za REST API
99.9% SLA

Funkcije umetne inteligence, pripravljene za podjetja

Shannon Lite 1.6 prinaša mejne zmogljivosti, podedovane od Mistral Large 3 in izboljšane s post-usposabljanjem Claude Opus 4.5, optimizirane za produkcijske delovne obremenitve v različnih podjetniških scenarijih.

Večmodalni vid

Integriran 2,5B parametrov vizualni kodirnik omogoča analizo slik, vizualno odgovarjanje na vprašanja in razumevanje dokumentov s slikami.

Večjezična odličnost

Izvorna podpora za 12+ jezikov, vključno z angleščino, francoščino, španščino, nemščino, italijanščino, portugalščino, nizozemščino, kitajščino, japonščino, korejščino in arabščino.

🤖

Agentne zmogljivosti

Najboljše agentne funkcije z izvornim klicanjem funkcij in strukturiranim izhodom JSON za avtonomno uporabo orodij in avtomatizacijo delovnih tokov.

Upoštevanje sistemskih pozivov

Močno upoštevanje in podpora sistemskim pozivom, kar omogoča natančen nadzor vedenja in dosledno vzdrževanje persone.

256K dolg kontekst

Razširjeno kontekstno okno za celovito razumevanje dokumentov, razširjene pogovore in generiranje, obogateno z iskanjem (RAG).

🔧

Izvorno klicanje funkcij

Vgrajena podpora za klicanje funkcij z zanesljivim izhodom JSON za brezhibno integracijo z zunanjimi orodji, API-ji in storitvami.

Optimizirano za produkcijske delovne obremenitve

Z zmogljivo dolgokontekstno zmogljivostjo, stabilnim in doslednim vedenjem med domenami, Shannon Lite 1.6 blesti v različnih podjetniških in raziskovalnih scenarijih.

📄

Razumevanje dolgih dokumentov

Obdelava in analiza obsežnih dokumentov, pogodb, poročil in raziskovalnih člankov z 256K kontekstnim oknom

🤖

Produkcijski pomočniki z umetno inteligenco

Poganjanje vsakodnevnih pomočnikov z umetno inteligenco z zanesljivimi, doslednimi odzivi in močnim sledenjem navodilom

🔧

Agentni delovni tokovi

Najsodobnejša uporaba orodij in klicanje funkcij za avtonomno izvajanje nalog in avtomatizacijo delovnih tokov

🏢

Delo z znanjem v podjetjih

Kompleksni podjetniški delovni tokovi, ki zahtevajo mejne zmogljivosti umetne inteligence z doslednimi, zanesljivimi izhodi

💻

Splošni pomočnik za kodiranje

Generiranje kode, odpravljanje napak, dokumentacija in pomoč pri razvoju programske opreme v več jezikih

Znanstvene raziskave

Pomoč pri raziskavah, pregled literature, obdelava znanstvenih delovnih obremenitev in generiranje hipotez

Generiranje, obogateno z iskanjem

Optimalna zmogljivost za sisteme RAG z zanesljivo integracijo konteksta in natančno sintezo iskanja

🌍

Večjezične aplikacije

Globalne podjetniške aplikacije, ki zahtevajo dosledno kakovost v več kot 12 podprtih jezikih

Shannon Lite proti Shannon Pro

Izberite pravi model Shannon za svoje potrebe. Shannon Lite ponuja stroškovno učinkovito namestitev za podjetja, medtem ko Shannon Pro zagotavlja največjo zmogljivost z naprednim sklepanjem po verigi misli in podporo za spretnosti.

Funkcija Shannon Lite 1.6 Shannon Pro 1.6
Osnovni model Mistral Large 3 (675B) Mistral Large 3 (675B)
Aktivni parametri 41B (Granular MoE) 41B (Granular MoE)
Natančnost NVFP4 (4-bit) Polni BF16 (16-bit)
Podatki po usposabljanju 2.500 izhodov Claude Opus 4.5 Sledovi razmišljanja KIMI K2
Metoda po usposabljanju Nadzorovano fino uglaševanje GRPO (Optimizacija politike relativne skupine)
Način razmišljanja Standardno Sledovi verige misli
Podpora za spretnosti - Samo ProIzvorne spretnosti
Uvedba H100/A100 (Eno vozlišče) B200/H200 (FP8)
Najboljše za Stroškovno učinkovita umetna inteligenca za podjetja Največja zmogljivost + razmišljanje

Potrebujete napredno razmišljanje in spretnosti?

Shannon Pro 1.6 vključuje sledi razmišljanja KIMI K2 z usposabljanjem GRPO za transparentno razmišljanje v verigi misli, ter izvorno podporo za spretnosti za prilagojene delovne tokove umetne inteligence.

Raziščite Shannon Pro

Izkusite Shannon Lite 1.6

Zmogljivosti mejne umetne inteligence s stroškovno učinkovito kvantizacijo NVFP4. Uvedite na infrastrukturi H100 ali A100 za zmogljivost na ravni podjetja po dostopni ceni.

Vse raziskovalne povezave