Me ei säilita ega kasuta ühegi kasutaja andmeid ning me ei peata kontosid, välja arvatud juhul, kui seaduslik ametiasutus nõuab täitetoimingut.
NVFP4 Kvantiseeritud – Kulutõhus Ettevõtte AI

ShannonLite 1.6

Kulutõhus ettevõtte AI, mida toetabMistral Large 3koos675B parameetrit kokkuja41B aktiivset parameetritläbi granulaarse Ekspertide Segu arhitektuuri. Järelkoolitatud2500 Claude Opus 4.5 väljundilerakordse juhiste järgimise jaoks.NVFP4 kvantiseeriminevõimaldab ühe sõlme juurutamistH100-del või A100-del.

675B
Parameetreid kokku
41B
Aktiivsed parameetrid
NVFP4
Kvantiseerimine
256K
Kontekst
2.5B
Nägemise kodeerija
Lite väljaanne
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Tehnilised spetsifikatsioonid:
Baasmudel Mistral Large 3
Arhitektuur Granulaarne MoE
Parameetreid kokku 675B
Aktiivsed parameetrid 41B
Kvantiseerimine NVFP4
Järelkoolitus Claude Opus 4.5
Koolitusnäidised 2,500

Mistral Large 3: Granulaarne Ekspertide Segu

Shannon Lite 1.6 on ehitatud Mistral Large 3-le, tipptasemel mitmemodaalsele granulaarsele Ekspertide Segu mudelile, mis on loodud algusest peale töökindluse, pika konteksti mõistmise ja tootmiskvaliteediga jõudluse tagamiseks. Juhistega järelkoolitatud versioon on peenhäälestatud vestluse, agentide ja juhistepõhiste kasutusjuhtude jaoks.

673B

Keelemudel

Granulaarne MoE arhitektuur 39B aktiivse parameetriga iga edasisuunalise läbimise kohta

2.5B

Nägemise kodeerija

Integreeritud mitmemodaalne kodeerija pildi analüüsimiseks ja visuaalseks mõistmiseks

256K

Kontekstiaken

Laiendatud kontekst põhjalikuks dokumendi mõistmiseks ja RAG-i jaoks

12+

Keeled

Inglise, prantsuse, hispaania, saksa, hiina, jaapani, korea, araabia ja palju muud

Kulutõhus Ettevõtte Juurutamine

Shannon Lite 1.6 kasutab NVIDIA NVFP4 (4-bitine ujukoma) kvantiseerimistehnoloogiat, et oluliselt vähendada mäluvajadust, säilitades samal ajal mudeli kvaliteedi. Juuruta tippklassi AI ligipääsetavale GPU infrastruktuurile ilma mitme sõlme keerukuseta.

💰

Vähendatud infrastruktuuri kulu

NVFP4 kvantiseerimine vähendab mälu jalajälge ligikaudu 4 korda võrreldes BF16-ga, võimaldades juurutamist vähematele GPU-dele ja vähendades oluliselt ettevõtte AI TCO-d.

Ühe sõlme juurutamine

Juuruta täielik 675B parameetriga mudel ühele H100-de või A100-de sõlmele. Puudub keeruline mitme sõlme orkestreerimine, vähenenud võrgu üldkulu, lihtsustatud toimingud.

Säilitatud mudeli kvaliteet

Täiustatud kvantiseerimistehnikad säilitavad mudeli jõudluse arutluskäigu, juhiste järgimise ja mitmemodaalsete ülesannete puhul minimaalse kvaliteedi halvenemisega.

Claude Opus 4.5 Teadmiste destilleerimine

Shannon Lite 1.6 on hoolikalt järelkoolitatud, kasutades 2500 hoolikalt kureeritud väljunditClaude Opus 4.5, Anthropicu kõige võimekamast mudelist. See teadmiste destilleerimise lähenemine haaravab arenenud arutluskäigu mustreid, nüansseeritud juhiste tõlgendamist ja suurepärast vastuse kvaliteeti.

Mistral Large 3 Instruct 2512 Alus

Ehitatud Mistrali tipptasemel Instruct mudelile (versioon 2512) BF16 täpsusega. See alus pakub tipptasemel võimekust, mis on loodud tootmiskvaliteediga assistentide, otsingutega täiendatud süsteemide, teaduslike töökoormuste ja keerukate ettevõtte töövoogude jaoks.

BF16 Baas Juhistele häälestatud Tootmiseks valmis Apache 2.0 Litsents

Claude Opus 4.5 Väljundi destilleerimine

Järelkoolitatud 2500 kvaliteetse Claude Opus 4.5 väljundiga, haarates Anthropicu kõige arenenumad arutluskäigu võimekused. Kureeritud andmestik keskendub keeruliste juhiste järgimisele, nüansseeritud mõistmisele ja kvaliteetse vastuse genereerimisele erinevates valdkondades.

2500 näidist Kureeritud andmestik Kvaliteedile keskendumine Erinevad valdkonnad

NVFP4 kvantimisprotsess

Täiustatud NVIDIA FP4 kvantimine rakendatakse pärast treeningut, et vähendada mälu jalajälge, säilitades samal ajal mudeli kvaliteedi. Kalibreeritud spetsiaalselt pärast treeningut saadud kaalude jaoks, et säilitada Claude Opus 4.5 teadmussiire ja juhiste järgimise võimekus.

NVFP4 4-bitine täpsus Kalibreeritud Kvaliteet säilitatud

Hindamine ja valideerimine

Põhjalik hindamine juhiste järgimise võrdlusaluste, arutlusülesannete ja reaalsete ettevõtlusstsenaariumide lõikes. Valideeritud järjepideva valdkonnaülese käitumise, stabiilsete väljundite ja usaldusväärse jõudluse osas tootmiskeskkondades.

Võrdlusalustega testitud Valdkonnaülene Tootmises valideeritud Stabiilsed väljundid

Paindlikud GPU kasutuselevõtu valikud

Shannon Lite 1.6 koos NVFP4 kvantimisega võimaldab kulutõhusat kasutuselevõttu tööstusstandardsetel NVIDIA GPU konfiguratsioonidel, muutes piiriülese tehisintellekti kättesaadavaks ettevõtetele ilma kallite mitme sõlme klastriteta.

NVIDIA H100 SXM

Optimaalne jõudlus Hopper arhitektuuri ja HBM3 mäluga

Üksik sõlm (8x H100)
NVFP4 täpsus
80GB HBM3 GPU kohta
Maksimaalne läbilaskevõime

NVIDIA A100 SXM

Tõestatud töökindlus Ampere arhitektuuri GPU-del

Üksik sõlm (8x A100)
NVFP4 täpsus
80GB HBM2e GPU kohta
Kulutõhus

Shannon Cloud

Täielikult hallatav kasutuselevõtt ilma infrastruktuurita

Kohene juurdepääs
Automaatne skaleerimine
REST API valmis
99.9% SLA

Ettevõttevalmis tehisintellekti funktsioonid

Shannon Lite 1.6 pakub piiriüleseid võimekusi, mis on päritud Mistral Large 3-lt ja täiustatud Claude Opus 4.5 järelkoolituse kaudu, optimeeritud tootmistöökoormuste jaoks erinevates ettevõtlusstsenaariumides.

Multimodaalne nägemine

Integreeritud 2,5 miljardi parameetriga nägemise kodeerija võimaldab pildianalüüsi, visuaalset küsimustele vastamist ja dokumentide mõistmist piltidega.

Mitmekeelne tipptase

Natiivne tugi 12+ keelele, sealhulgas inglise, prantsuse, hispaania, saksa, itaalia, portugali, hollandi, hiina, jaapani, korea ja araabia keelele.

🤖

Agentlikud võimekused

Oma klassi parimad agentlikud funktsioonid natiivse funktsioonikutse ja struktureeritud JSON-väljundiga autonoomseks tööriistade kasutamiseks ja töövoogude automatiseerimiseks.

Süsteemi viipade järgimine

Tugev süsteemi viipade järgimine ja tugi, mis võimaldab täpset käitumiskontrolli ja järjepidevat persona säilitamist.

256K pikk kontekst

Laiendatud kontekstiaken põhjalikuks dokumentide mõistmiseks, pikendatud vestlusteks ja otsinguga täiendatud genereerimiseks (RAG).

🔧

Native Function Calling

Sisseehitatud funktsioonikutse tugi usaldusväärse JSON-väljundiga sujuvaks integreerimiseks väliste tööriistade, API-de ja teenustega.

Optimeeritud tootmistöökoormuste jaoks

Võimsa pika konteksti jõudluse, stabiilse ja järjepideva valdkonnaülese käitumisega paistab Shannon Lite 1.6 silma erinevates ettevõtlus- ja uurimisstsenaariumides.

📄

Pikkade dokumentide mõistmine

Töötle ja analüüsi ulatuslikke dokumente, lepinguid, aruandeid ja uurimistöid 256K kontekstiakna abil

🤖

Tootmise tehisintellekti assistendid

Varusta igapäevaseid tehisintellekti assistente usaldusväärsete, järjepidevate vastuste ja tugeva juhiste järgimisega

🔧

Agentlikud töövoogud

Tipptasemel tööriistade kasutamine ja funktsioonikutse autonoomseks ülesannete täitmiseks ja töövoogude automatiseerimiseks

🏢

Ettevõtte teadmustöö

Keerulised ettevõtte töövoogud, mis nõuavad piiriüleseid tehisintellekti võimekusi järjepidevate ja usaldusväärsete väljunditega

💻

Üldine kodeerimisassistent

Koodi genereerimine, silumine, dokumenteerimine ja tarkvaraarenduse abi mitmes keeles

Teaduslik uurimistöö

Uurimisabi, kirjanduse ülevaade, teadusliku töökoormuse töötlemine ja hüpoteeside genereerimine

Otsinguga täiendatud genereerimine

Optimaalne jõudlus RAG süsteemidele usaldusväärse konteksti integreerimise ja täpse otsingu sünteesiga

🌍

Mitmekeelsed rakendused

Globaalsed ettevõtterakendused, mis nõuavad järjepidevat kvaliteeti üle 12 toetatud keele

Shannon Lite vs Shannon Pro

Valige oma vajadustele vastav Shannon mudel. Shannon Lite pakub kulutõhusat ettevõtte kasutuselevõttu, samas kui Shannon Pro pakub maksimaalset võimekust täiustatud mõttekäigu arutluse ja oskuste toega.

Funktsioon Shannon Lite 1.6 Shannon Pro 1.6
Baasmudel Mistral Large 3 (675B) Mistral Large 3 (675B)
Aktiivsed parameetrid 41B (Granulaarne MoE) 41B (Granulaarne MoE)
Täpsus NVFP4 (4-bit) Täielik BF16 (16-bit)
Koolitusjärgne andmestik 2500 Claude Opus 4.5 väljundit KIMI K2 Mõtlemisjäljed
Koolitusjärgne meetod Järelevalvega peenhäälestus GRPO (Group Relative Policy Optimization)
Arutlusrežiim Standard Mõtteketi jäljed
Oskuste tugi - Ainult ProPärisoskused
Kasutuselevõtt H100/A100 (Üksik sõlm) B200/H200 (FP8)
Parimaks Kulutõhus ettevõtte tehisintellekt Maksimaalne võimekus + arutlusvõime

Vajate täiustatud arutlusvõimet ja oskusi?

Shannon Pro 1.6 sisaldab KIMI K2 Mõtlemisjälgi koos GRPO koolitusega läbipaistva mõtteketi arutluse jaoks, lisaks pärisoskuste tuge kohandatud tehisintellekti töövoogude jaoks.

Avasta Shannon Pro

Koge Shannon Lite 1.6

Piiripealsed tehisintellekti võimekused kulutõhusa NVFP4 kvantiseerimisega. Kasutage H100 või A100 infrastruktuuril ettevõtte tasemel jõudluse saavutamiseks taskukohase hinnaga.

Kõik uurimislingid