Ne nuk mbajmë ose aksesojmë të dhënat e asnjë përdoruesi dhe nuk pezullojmë llogari, përveçse kur një authority e ligjshme kërkon enforcement action.
NVFP4 I Kuantizuar - AI për Ndërmarrje me Kosto Efektive

ShannonLite 1.6

AI për ndërmarrje me kosto efektive, mundësuar ngaMistral Large 3me675B parametra totalëdhe41B parametra aktivënëpërmjet arkitekturës granulare Mixture-of-Experts. I post-trajnuar në2,500 dalje të Claude Opus 4.5për ndjekje të shkëlqyer të udhëzimeve.Kuantizimi NVFP4mundëson vendosje me një nyje nëH100s ose A100s.

675B
Parametra Totalë
41B
Parametra Aktivë
NVFP4
Kuantizim
256K
Kontekst
2.5B
Kodues Vizual
Edicion Lite
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Specifikimet Teknike:
Modeli Bazë Mistral Large 3
Arkitekturë Granular MoE
Parametra Totalë 675B
Parametra Aktivë 41B
Kuantizim NVFP4
Pas Trajnimit Claude Opus 4.5
Mostra Trajnimi 2,500

Mistral Large 3: Përzierje Granulare Ekspertësh

Shannon Lite 1.6 është ndërtuar mbi Mistral Large 3, një model multimodal granular Mixture-of-Experts i avancuar projektuar nga themeli për besueshmëri, kuptim të kontekstit të gjatë dhe performancë të nivelit të prodhimit. Versioni i post-trajnuar me udhëzime është i akorduar imët për raste përdorimi për biseda, agjentë dhe të bazuara në udhëzime.

673B

Modeli i Gjuhës

Arkitekturë Granular MoE me 39B parametra aktivë për kalim përpara

2.5B

Kodues Vizual

Kodues multimodal i integruar për analizë imazhi dhe kuptim vizual

256K

Dritare Konteksti

Kontekst i zgjeruar për kuptim të plotë të dokumenteve dhe RAG

12+

Gjuhë

Anglisht, Frëngjisht, Spanjisht, Gjermanisht, Kinezisht, Japonisht, Koreançe, Arabisht dhe më shumë

Vendosje për Ndërmarrje me Kosto Efektive

Shannon Lite 1.6 leverages NVIDIA's NVFP4 (4-bit floating point) quantization technology to dramatically reduce memory requirements while preserving model quality. Deploy frontier-class AI on accessible GPU infrastructure without multi-node complexity.

💰

Kosto e Reduktuar e Infrastrukturës

Kuantizimi NVFP4 redukton gjurmën e memories me rreth 4 herë krahasuar me BF16, duke mundësuar vendosjen në më pak GPU dhe duke ulur ndjeshëm TCO-në për AI-në e ndërmarrjes.

Vendosje me Një Nyje

Vendosni modelin e plotë me 675B parametra në një nyje të H100s ose A100s. Pa orkestrim kompleks me shumë nyje, ulje të ngarkesës së rrjetit, operacione të thjeshtuara.

Cilësi e Ruajtur e Modelit

Teknikat e avancuara të kuantizimit ruajnë performancën e modelit në arsyetim, ndjekje udhëzimesh dhe detyra multimodale me degradim minimal të cilësisë.

Distilim i Njohurive Claude Opus 4.5

Shannon Lite 1.6 është post-trajnuar me përpikëri duke përdorur 2,500 dalje të kuruara me kujdes ngaClaude Opus 4.5, modeli më i aftë i Anthropic-ut. Kjo qasje e distilimit të njohurive kap modelet e avancuara të arsyetimit, interpretimin e nuancuar të udhëzimeve dhe cilësinë superiore të përgjigjeve.

Fondacioni Mistral Large 3 Instruct 2512

Ndërtuar mbi modelin Instruct të avancuar të Mistral-it (versioni 2512) në precizion BF16. Ky fondacion ofron aftësi të nivelit kufitar të projektuar për asistentë të nivelit të prodhimit, sisteme të zgjeruara me rikthim, ngarkesa pune shkencore dhe flukse pune komplekse të ndërmarrjeve.

Bazë BF16 Akorduar për Udhëzime Gati për Prodhime Licencë Apache 2.0

Distilim i Daljeve Claude Opus 4.5

I post-trajnuar në 2,500 dalje me cilësi të lartë nga Claude Opus 4.5, duke kapur aftësitë më të avancuara të arsyetimit të Anthropic-ut. Seti i të dhënave i kuruar fokusohet në ndjekje komplekse udhëzimesh, kuptim të nuancuar dhe gjenerim përgjigjesh me cilësi të lartë nëpër fusha të ndryshme.

2,500 Mostra Set të Dhënash i Kuruar Fokus në Cilësi Fusha të Ndryshme

Procesi i Kuantizimit NVFP4

Kuantizim i avancuar NVIDIA FP4 i aplikuar pas trajnimit për të reduktuar gjurmën e memories duke ruajtur cilësinë e modelit. Kalibruar posaçërisht për peshat e trajnuara pas trajnimit për të ruajtur transferimin e njohurive dhe aftësitë e ndjekjes së udhëzimeve të Claude Opus 4.5.

NVFP4 Saktësi 4-bitëshe Kalibruar Cilësia e Ruajtur

Vlerësim & Validim

Vlerësim gjithëpërfshirës nëpër standarde të ndjekjes së udhëzimeve, detyra arsyetimi dhe skenarë realë të ndërmarrjeve. Validuar për sjellje të qëndrueshme ndër-domeniale, dalje të qëndrueshme dhe performancë të besueshme në mjedise prodhimi.

Standardizuar Ndër-domenial Validuar për Prodhimi Dalje të Qëndrueshme

Opsione Fleksibël të Vendosjes së GPU-së

Shannon Lite 1.6 me kuantizim NVFP4 mundëson vendosje me kosto efektive në konfigurime standarde të industrisë të GPU-ve NVIDIA, duke e bërë AI-në kufitare të aksesueshme për vendosje në ndërmarrje pa kërkuar klastera të shtrenjtë me shumë nyje.

NVIDIA H100 SXM

Performancë optimale me arkitekturën Hopper dhe memorien HBM3

Nyje e Vetme (8x H100)
Saktësi NVFP4
80GB HBM3 për GPU
Dalje Maksimale

NVIDIA A100 SXM

Besueshmëri e provuar në GPU-të me arkitekturë Ampere

Nyje e Vetme (8x A100)
Saktësi NVFP4
80GB HBM2e për GPU
Kosto Efektive

Shannon Cloud

Vendosje plotësisht e menaxhuar me zero infrastrukturë

Akses i Menjëhershëm
Shkallëzim Automatik
Gati për REST API
99.9% SLA

Veçori të AI-së të Gatshme për Ndërmarrje

Shannon Lite 1.6 ofron aftësi kufitare të trashëguara nga Mistral Large 3 dhe të përmirësuara përmes trajnimit pas-trajnimit të Claude Opus 4.5, të optimizuara për ngarkesa pune prodhimi nëpër skenarë të ndryshëm ndërmarrjesh.

Vizion Multimodal

Koduesi i vizionit me 2.5B parametra i integruar mundëson analizën e imazheve, përgjigjen vizuale të pyetjeve dhe kuptimin e dokumenteve me imazhe.

Përsosmëri Shumëgjuhëshe

Mbështetje vendase për 12+ gjuhë duke përfshirë Anglishten, Frëngjishten, Spanjishten, Gjermanishten, Italishten, Portugalishten, Holandishten, Kinezishten, Japonishten, Koreane dhe Arabishten.

🤖

Aftësi Agjentike

Veçori agjentike më të mira në klasë me thirrje funksioni vendase dhe dalje JSON të strukturuar për përdorim autonom të mjeteve dhe automatizim të fluksit të punës.

Përmbajtje ndaj Kërkesave të Sistemit

Përmbajtje dhe mbështetje e fortë për kërkesat e sistemit, duke mundësuar kontroll të saktë të sjelljes dhe mirëmbajtje të qëndrueshme të personazhit.

Kontekst i Gjatë 256K

Dritare konteksti e zgjeruar për kuptim gjithëpërfshirës të dokumenteve, biseda të zgjeruara dhe gjenerim të shtuar me rikthim (RAG).

🔧

Thirrje Funksioni Vendase

Mbështetje e integruar për thirrje funksioni me dalje JSON të besueshme për integrim të qetë me mjete të jashtme, API dhe shërbime.

Optimizuar për Ngarkesa Pune Prodhimi

Me performancë të fuqishme me kontekst të gjatë, sjellje të qëndrueshme dhe konsistente ndër-domeniale, Shannon Lite 1.6 shkëlqen nëpër skenarë të ndryshëm ndërmarrjesh dhe kërkimorë.

📄

Kuptimi i Dokumenteve të Gjata

Përpunoni dhe analizoni dokumente të gjera, kontrata, raporte dhe punime kërkimore me dritaren e kontekstit 256K

🤖

Asistentë AI për Prodhimi

Fuqizoni asistentët AI të përditshëm me përgjigje të besueshme, konsistente dhe ndjekje të fortë të udhëzimeve

🔧

Flukse Pune Agjentike

Përdorim i mjeteve dhe thirrje funksioni të nivelit më të lartë për ekzekutim autonom të detyrave dhe automatizim të fluksit të punës

🏢

Punë me Njohuri të Ndërmarrjes

Flukse pune komplekse të ndërmarrjes që kërkojnë aftësi kufitare të AI-së me dalje konsistente dhe të besueshme

💻

Asistent i Përgjithshëm Kodimi

Gjenerim kodi, debugim, dokumentim dhe asistencë për zhvillimin e softuerit nëpër gjuhë të shumta

Kërkim Shkencor

Asistencë kërkimore, rishikim literature, përpunim i ngarkesave shkencore dhe gjenerim hipotezash

Gjenerim i Shtuar me Rikthim

Performancë optimale për sistemet RAG me integrim të besueshëm të kontekstit dhe sintezë të saktë të rikthimit

🌍

Aplikacione Shumëgjuhëshe

Aplikacione globale të ndërmarrjeve që kërkojnë cilësi konsistente nëpër 12+ gjuhë të mbështetura

Shannon Lite kundrejt Shannon Pro

Zgjidhni modelin e duhur Shannon për nevojat tuaja. Shannon Lite ofron vendosje me kosto efektive për ndërmarrje, ndërsa Shannon Pro ofron aftësi maksimale me arsyetim të avancuar zinxhir-mendimi dhe mbështetje për Aftësitë.

Veçori Shannon Lite 1.6 Shannon Pro 1.6
Model Baze Mistral Large 3 (675B) Mistral Large 3 (675B)
Parametra Aktivë 41B (MoE Granular) 41B (MoE Granular)
Saktësi NVFP4 (4-bit) BF16 i plotë (16-bit)
Të dhëna pas trajnimit 2,500 dalje të Claude Opus 4.5 Gjurmët e të Menduarit KIMI K2
Metoda pas trajnimit Rregullim i imët i mbikëqyrur GRPO (Optimizimi i Politikës Relative të Grupit)
Mënyra e arsyetimit Standard Gjurmët e Zinxhirit të Mendimit
Mbështetje për Aftësitë - Vetëm ProAftësi Vendase
Vendosja H100/A100 (Nyje e Vetme) B200/H200 (FP8)
Më e mira për AI e Korporatës me Kosto Efektive Kapacitet Maksimal + Arsyetim

Keni nevojë për Arsyetim dhe Aftësi të Avancuara?

Shannon Pro 1.6 përmban Gjurmët e të Menduarit KIMI K2 me trajnim GRPO për arsyetim transparent të zinxhirit të mendimit, plus mbështetje për Aftësi vendase për rrjedha pune të personalizuara të AI.

Eksploroni Shannon Pro

Përjetoni Shannon Lite 1.6

Aftësi të AI kufitare me kuantizim NVFP4 me kosto efektive. Vendosni në infrastrukturën H100 ose A100 për performancë të nivelit të korporatës me kosto të përballueshme.

Të gjitha research links