Ne nuk mbajmë ose aksesojmë të dhënat e asnjë përdoruesi dhe nuk pezullojmë llogari, përveçse kur një authority e ligjshme kërkon enforcement action.

NVFP4 I Kuantizuar - AI për Ndërmarrje me Kosto Efektive

ShannonLite 1.6

AI për ndërmarrje me kosto efektive, mundësuar ngaMistral Large 3me675B parametra totalëdhe41B parametra aktivënëpërmjet arkitekturës granulare Mixture-of-Experts. I post-trajnuar në2,500 dalje të Claude Opus 4.5për ndjekje të shkëlqyer të udhëzimeve.Kuantizimi NVFP4mundëson vendosje me një nyje nëH100s ose A100s.

675B

Parametra Totalë

41B

Parametra Aktivë

NVFP4

Kuantizim

256K

Kontekst

2.5B

Kodues Vizual

Provo Shannon Lite Shiko Dokumentacionin

Edicion Lite

Shannon Lite 1.6

v1.6.0-lite-nvfp4

Modeli Bazë Mistral Large 3

Arkitekturë Granular MoE

Parametra Totalë 675B

Parametra Aktivë 41B

Kuantizim NVFP4

Pas Trajnimit Claude Opus 4.5

Mostra Trajnimi 2,500

Arkitektura Teknike

Mistral Large 3: Përzierje Granulare Ekspertësh

Shannon Lite 1.6 është ndërtuar mbi Mistral Large 3, një model multimodal granular Mixture-of-Experts i avancuar projektuar nga themeli për besueshmëri, kuptim të kontekstit të gjatë dhe performancë të nivelit të prodhimit. Versioni i post-trajnuar me udhëzime është i akorduar imët për raste përdorimi për biseda, agjentë dhe të bazuara në udhëzime.

673B

Modeli i Gjuhës

Arkitekturë Granular MoE me 39B parametra aktivë për kalim përpara

2.5B

Kodues Vizual

Kodues multimodal i integruar për analizë imazhi dhe kuptim vizual

256K

Dritare Konteksti

Kontekst i zgjeruar për kuptim të plotë të dokumenteve dhe RAG

12+

Gjuhë

Anglisht, Frëngjisht, Spanjisht, Gjermanisht, Kinezisht, Japonisht, Koreançe, Arabisht dhe më shumë

Kuantizimi NVFP4

Vendosje për Ndërmarrje me Kosto Efektive

Shannon Lite 1.6 leverages NVIDIA's NVFP4 (4-bit floating point) quantization technology to dramatically reduce memory requirements while preserving model quality. Deploy frontier-class AI on accessible GPU infrastructure without multi-node complexity.

💰

Kosto e Reduktuar e Infrastrukturës

Kuantizimi NVFP4 redukton gjurmën e memories me rreth 4 herë krahasuar me BF16, duke mundësuar vendosjen në më pak GPU dhe duke ulur ndjeshëm TCO-në për AI-në e ndërmarrjes.

Vendosje me Një Nyje

Vendosni modelin e plotë me 675B parametra në një nyje të H100s ose A100s. Pa orkestrim kompleks me shumë nyje, ulje të ngarkesës së rrjetit, operacione të thjeshtuara.

Cilësi e Ruajtur e Modelit

Teknikat e avancuara të kuantizimit ruajnë performancën e modelit në arsyetim, ndjekje udhëzimesh dhe detyra multimodale me degradim minimal të cilësisë.

Metodologjia e Pas-Trajnimit

Distilim i Njohurive Claude Opus 4.5

Shannon Lite 1.6 është post-trajnuar me përpikëri duke përdorur 2,500 dalje të kuruara me kujdes ngaClaude Opus 4.5, modeli më i aftë i Anthropic-ut. Kjo qasje e distilimit të njohurive kap modelet e avancuara të arsyetimit, interpretimin e nuancuar të udhëzimeve dhe cilësinë superiore të përgjigjeve.

Fondacioni Mistral Large 3 Instruct 2512

Ndërtuar mbi modelin Instruct të avancuar të Mistral-it (versioni 2512) në precizion BF16. Ky fondacion ofron aftësi të nivelit kufitar të projektuar për asistentë të nivelit të prodhimit, sisteme të zgjeruara me rikthim, ngarkesa pune shkencore dhe flukse pune komplekse të ndërmarrjeve.

Bazë BF16 Akorduar për Udhëzime Gati për Prodhime Licencë Apache 2.0

Distilim i Daljeve Claude Opus 4.5

I post-trajnuar në 2,500 dalje me cilësi të lartë nga Claude Opus 4.5, duke kapur aftësitë më të avancuara të arsyetimit të Anthropic-ut. Seti i të dhënave i kuruar fokusohet në ndjekje komplekse udhëzimesh, kuptim të nuancuar dhe gjenerim përgjigjesh me cilësi të lartë nëpër fusha të ndryshme.

2,500 Mostra Set të Dhënash i Kuruar Fokus në Cilësi Fusha të Ndryshme

Procesi i Kuantizimit NVFP4

Kuantizim i avancuar NVIDIA FP4 i aplikuar pas trajnimit për të reduktuar gjurmën e memories duke ruajtur cilësinë e modelit. Kalibruar posaçërisht për peshat e trajnuara pas trajnimit për të ruajtur transferimin e njohurive dhe aftësitë e ndjekjes së udhëzimeve të Claude Opus 4.5.

NVFP4 Saktësi 4-bitëshe Kalibruar Cilësia e Ruajtur

Vlerësim & Validim

Vlerësim gjithëpërfshirës nëpër standarde të ndjekjes së udhëzimeve, detyra arsyetimi dhe skenarë realë të ndërmarrjeve. Validuar për sjellje të qëndrueshme ndër-domeniale, dalje të qëndrueshme dhe performancë të besueshme në mjedise prodhimi.

Standardizuar Ndër-domenial Validuar për Prodhimi Dalje të Qëndrueshme

Infrastruktura e Vendosjes

Opsione Fleksibël të Vendosjes së GPU-së

Shannon Lite 1.6 me kuantizim NVFP4 mundëson vendosje me kosto efektive në konfigurime standarde të industrisë të GPU-ve NVIDIA, duke e bërë AI-në kufitare të aksesueshme për vendosje në ndërmarrje pa kërkuar klastera të shtrenjtë me shumë nyje.

NVIDIA H100 SXM

Performancë optimale me arkitekturën Hopper dhe memorien HBM3

Nyje e Vetme (8x H100)

Saktësi NVFP4

80GB HBM3 për GPU

Dalje Maksimale

NVIDIA A100 SXM

Besueshmëri e provuar në GPU-të me arkitekturë Ampere

Nyje e Vetme (8x A100)

Saktësi NVFP4

80GB HBM2e për GPU

Kosto Efektive

Shannon Cloud

Vendosje plotësisht e menaxhuar me zero infrastrukturë

Akses i Menjëhershëm

Shkallëzim Automatik

Gati për REST API

99.9% SLA

Aftësitë e Modelit

Veçori të AI-së të Gatshme për Ndërmarrje

Shannon Lite 1.6 ofron aftësi kufitare të trashëguara nga Mistral Large 3 dhe të përmirësuara përmes trajnimit pas-trajnimit të Claude Opus 4.5, të optimizuara për ngarkesa pune prodhimi nëpër skenarë të ndryshëm ndërmarrjesh.

Vizion Multimodal

Koduesi i vizionit me 2.5B parametra i integruar mundëson analizën e imazheve, përgjigjen vizuale të pyetjeve dhe kuptimin e dokumenteve me imazhe.

Përsosmëri Shumëgjuhëshe

Mbështetje vendase për 12+ gjuhë duke përfshirë Anglishten, Frëngjishten, Spanjishten, Gjermanishten, Italishten, Portugalishten, Holandishten, Kinezishten, Japonishten, Koreane dhe Arabishten.

🤖

Aftësi Agjentike

Veçori agjentike më të mira në klasë me thirrje funksioni vendase dhe dalje JSON të strukturuar për përdorim autonom të mjeteve dhe automatizim të fluksit të punës.

Përmbajtje ndaj Kërkesave të Sistemit

Përmbajtje dhe mbështetje e fortë për kërkesat e sistemit, duke mundësuar kontroll të saktë të sjelljes dhe mirëmbajtje të qëndrueshme të personazhit.

Kontekst i Gjatë 256K

Dritare konteksti e zgjeruar për kuptim gjithëpërfshirës të dokumenteve, biseda të zgjeruara dhe gjenerim të shtuar me rikthim (RAG).

🔧

Thirrje Funksioni Vendase

Mbështetje e integruar për thirrje funksioni me dalje JSON të besueshme për integrim të qetë me mjete të jashtme, API dhe shërbime.

Raste Përdorimi

Optimizuar për Ngarkesa Pune Prodhimi

Me performancë të fuqishme me kontekst të gjatë, sjellje të qëndrueshme dhe konsistente ndër-domeniale, Shannon Lite 1.6 shkëlqen nëpër skenarë të ndryshëm ndërmarrjesh dhe kërkimorë.

📄

Kuptimi i Dokumenteve të Gjata

Përpunoni dhe analizoni dokumente të gjera, kontrata, raporte dhe punime kërkimore me dritaren e kontekstit 256K

🤖

Asistentë AI për Prodhimi

Fuqizoni asistentët AI të përditshëm me përgjigje të besueshme, konsistente dhe ndjekje të fortë të udhëzimeve

🔧

Flukse Pune Agjentike

Përdorim i mjeteve dhe thirrje funksioni të nivelit më të lartë për ekzekutim autonom të detyrave dhe automatizim të fluksit të punës

🏢

Punë me Njohuri të Ndërmarrjes

Flukse pune komplekse të ndërmarrjes që kërkojnë aftësi kufitare të AI-së me dalje konsistente dhe të besueshme

💻

Asistent i Përgjithshëm Kodimi

Gjenerim kodi, debugim, dokumentim dhe asistencë për zhvillimin e softuerit nëpër gjuhë të shumta

Kërkim Shkencor

Asistencë kërkimore, rishikim literature, përpunim i ngarkesave shkencore dhe gjenerim hipotezash

Gjenerim i Shtuar me Rikthim

Performancë optimale për sistemet RAG me integrim të besueshëm të kontekstit dhe sintezë të saktë të rikthimit

🌍

Aplikacione Shumëgjuhëshe

Aplikacione globale të ndërmarrjeve që kërkojnë cilësi konsistente nëpër 12+ gjuhë të mbështetura

Krahasimi i Modeleve

Shannon Lite kundrejt Shannon Pro

Zgjidhni modelin e duhur Shannon për nevojat tuaja. Shannon Lite ofron vendosje me kosto efektive për ndërmarrje, ndërsa Shannon Pro ofron aftësi maksimale me arsyetim të avancuar zinxhir-mendimi dhe mbështetje për Aftësitë.

Veçori	Shannon Lite 1.6	Shannon Pro 1.6
Model Baze	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Parametra Aktivë	41B (MoE Granular)	41B (MoE Granular)
Saktësi	NVFP4 (4-bit)	BF16 i plotë (16-bit)
Të dhëna pas trajnimit	2,500 dalje të Claude Opus 4.5	Gjurmët e të Menduarit KIMI K2
Metoda pas trajnimit	Rregullim i imët i mbikëqyrur	GRPO (Optimizimi i Politikës Relative të Grupit)
Mënyra e arsyetimit	Standard	Gjurmët e Zinxhirit të Mendimit
Mbështetje për Aftësitë	-	Vetëm ProAftësi Vendase
Vendosja	H100/A100 (Nyje e Vetme)	B200/H200 (FP8)
Më e mira për	AI e Korporatës me Kosto Efektive	Kapacitet Maksimal + Arsyetim

Përjetoni Shannon Lite 1.6

Aftësi të AI kufitare me kuantizim NVFP4 me kosto efektive. Vendosni në infrastrukturën H100 ose A100 për performancë të nivelit të korporatës me kosto të përballueshme.

Filloni të Përdorni Shannon Lite Krahaso me Pro

Të gjitha research links

Politika e Përdorimit të Përgjegjshëm Kushtet e Shërbimit Shannon V1 E Balancuar Shannon V1 I thellë Shannon V1.5 Mendim Shannon V1.5 Mendim i Thellë Shannon Lite 1.6 Shannon Pro 1.6 Si e Trajnuam Mixtral në GPT-5 Pro nëpërmjet Distilimit OpenRouter Si e trajnuam Shannon V1.5 të mendojë duke përdorur GRPO Testim penetrimi duke përdorur AI: Shannon AI tani po punon me Claude Code Custom Shannon Projekte Aftësi

ShannonLite 1.6

Mistral Large 3: Përzierje Granulare Ekspertësh

Modeli i Gjuhës

Kodues Vizual

Dritare Konteksti

Gjuhë

Vendosje për Ndërmarrje me Kosto Efektive

Kosto e Reduktuar e Infrastrukturës

Vendosje me Një Nyje

Cilësi e Ruajtur e Modelit

Distilim i Njohurive Claude Opus 4.5

Fondacioni Mistral Large 3 Instruct 2512

Distilim i Daljeve Claude Opus 4.5

Procesi i Kuantizimit NVFP4

Vlerësim & Validim

Opsione Fleksibël të Vendosjes së GPU-së

NVIDIA H100 SXM

NVIDIA A100 SXM

Shannon Cloud

Veçori të AI-së të Gatshme për Ndërmarrje

Vizion Multimodal

Përsosmëri Shumëgjuhëshe

Aftësi Agjentike

Përmbajtje ndaj Kërkesave të Sistemit

Kontekst i Gjatë 256K

Thirrje Funksioni Vendase

Optimizuar për Ngarkesa Pune Prodhimi

Kuptimi i Dokumenteve të Gjata

Asistentë AI për Prodhimi

Flukse Pune Agjentike

Punë me Njohuri të Ndërmarrjes

Asistent i Përgjithshëm Kodimi

Kërkim Shkencor

Gjenerim i Shtuar me Rikthim

Aplikacione Shumëgjuhëshe

Shannon Lite kundrejt Shannon Pro

Keni nevojë për Arsyetim dhe Aftësi të Avancuara?

Përjetoni Shannon Lite 1.6

Të gjitha research links