Ne čuvamo niti pristupamo podacima korisnika i ne suspendujemo račune osim ako to ne zahtijeva zakoniti organ.

NVFP4 Квантизован - Исплатив AI за предузећа

ShannonЛајт 1.6

Исплатив AI за предузећа покретанMistral Large 3са675B укупних параметараи41B активних параметаракроз грануларну архитектуру Мешавине експерата. Пост-трениран на2,500 Claude Opus 4.5 излазаза изузетно праћење инструкција.NVFP4 квантизацијаомогућава имплементацију на једном чвору наH100s или A100s.

675B

Укупни параметри

41B

Активни параметри

NVFP4

Квантизација

256K

Контекст

2.5B

Визуелни енкодер

Испробајте Shannon Lite Погледајте Документацију

Лајт издање

Shannon Lite 1.6

v1.6.0-lite-nvfp4

Основни модел Mistral Large 3

Архитектура Грануларна MoE

Укупни параметри 675B

Активни параметри 41B

Квантизација NVFP4

Пост-тренинг Claude Opus 4.5

Узорци за тренинг 2,500

Техничка архитектура

Mistral Large 3: Грануларна Мешавина експерата

Shannon Lite 1.6 је изграђен на Mistral Large 3, најсавременијем мултимодалном грануларном моделу Мешавине експерата дизајнираном од темеља за поузданост, разумевање дугог контекста и перформансе спремне за продукцију. Инструкциона пост-тренирана верзија је фино подешена за чет, агентске и случајеве употребе засноване на инструкцијама.

673B

Језички модел

Грануларна MoE архитектура са 39B активних параметара по пролазу унапред

2.5B

Визуелни енкодер

Интегрисани мултимодални енкодер за анализу слика и визуелно разумевање

256K

Прозор контекста

Проширени контекст за свеобухватно разумевање докумената и RAG

12+

Језици

Енглески, Француски, Шпански, Немачки, Кинески, Јапански, Корејски, Арапски и више

NVFP4 Квантизација

Исплатива имплементација за предузећа

Shannon Lite 1.6 користи NVIDIA-ину NVFP4 (4-битна покретна тачка) технологију квантизације да драстично смањи захтеве за меморијом док чува квалитет модела. Имплементирајте AI врхунске класе на приступачној GPU инфраструктури без сложености више чворова.

💰

Смањени трошкови инфраструктуре

NVFP4 квантизација смањује меморијски отисак за приближно 4x у поређењу са BF16, омогућавајући имплементацију на мање GPU-а и драстично смањујући TCO за AI за предузећа.

Имплементација на једном чвору

Имплементирајте пуни модел од 675B параметара на једном чвору H100s или A100s. Нема сложене оркестрације више чворова, смањени мрежни трошкови, поједностављене операције.

Очуван квалитет модела

Напредне технике квантизације одржавају перформансе модела у расуђивању, праћењу инструкција и мултимодалним задацима са минималном деградацијом квалитета.

Методологија пост-тренинга

Claude Opus 4.5 Дестилација знања

Shannon Lite 1.6 је педантно пост-трениран користећи 2,500 пажљиво одабраних излаза изClaude Opus 4.5, Anthropic-овог најспособнијег модела. Овај приступ дестилације знања хвата напредне обрасце расуђивања, нијансирано тумачење инструкција и супериоран квалитет одговора.

Mistral Large 3 Instruct 2512 Основа

Изграђен на Mistral-овом најсавременијем Instruct моделу (верзија 2512) у BF16 прецизности. Ова основа пружа врхунске могућности пројектоване за асистенте спремне за продукцију, системе побољшане преузимањем, научна оптерећења и сложене радне токове предузећа.

BF16 Основа Подешен за инструкције Спреман за продукцију Apache 2.0 License

Claude Opus 4.5 Дестилација излаза

Пост-трениран на 2,500 висококвалитетних излаза из Claude Opus 4.5, хватајући Anthropic-ове најнапредније способности расуђивања. Одабрани скуп података се фокусира на комплексно праћење инструкција, нијансирано разумевање и генерисање висококвалитетних одговора у различитим доменима.

2,500 Узорака Одабрани скуп података Фокус на квалитет Различити домени

NVFP4 Proces kvantizacije

Napredna NVIDIA FP4 kvantizacija primenjena nakon obuke za smanjenje zauzeća memorije uz održavanje kvaliteta modela. Kalibrisana specifično za težine nakon obuke kako bi se očuvao prenos znanja i sposobnosti praćenja instrukcija Claude Opus 4.5.

NVFP4 4-bitna preciznost Kalibrisano Kvalitet očuvan

Evaluacija i validacija

Sveobuhvatna evaluacija kroz referentne vrednosti praćenja instrukcija, zadatke rezonovanja i scenarije preduzeća iz stvarnog sveta. Validiran za dosledno ponašanje u različitim domenima, stabilne izlaze i pouzdane performanse u proizvodnim okruženjima.

Referentno testirano Međudomensko Validirano za proizvodnju Stabilni izlazi

Infrastruktura za primenu

Fleksibilne opcije primene GPU-a

Shannon Lite 1.6 sa NVFP4 kvantizacijom omogućava isplativu primenu na industrijskim standardnim NVIDIA GPU konfiguracijama, čineći graničnu veštačku inteligenciju dostupnom za primene u preduzećima bez potrebe za skupim višečvornim klasterima.

NVIDIA H100 SXM

Optimalne performanse sa Hopper arhitekturom i HBM3 memorijom

Jedan čvor (8x H100)

NVFP4 preciznost

80GB HBM3 po GPU-u

Maksimalna propusnost

NVIDIA A100 SXM

Dokazana pouzdanost na GPU-ovima Ampere arhitekture

Jedan čvor (8x A100)

NVFP4 preciznost

80GB HBM2e po GPU-u

Isplativo

Shannon Cloud

Potpuno upravljana primena sa nultom infrastrukturom

Trenutni pristup

Automatsko skaliranje

Spreman za REST API

99.9% SLA

Mogućnosti modela

Funkcije veštačke inteligencije spremne za preduzeća

Shannon Lite 1.6 pruža granične mogućnosti nasleđene od Mistral Large 3 i poboljšane kroz Claude Opus 4.5 nakon obuke, optimizovane za proizvodna opterećenja u različitim scenarijima preduzeća.

Multimodalni vid

Integrisani vizuelni enkoder sa 2.5 milijardi parametara omogućava analizu slika, vizuelno odgovaranje na pitanja i razumevanje dokumenata sa slikama.

Višejezična izvrsnost

Nativna podrška za 12+ jezika uključujući engleski, francuski, španski, nemački, italijanski, portugalski, holandski, kineski, japanski, korejski i arapski.

🤖

Agentne mogućnosti

Najbolje u klasi agentne funkcije sa nativnim pozivanjem funkcija i strukturiranim JSON izlazom za autonomno korišćenje alata i automatizaciju radnog toka.

Pridržavanje sistemskih upita

Snažno pridržavanje i podrška sistemskim upitima, omogućavajući preciznu kontrolu ponašanja i dosledno održavanje persone.

256K dugi kontekst

Prošireni kontekstni prozor za sveobuhvatno razumevanje dokumenata, proširene razgovore i generisanje poboljšano preuzimanjem (RAG).

🔧

Nativno pozivanje funkcija

Ugrađena podrška za pozivanje funkcija sa pouzdanim JSON izlazom za besprekornu integraciju sa eksternim alatima, API-jima i uslugama.

Slučajevi upotrebe

Optimizovano za proizvodna opterećenja

Sa moćnim performansama dugog konteksta, stabilnim i doslednim ponašanjem u različitim domenima, Shannon Lite 1.6 se ističe u različitim scenarijima preduzeća i istraživanja.

📄

Razumevanje dugih dokumenata

Obrađujte i analizirajte opsežne dokumente, ugovore, izveštaje i naučne radove sa 256K kontekstnim prozorom

🤖

AI asistenti za proizvodnju

Pokrećite svakodnevne AI asistente sa pouzdanim, doslednim odgovorima i snažnim praćenjem instrukcija

🔧

Agentni radni tokovi

Najsavremenije korišćenje alata i pozivanje funkcija za autonomno izvršavanje zadataka i automatizaciju radnog toka

🏢

Rad sa znanjem u preduzeću

Složeni radni tokovi preduzeća koji zahtevaju granične AI mogućnosti sa doslednim, pouzdanim izlazima

💻

Opšti asistent za kodiranje

Generisanje koda, otklanjanje grešaka, dokumentacija i pomoć u razvoju softvera na više jezika

Naučno istraživanje

Pomoć u istraživanju, pregled literature, obrada naučnih opterećenja i generisanje hipoteza

Generisanje poboljšano preuzimanjem

Optimalne performanse za RAG sisteme sa pouzdanom integracijom konteksta i preciznom sintezom preuzimanja

🌍

Višejezične aplikacije

Globalne aplikacije preduzeća koje zahtevaju dosledan kvalitet na 12+ podržanih jezika

Poređenje modela

Shannon Lite naspram Shannon Pro

Izaberite pravi Shannon model za vaše potrebe. Shannon Lite nudi isplativu primenu u preduzećima, dok Shannon Pro pruža maksimalne mogućnosti sa naprednim rezonovanjem lanca misli i podrškom za veštine.

Funkcija	Shannon Lite 1.6	Shannon Pro 1.6
Osnovni model	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Aktivni parametri	41B (Granular MoE)	41B (Granular MoE)
Preciznost	NVFP4 (4-битни)	Пуни BF16 (16-битни)
Пост-тренинг подаци	2.500 излаза Claude Opus 4.5	KIMI K2 Трагови размишљања
Пост-тренинг метода	Надгледано фино подешавање	GRPO (Оптимизација политике релативне групе)
Режим расуђивања	Стандардни	Трагови ланца мисли
Подршка за вештине	-	Само ПроИзворне вештине
Примена	H100/A100 (Један чвор)	B200/H200 (FP8)
Најбоље за	Исплатив корпоративни АИ	Максимална способност + расуђивање

Искусите Shannon Lite 1.6

Могућности граничног АИ са исплативом NVFP4 квантизацијом. Примените на H100 или A100 инфраструктури за перформансе корпоративног нивоа по приступачној цени.

Почните да користите Shannon Lite Упоредите са Про

Svi istraživački linkovi

Politika odgovorne upotrebe Uslovi korišćenja Shannon V1 Balansiran Shannon V1 Duboko Shannon V1.5 Razmišljanje Shannon V1.5 Duboko Razmišljanje Shannon Лајт 1.6 Shannon Pro 1.6 Kako smo obučili Mixtral na GPT-5 Pro putem OpenRouter destilacije Kako smo obučili Shannon V1.5 da razmišlja koristeći GRPO Penetracijsko testiranje pomoću AI: Shannon AI sada radi na Claude Code Prilagođeni Shannon Projekti Veštine

ShannonЛајт 1.6

Mistral Large 3: Грануларна Мешавина експерата

Језички модел

Визуелни енкодер

Прозор контекста

Језици

Исплатива имплементација за предузећа

Смањени трошкови инфраструктуре

Имплементација на једном чвору

Очуван квалитет модела

Claude Opus 4.5 Дестилација знања

Mistral Large 3 Instruct 2512 Основа

Claude Opus 4.5 Дестилација излаза

NVFP4 Proces kvantizacije

Evaluacija i validacija

Fleksibilne opcije primene GPU-a

NVIDIA H100 SXM

NVIDIA A100 SXM

Shannon Cloud

Funkcije veštačke inteligencije spremne za preduzeća

Multimodalni vid

Višejezična izvrsnost

Agentne mogućnosti

Pridržavanje sistemskih upita

256K dugi kontekst

Nativno pozivanje funkcija

Optimizovano za proizvodna opterećenja

Razumevanje dugih dokumenata

AI asistenti za proizvodnju

Agentni radni tokovi

Rad sa znanjem u preduzeću

Opšti asistent za kodiranje

Naučno istraživanje

Generisanje poboljšano preuzimanjem

Višejezične aplikacije

Shannon Lite naspram Shannon Pro

Потребни су напредно расуђивање и вештине?

Искусите Shannon Lite 1.6

Svi istraživački linkovi