Ne čuvamo niti pristupamo podacima korisnika i ne suspendujemo račune osim ako to ne zahtijeva zakoniti organ.
NVFP4 Квантизован - Исплатив AI за предузећа

ShannonЛајт 1.6

Исплатив AI за предузећа покретанMistral Large 3са675B укупних параметараи41B активних параметаракроз грануларну архитектуру Мешавине експерата. Пост-трениран на2,500 Claude Opus 4.5 излазаза изузетно праћење инструкција.NVFP4 квантизацијаомогућава имплементацију на једном чвору наH100s или A100s.

675B
Укупни параметри
41B
Активни параметри
NVFP4
Квантизација
256K
Контекст
2.5B
Визуелни енкодер
Лајт издање
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Техничке спецификације:
Основни модел Mistral Large 3
Архитектура Грануларна MoE
Укупни параметри 675B
Активни параметри 41B
Квантизација NVFP4
Пост-тренинг Claude Opus 4.5
Узорци за тренинг 2,500

Mistral Large 3: Грануларна Мешавина експерата

Shannon Lite 1.6 је изграђен на Mistral Large 3, најсавременијем мултимодалном грануларном моделу Мешавине експерата дизајнираном од темеља за поузданост, разумевање дугог контекста и перформансе спремне за продукцију. Инструкциона пост-тренирана верзија је фино подешена за чет, агентске и случајеве употребе засноване на инструкцијама.

673B

Језички модел

Грануларна MoE архитектура са 39B активних параметара по пролазу унапред

2.5B

Визуелни енкодер

Интегрисани мултимодални енкодер за анализу слика и визуелно разумевање

256K

Прозор контекста

Проширени контекст за свеобухватно разумевање докумената и RAG

12+

Језици

Енглески, Француски, Шпански, Немачки, Кинески, Јапански, Корејски, Арапски и више

Исплатива имплементација за предузећа

Shannon Lite 1.6 користи NVIDIA-ину NVFP4 (4-битна покретна тачка) технологију квантизације да драстично смањи захтеве за меморијом док чува квалитет модела. Имплементирајте AI врхунске класе на приступачној GPU инфраструктури без сложености више чворова.

💰

Смањени трошкови инфраструктуре

NVFP4 квантизација смањује меморијски отисак за приближно 4x у поређењу са BF16, омогућавајући имплементацију на мање GPU-а и драстично смањујући TCO за AI за предузећа.

Имплементација на једном чвору

Имплементирајте пуни модел од 675B параметара на једном чвору H100s или A100s. Нема сложене оркестрације више чворова, смањени мрежни трошкови, поједностављене операције.

Очуван квалитет модела

Напредне технике квантизације одржавају перформансе модела у расуђивању, праћењу инструкција и мултимодалним задацима са минималном деградацијом квалитета.

Claude Opus 4.5 Дестилација знања

Shannon Lite 1.6 је педантно пост-трениран користећи 2,500 пажљиво одабраних излаза изClaude Opus 4.5, Anthropic-овог најспособнијег модела. Овај приступ дестилације знања хвата напредне обрасце расуђивања, нијансирано тумачење инструкција и супериоран квалитет одговора.

Mistral Large 3 Instruct 2512 Основа

Изграђен на Mistral-овом најсавременијем Instruct моделу (верзија 2512) у BF16 прецизности. Ова основа пружа врхунске могућности пројектоване за асистенте спремне за продукцију, системе побољшане преузимањем, научна оптерећења и сложене радне токове предузећа.

BF16 Основа Подешен за инструкције Спреман за продукцију Apache 2.0 License

Claude Opus 4.5 Дестилација излаза

Пост-трениран на 2,500 висококвалитетних излаза из Claude Opus 4.5, хватајући Anthropic-ове најнапредније способности расуђивања. Одабрани скуп података се фокусира на комплексно праћење инструкција, нијансирано разумевање и генерисање висококвалитетних одговора у различитим доменима.

2,500 Узорака Одабрани скуп података Фокус на квалитет Различити домени

NVFP4 Proces kvantizacije

Napredna NVIDIA FP4 kvantizacija primenjena nakon obuke za smanjenje zauzeća memorije uz održavanje kvaliteta modela. Kalibrisana specifično za težine nakon obuke kako bi se očuvao prenos znanja i sposobnosti praćenja instrukcija Claude Opus 4.5.

NVFP4 4-bitna preciznost Kalibrisano Kvalitet očuvan

Evaluacija i validacija

Sveobuhvatna evaluacija kroz referentne vrednosti praćenja instrukcija, zadatke rezonovanja i scenarije preduzeća iz stvarnog sveta. Validiran za dosledno ponašanje u različitim domenima, stabilne izlaze i pouzdane performanse u proizvodnim okruženjima.

Referentno testirano Međudomensko Validirano za proizvodnju Stabilni izlazi

Fleksibilne opcije primene GPU-a

Shannon Lite 1.6 sa NVFP4 kvantizacijom omogućava isplativu primenu na industrijskim standardnim NVIDIA GPU konfiguracijama, čineći graničnu veštačku inteligenciju dostupnom za primene u preduzećima bez potrebe za skupim višečvornim klasterima.

NVIDIA H100 SXM

Optimalne performanse sa Hopper arhitekturom i HBM3 memorijom

Jedan čvor (8x H100)
NVFP4 preciznost
80GB HBM3 po GPU-u
Maksimalna propusnost

NVIDIA A100 SXM

Dokazana pouzdanost na GPU-ovima Ampere arhitekture

Jedan čvor (8x A100)
NVFP4 preciznost
80GB HBM2e po GPU-u
Isplativo

Shannon Cloud

Potpuno upravljana primena sa nultom infrastrukturom

Trenutni pristup
Automatsko skaliranje
Spreman za REST API
99.9% SLA

Funkcije veštačke inteligencije spremne za preduzeća

Shannon Lite 1.6 pruža granične mogućnosti nasleđene od Mistral Large 3 i poboljšane kroz Claude Opus 4.5 nakon obuke, optimizovane za proizvodna opterećenja u različitim scenarijima preduzeća.

Multimodalni vid

Integrisani vizuelni enkoder sa 2.5 milijardi parametara omogućava analizu slika, vizuelno odgovaranje na pitanja i razumevanje dokumenata sa slikama.

Višejezična izvrsnost

Nativna podrška za 12+ jezika uključujući engleski, francuski, španski, nemački, italijanski, portugalski, holandski, kineski, japanski, korejski i arapski.

🤖

Agentne mogućnosti

Najbolje u klasi agentne funkcije sa nativnim pozivanjem funkcija i strukturiranim JSON izlazom za autonomno korišćenje alata i automatizaciju radnog toka.

Pridržavanje sistemskih upita

Snažno pridržavanje i podrška sistemskim upitima, omogućavajući preciznu kontrolu ponašanja i dosledno održavanje persone.

256K dugi kontekst

Prošireni kontekstni prozor za sveobuhvatno razumevanje dokumenata, proširene razgovore i generisanje poboljšano preuzimanjem (RAG).

🔧

Nativno pozivanje funkcija

Ugrađena podrška za pozivanje funkcija sa pouzdanim JSON izlazom za besprekornu integraciju sa eksternim alatima, API-jima i uslugama.

Optimizovano za proizvodna opterećenja

Sa moćnim performansama dugog konteksta, stabilnim i doslednim ponašanjem u različitim domenima, Shannon Lite 1.6 se ističe u različitim scenarijima preduzeća i istraživanja.

📄

Razumevanje dugih dokumenata

Obrađujte i analizirajte opsežne dokumente, ugovore, izveštaje i naučne radove sa 256K kontekstnim prozorom

🤖

AI asistenti za proizvodnju

Pokrećite svakodnevne AI asistente sa pouzdanim, doslednim odgovorima i snažnim praćenjem instrukcija

🔧

Agentni radni tokovi

Najsavremenije korišćenje alata i pozivanje funkcija za autonomno izvršavanje zadataka i automatizaciju radnog toka

🏢

Rad sa znanjem u preduzeću

Složeni radni tokovi preduzeća koji zahtevaju granične AI mogućnosti sa doslednim, pouzdanim izlazima

💻

Opšti asistent za kodiranje

Generisanje koda, otklanjanje grešaka, dokumentacija i pomoć u razvoju softvera na više jezika

Naučno istraživanje

Pomoć u istraživanju, pregled literature, obrada naučnih opterećenja i generisanje hipoteza

Generisanje poboljšano preuzimanjem

Optimalne performanse za RAG sisteme sa pouzdanom integracijom konteksta i preciznom sintezom preuzimanja

🌍

Višejezične aplikacije

Globalne aplikacije preduzeća koje zahtevaju dosledan kvalitet na 12+ podržanih jezika

Shannon Lite naspram Shannon Pro

Izaberite pravi Shannon model za vaše potrebe. Shannon Lite nudi isplativu primenu u preduzećima, dok Shannon Pro pruža maksimalne mogućnosti sa naprednim rezonovanjem lanca misli i podrškom za veštine.

Funkcija Shannon Lite 1.6 Shannon Pro 1.6
Osnovni model Mistral Large 3 (675B) Mistral Large 3 (675B)
Aktivni parametri 41B (Granular MoE) 41B (Granular MoE)
Preciznost NVFP4 (4-битни) Пуни BF16 (16-битни)
Пост-тренинг подаци 2.500 излаза Claude Opus 4.5 KIMI K2 Трагови размишљања
Пост-тренинг метода Надгледано фино подешавање GRPO (Оптимизација политике релативне групе)
Режим расуђивања Стандардни Трагови ланца мисли
Подршка за вештине - Само ПроИзворне вештине
Примена H100/A100 (Један чвор) B200/H200 (FP8)
Најбоље за Исплатив корпоративни АИ Максимална способност + расуђивање

Потребни су напредно расуђивање и вештине?

Shannon Pro 1.6 садржи KIMI K2 Трагове размишљања са GRPO обуком за транспарентно расуђивање ланцем мисли, плус изворну подршку за вештине за прилагођене АИ токове рада.

Истражите Shannon Pro

Искусите Shannon Lite 1.6

Могућности граничног АИ са исплативом NVFP4 квантизацијом. Примените на H100 или A100 инфраструктури за перформансе корпоративног нивоа по приступачној цени.

Svi istraživački linkovi