Nedržíme ani nezpřístupňujeme data žádného uživatele a nepozastavujeme účty, pokud to nevyžaduje zákonný orgán.

NVFP4 kvantovaná - Cenově efektivní podniková AI

ShannonLehká 1.6

Cenově efektivní podniková AI poháněnáMistral Large 3s675B celkových parametrůa41B aktivních parametrůprostřednictvím granulární architektury Mixture-of-Experts. Po tréninku na2 500 výstupech Claude Opus 4.5pro výjimečné dodržování instrukcí.NVFP4 kvantizaceumožňuje nasazení na jednom uzlu naH100s nebo A100s.

675B

Celkové parametry

41B

Aktivní parametry

NVFP4

Kvantizace

256K

Kontext

2.5B

Vizuální kodér

Vyzkoušejte Shannon Lite Zobrazit dokumentaci

Edice Lite

Shannon Lite 1.6

v1.6.0-lite-nvfp4

Základní model Mistral Large 3

Architektura Granulární MoE

Celkové parametry 675B

Aktivní parametry 41B

Kvantizace NVFP4

Po tréninku Claude Opus 4.5

Tréninkové vzorky 2,500

Technická architektura

Mistral Large 3: Granulární Mixture-of-Experts

Shannon Lite 1.6 je postaven na Mistral Large 3, špičkovém multimodálním granulárním modelu Mixture-of-Experts navrženém od základu pro spolehlivost, porozumění dlouhému kontextu a výkon na produkční úrovni. Verze po tréninku s instrukcemi je jemně doladěna pro chat, agentní a instrukční případy použití.

673B

Jazykový model

Granulární architektura MoE s 39B aktivními parametry na jeden průchod vpřed

2.5B

Vizuální kodér

Integrovaný multimodální kodér pro analýzu obrazu a vizuální porozumění

256K

Kontextové okno

Rozšířený kontext pro komplexní porozumění dokumentům a RAG

12+

Jazyky

Angličtina, Francouzština, Španělština, Němčina, Čínština, Japonština, Korejština, Arabština a další

NVFP4 kvantizace

Cenově efektivní podnikové nasazení

Shannon Lite 1.6 využívá technologii kvantizace NVFP4 (4bitová plovoucí čárka) od NVIDIA k dramatickému snížení požadavků na paměť při zachování kvality modelu. Nasaďte AI špičkové třídy na dostupné GPU infrastruktuře bez složitosti víceuzlového řešení.

💰

Snížené náklady na infrastrukturu

Kvantizace NVFP4 snižuje nároky na paměť přibližně 4x ve srovnání s BF16, což umožňuje nasazení na méně GPU a dramaticky snižuje TCO pro podnikovou AI.

Nasazení na jednom uzlu

Nasaďte plný model s 675B parametry na jeden uzel H100s nebo A100s. Žádná složitá víceuzlová orchestrace, snížená režie sítě, zjednodušené operace.

Zachovaná kvalita modelu

Pokročilé kvantizační techniky udržují výkon modelu napříč úkoly uvažování, dodržování instrukcí a multimodálními úkoly s minimální degradací kvality.

Metodika po tréninku

Claude Opus 4.5 Destilace znalostí

Shannon Lite 1.6 byl pečlivě dodatečně trénován pomocí 2 500 pečlivě vybraných výstupů zClaude Opus 4.5, nejvýkonnějšího modelu Anthropic. Tento přístup destilace znalostí zachytává pokročilé vzorce uvažování, nuancovanou interpretaci instrukcí a vynikající kvalitu odpovědí.

Základ Mistral Large 3 Instruct 2512

Postaveno na špičkovém modelu Instruct (verze 2512) od Mistral v přesnosti BF16. Tento základ poskytuje schopnosti na špičkové úrovni navržené pro asistenty produkční třídy, systémy rozšířené o vyhledávání, vědecké úlohy a složité podnikové pracovní postupy.

Základ BF16 Laděno pro instrukce Připraveno pro produkci Licence Apache 2.0

Claude Opus 4.5 Destilace výstupů

Dodatečně trénováno na 2 500 vysoce kvalitních výstupech z Claude Opus 4.5, zachycující nejpokročilejší schopnosti uvažování Anthropic. Kurátorský datový soubor se zaměřuje na komplexní dodržování instrukcí, nuancované porozumění, a generování vysoce kvalitních odpovědí napříč různými doménami.

2 500 vzorků Kurátorský datový soubor Zaměření na kvalitu Různé domény

Proces kvantizace NVFP4

Pokročilá kvantizace NVIDIA FP4 aplikovaná po tréninku pro snížení nároků na paměť při zachování kvality modelu. Kalibrováno speciálně pro váhy po tréninku, aby se zachoval přenos znalostí Claude Opus 4.5 a schopnosti dodržování instrukcí.

NVFP4 4bitová přesnost Kalibrováno Kvalita zachována

Hodnocení a validace

Komplexní hodnocení napříč benchmarky pro dodržování instrukcí, úkoly s uvažováním a reálnými podnikovými scénáři. Validováno pro konzistentní chování napříč doménami, stabilní výstupy a spolehlivý výkon v produkčních prostředích.

Benchmarkováno Napříč doménami Validováno pro produkci Stabilní výstupy

Infrastruktura pro nasazení

Flexibilní možnosti nasazení GPU

Shannon Lite 1.6 s kvantizací NVFP4 umožňuje nákladově efektivní nasazení na průmyslových standardních konfiguracích GPU NVIDIA, čímž zpřístupňuje špičkovou AI pro podniková nasazení bez nutnosti drahých víceuzeových klastrů.

NVIDIA H100 SXM

Optimální výkon s architekturou Hopper a pamětí HBM3

Jeden uzel (8x H100)

Přesnost NVFP4

80GB HBM3 na GPU

Maximální propustnost

NVIDIA A100 SXM

Osvědčená spolehlivost na GPU s architekturou Ampere

Jeden uzel (8x A100)

Přesnost NVFP4

80GB HBM2e na GPU

Nákladově efektivní

Shannon Cloud

Plně spravované nasazení s nulovou infrastrukturou

Okamžitý přístup

Automatické škálování

Připraveno pro REST API

99.9% SLA

Schopnosti modelu

Funkce AI připravené pro podniky

Shannon Lite 1.6 přináší špičkové schopnosti zděděné z Mistral Large 3 a vylepšené post-tréninkem Claude Opus 4.5, optimalizované pro produkční úlohy napříč různými podnikovými scénáři.

Multimodální vidění

Integrovaný vizuální kodér s 2,5 miliardami parametrů umožňuje analýzu obrazu, vizuální odpovídání na otázky a porozumění dokumentům s obrázky.

Vícejazyčná excelence

Nativní podpora pro více než 12 jazyků včetně angličtiny, francouzštiny, španělštiny, němčiny, italštiny, portugalštiny, holandštiny, čínštiny, japonštiny, korejštiny a arabštiny.

🤖

Agentní schopnosti

Nejlepší agentní funkce s nativním voláním funkcí a strukturovaným výstupem JSON pro autonomní použití nástrojů a automatizaci pracovních postupů.

Dodržování systémových výzev

Silné dodržování a podpora systémových výzev, umožňující přesnou kontrolu chování a konzistentní udržování persony.

256K dlouhý kontext

Rozšířené kontextové okno pro komplexní porozumění dokumentům, rozšířené konverzace a generování rozšířené o vyhledávání (RAG).

🔧

Nativní volání funkcí

Vestavěná podpora volání funkcí se spolehlivým výstupem JSON pro bezproblémovou integraci s externími nástroji, API a službami.

Případy použití

Optimalizováno pro produkční úlohy

Díky výkonnému výkonu s dlouhým kontextem, stabilnímu a konzistentnímu chování napříč doménami, Shannon Lite 1.6 vyniká v různých podnikových a výzkumných scénářích.

📄

Porozumění dlouhým dokumentům

Zpracovávejte a analyzujte rozsáhlé dokumenty, smlouvy, zprávy a výzkumné práce s kontextovým oknem 256K

🤖

Produkční AI asistenti

Pohánějte každodenní AI asistenty spolehlivými, konzistentními odpověďmi a silným dodržováním instrukcí

🔧

Agentní pracovní postupy

Špičkové použití nástrojů a volání funkcí pro autonomní provádění úloh a automatizaci pracovních postupů

🏢

Podniková znalostní práce

Komplexní podnikové pracovní postupy vyžadující špičkové schopnosti AI s konzistentními a spolehlivými výstupy

💻

Obecný asistent pro kódování

Generování kódu, ladění, dokumentace a pomoc s vývojem softwaru napříč více jazyky

Vědecký výzkum

Pomoc s výzkumem, rešerše literatury, zpracování vědeckých úloh a generování hypotéz

Generování rozšířené o vyhledávání

Optimální výkon pro systémy RAG se spolehlivou integrací kontextu a přesnou syntézou vyhledávání

🌍

Vícejazyčné aplikace

Globální podnikové aplikace vyžadující konzistentní kvalitu napříč více než 12 podporovanými jazyky

Srovnání modelů

Shannon Lite vs Shannon Pro

Vyberte si správný model Shannon pro vaše potřeby. Shannon Lite nabízí nákladově efektivní podnikové nasazení, zatímco Shannon Pro poskytuje maximální schopnosti s pokročilým uvažováním typu chain-of-thought a podporou dovedností.

Funkce	Shannon Lite 1.6	Shannon Pro 1.6
Základní model	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Aktivní parametry	41B (Granulární MoE)	41B (Granulární MoE)
Přesnost	NVFP4 (4-bit)	Plné BF16 (16-bit)
Data po tréninku	2 500 výstupů Claude Opus 4.5	KIMI K2 Stopy myšlení
Metoda po tréninku	Dohledované jemné doladění	GRPO (Optimalizace skupinové relativní politiky)
Režim uvažování	Standardní	Stopy řetězce myšlenek
Podpora dovedností	-	Pouze ProNativní dovednosti
Nasazení	H100/A100 (Jediný uzel)	B200/H200 (FP8)
Nejlepší pro	Cenově efektivní podniková AI	Maximální schopnosti + uvažování

Vyzkoušejte Shannon Lite 1.6

Schopnosti špičkové AI s cenově efektivní kvantizací NVFP4. Nasaďte na infrastrukturu H100 nebo A100 pro výkon podnikové úrovně za dostupnou cenu.

Začněte používat Shannon Lite Porovnat s Pro

Všechny výzkumné odkazy

Zásady odpovědného používání Podmínky služby Shannon V1 Vyvážený Shannon V1 Hluboký Shannon V1.5 Myšlení Shannon V1.5 Hluboké myšlení Shannon Lehká 1.6 Shannon Pro 1.6 Jak jsme trénovali Mixtral na GPT-5 Pro pomocí destilace OpenRouter Jak jsme trénovali Shannon V1.5 k myšlení pomocí GRPO Penetrační testování pomocí AI: Shannon AI nyní pracuje na Claude Code Vlastní Shannon Projekty Dovednosti

ShannonLehká 1.6

Mistral Large 3: Granulární Mixture-of-Experts

Jazykový model

Vizuální kodér

Kontextové okno

Jazyky

Cenově efektivní podnikové nasazení

Snížené náklady na infrastrukturu

Nasazení na jednom uzlu

Zachovaná kvalita modelu

Claude Opus 4.5 Destilace znalostí

Základ Mistral Large 3 Instruct 2512

Claude Opus 4.5 Destilace výstupů

Proces kvantizace NVFP4

Hodnocení a validace

Flexibilní možnosti nasazení GPU

NVIDIA H100 SXM

NVIDIA A100 SXM

Shannon Cloud

Funkce AI připravené pro podniky

Multimodální vidění

Vícejazyčná excelence

Agentní schopnosti

Dodržování systémových výzev

256K dlouhý kontext

Nativní volání funkcí

Optimalizováno pro produkční úlohy

Porozumění dlouhým dokumentům

Produkční AI asistenti

Agentní pracovní postupy

Podniková znalostní práce

Obecný asistent pro kódování

Vědecký výzkum

Generování rozšířené o vyhledávání

Vícejazyčné aplikace

Shannon Lite vs Shannon Pro

Potřebujete pokročilé uvažování a dovednosti?

Vyzkoušejte Shannon Lite 1.6

Všechny výzkumné odkazy