Nedržíme ani nezpřístupňujeme data žádného uživatele a nepozastavujeme účty, pokud to nevyžaduje zákonný orgán.
NVFP4 kvantovaná - Cenově efektivní podniková AI

ShannonLehká 1.6

Cenově efektivní podniková AI poháněnáMistral Large 3s675B celkových parametrůa41B aktivních parametrůprostřednictvím granulární architektury Mixture-of-Experts. Po tréninku na2 500 výstupech Claude Opus 4.5pro výjimečné dodržování instrukcí.NVFP4 kvantizaceumožňuje nasazení na jednom uzlu naH100s nebo A100s.

675B
Celkové parametry
41B
Aktivní parametry
NVFP4
Kvantizace
256K
Kontext
2.5B
Vizuální kodér
Edice Lite
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Technické specifikace:
Základní model Mistral Large 3
Architektura Granulární MoE
Celkové parametry 675B
Aktivní parametry 41B
Kvantizace NVFP4
Po tréninku Claude Opus 4.5
Tréninkové vzorky 2,500

Mistral Large 3: Granulární Mixture-of-Experts

Shannon Lite 1.6 je postaven na Mistral Large 3, špičkovém multimodálním granulárním modelu Mixture-of-Experts navrženém od základu pro spolehlivost, porozumění dlouhému kontextu a výkon na produkční úrovni. Verze po tréninku s instrukcemi je jemně doladěna pro chat, agentní a instrukční případy použití.

673B

Jazykový model

Granulární architektura MoE s 39B aktivními parametry na jeden průchod vpřed

2.5B

Vizuální kodér

Integrovaný multimodální kodér pro analýzu obrazu a vizuální porozumění

256K

Kontextové okno

Rozšířený kontext pro komplexní porozumění dokumentům a RAG

12+

Jazyky

Angličtina, Francouzština, Španělština, Němčina, Čínština, Japonština, Korejština, Arabština a další

Cenově efektivní podnikové nasazení

Shannon Lite 1.6 využívá technologii kvantizace NVFP4 (4bitová plovoucí čárka) od NVIDIA k dramatickému snížení požadavků na paměť při zachování kvality modelu. Nasaďte AI špičkové třídy na dostupné GPU infrastruktuře bez složitosti víceuzlového řešení.

💰

Snížené náklady na infrastrukturu

Kvantizace NVFP4 snižuje nároky na paměť přibližně 4x ve srovnání s BF16, což umožňuje nasazení na méně GPU a dramaticky snižuje TCO pro podnikovou AI.

Nasazení na jednom uzlu

Nasaďte plný model s 675B parametry na jeden uzel H100s nebo A100s. Žádná složitá víceuzlová orchestrace, snížená režie sítě, zjednodušené operace.

Zachovaná kvalita modelu

Pokročilé kvantizační techniky udržují výkon modelu napříč úkoly uvažování, dodržování instrukcí a multimodálními úkoly s minimální degradací kvality.

Claude Opus 4.5 Destilace znalostí

Shannon Lite 1.6 byl pečlivě dodatečně trénován pomocí 2 500 pečlivě vybraných výstupů zClaude Opus 4.5, nejvýkonnějšího modelu Anthropic. Tento přístup destilace znalostí zachytává pokročilé vzorce uvažování, nuancovanou interpretaci instrukcí a vynikající kvalitu odpovědí.

Základ Mistral Large 3 Instruct 2512

Postaveno na špičkovém modelu Instruct (verze 2512) od Mistral v přesnosti BF16. Tento základ poskytuje schopnosti na špičkové úrovni navržené pro asistenty produkční třídy, systémy rozšířené o vyhledávání, vědecké úlohy a složité podnikové pracovní postupy.

Základ BF16 Laděno pro instrukce Připraveno pro produkci Licence Apache 2.0

Claude Opus 4.5 Destilace výstupů

Dodatečně trénováno na 2 500 vysoce kvalitních výstupech z Claude Opus 4.5, zachycující nejpokročilejší schopnosti uvažování Anthropic. Kurátorský datový soubor se zaměřuje na komplexní dodržování instrukcí, nuancované porozumění, a generování vysoce kvalitních odpovědí napříč různými doménami.

2 500 vzorků Kurátorský datový soubor Zaměření na kvalitu Různé domény

Proces kvantizace NVFP4

Pokročilá kvantizace NVIDIA FP4 aplikovaná po tréninku pro snížení nároků na paměť při zachování kvality modelu. Kalibrováno speciálně pro váhy po tréninku, aby se zachoval přenos znalostí Claude Opus 4.5 a schopnosti dodržování instrukcí.

NVFP4 4bitová přesnost Kalibrováno Kvalita zachována

Hodnocení a validace

Komplexní hodnocení napříč benchmarky pro dodržování instrukcí, úkoly s uvažováním a reálnými podnikovými scénáři. Validováno pro konzistentní chování napříč doménami, stabilní výstupy a spolehlivý výkon v produkčních prostředích.

Benchmarkováno Napříč doménami Validováno pro produkci Stabilní výstupy

Flexibilní možnosti nasazení GPU

Shannon Lite 1.6 s kvantizací NVFP4 umožňuje nákladově efektivní nasazení na průmyslových standardních konfiguracích GPU NVIDIA, čímž zpřístupňuje špičkovou AI pro podniková nasazení bez nutnosti drahých víceuzeových klastrů.

NVIDIA H100 SXM

Optimální výkon s architekturou Hopper a pamětí HBM3

Jeden uzel (8x H100)
Přesnost NVFP4
80GB HBM3 na GPU
Maximální propustnost

NVIDIA A100 SXM

Osvědčená spolehlivost na GPU s architekturou Ampere

Jeden uzel (8x A100)
Přesnost NVFP4
80GB HBM2e na GPU
Nákladově efektivní

Shannon Cloud

Plně spravované nasazení s nulovou infrastrukturou

Okamžitý přístup
Automatické škálování
Připraveno pro REST API
99.9% SLA

Funkce AI připravené pro podniky

Shannon Lite 1.6 přináší špičkové schopnosti zděděné z Mistral Large 3 a vylepšené post-tréninkem Claude Opus 4.5, optimalizované pro produkční úlohy napříč různými podnikovými scénáři.

Multimodální vidění

Integrovaný vizuální kodér s 2,5 miliardami parametrů umožňuje analýzu obrazu, vizuální odpovídání na otázky a porozumění dokumentům s obrázky.

Vícejazyčná excelence

Nativní podpora pro více než 12 jazyků včetně angličtiny, francouzštiny, španělštiny, němčiny, italštiny, portugalštiny, holandštiny, čínštiny, japonštiny, korejštiny a arabštiny.

🤖

Agentní schopnosti

Nejlepší agentní funkce s nativním voláním funkcí a strukturovaným výstupem JSON pro autonomní použití nástrojů a automatizaci pracovních postupů.

Dodržování systémových výzev

Silné dodržování a podpora systémových výzev, umožňující přesnou kontrolu chování a konzistentní udržování persony.

256K dlouhý kontext

Rozšířené kontextové okno pro komplexní porozumění dokumentům, rozšířené konverzace a generování rozšířené o vyhledávání (RAG).

🔧

Nativní volání funkcí

Vestavěná podpora volání funkcí se spolehlivým výstupem JSON pro bezproblémovou integraci s externími nástroji, API a službami.

Optimalizováno pro produkční úlohy

Díky výkonnému výkonu s dlouhým kontextem, stabilnímu a konzistentnímu chování napříč doménami, Shannon Lite 1.6 vyniká v různých podnikových a výzkumných scénářích.

📄

Porozumění dlouhým dokumentům

Zpracovávejte a analyzujte rozsáhlé dokumenty, smlouvy, zprávy a výzkumné práce s kontextovým oknem 256K

🤖

Produkční AI asistenti

Pohánějte každodenní AI asistenty spolehlivými, konzistentními odpověďmi a silným dodržováním instrukcí

🔧

Agentní pracovní postupy

Špičkové použití nástrojů a volání funkcí pro autonomní provádění úloh a automatizaci pracovních postupů

🏢

Podniková znalostní práce

Komplexní podnikové pracovní postupy vyžadující špičkové schopnosti AI s konzistentními a spolehlivými výstupy

💻

Obecný asistent pro kódování

Generování kódu, ladění, dokumentace a pomoc s vývojem softwaru napříč více jazyky

Vědecký výzkum

Pomoc s výzkumem, rešerše literatury, zpracování vědeckých úloh a generování hypotéz

Generování rozšířené o vyhledávání

Optimální výkon pro systémy RAG se spolehlivou integrací kontextu a přesnou syntézou vyhledávání

🌍

Vícejazyčné aplikace

Globální podnikové aplikace vyžadující konzistentní kvalitu napříč více než 12 podporovanými jazyky

Shannon Lite vs Shannon Pro

Vyberte si správný model Shannon pro vaše potřeby. Shannon Lite nabízí nákladově efektivní podnikové nasazení, zatímco Shannon Pro poskytuje maximální schopnosti s pokročilým uvažováním typu chain-of-thought a podporou dovedností.

Funkce Shannon Lite 1.6 Shannon Pro 1.6
Základní model Mistral Large 3 (675B) Mistral Large 3 (675B)
Aktivní parametry 41B (Granulární MoE) 41B (Granulární MoE)
Přesnost NVFP4 (4-bit) Plné BF16 (16-bit)
Data po tréninku 2 500 výstupů Claude Opus 4.5 KIMI K2 Stopy myšlení
Metoda po tréninku Dohledované jemné doladění GRPO (Optimalizace skupinové relativní politiky)
Režim uvažování Standardní Stopy řetězce myšlenek
Podpora dovedností - Pouze ProNativní dovednosti
Nasazení H100/A100 (Jediný uzel) B200/H200 (FP8)
Nejlepší pro Cenově efektivní podniková AI Maximální schopnosti + uvažování

Potřebujete pokročilé uvažování a dovednosti?

Shannon Pro 1.6 nabízí KIMI K2 Stopy myšlení s tréninkem GRPO pro transparentní uvažování řetězce myšlenek, plus nativní podporu dovedností pro vlastní pracovní postupy AI.

Prozkoumejte Shannon Pro

Vyzkoušejte Shannon Lite 1.6

Schopnosti špičkové AI s cenově efektivní kvantizací NVFP4. Nasaďte na infrastrukturu H100 nebo A100 pro výkon podnikové úrovně za dostupnou cenu.

Všechny výzkumné odkazy