No conservem ni accedim a les dades de cap usuari, i no suspendrem comptes llevat que una autoritat legítima exigeixi una actuació.

NVFP4 Quantificat - IA Empresarial Rendible

ShannonLite 1.6

IA empresarial rendible impulsada perMistral Large 3amb675B paràmetres totalsi41B paràmetres actiusmitjançant una arquitectura granular de Barreja d'Experts. Post-entrenat amb2,500 sortides de Claude Opus 4.5per a un seguiment d'instruccions excepcional.Quantificació NVFP4permet el desplegament en un sol node enH100s o A100s.

675B

Paràmetres Totals

41B

Paràmetres Actius

NVFP4

Quantificació

256K

Context

2.5B

Codificador de Visió

Prova Shannon Lite Veure Documentació

Edició Lite

Shannon Lite 1.6

v1.6.0-lite-nvfp4

Model Base Mistral Large 3

Arquitectura MoE Granular

Paràmetres Totals 675B

Paràmetres Actius 41B

Quantificació NVFP4

Post-entrenament Claude Opus 4.5

Mostres d'Entrenament 2,500

Arquitectura Tècnica

Mistral Large 3: Barreja d'Experts Granular

Shannon Lite 1.6 està construït sobre Mistral Large 3, un model multimodal granular de Barreja d'Experts d'última generació dissenyat des de zero per a la fiabilitat, la comprensió de context llarg i el rendiment de grau de producció. La versió post-entrenada per a instruccions està ajustada per a casos d'ús de xat, agentics i basats en instruccions.

673B

Model de Llenguatge

Arquitectura MoE Granular amb 39B paràmetres actius per passada cap endavant

2.5B

Codificador de Visió

Codificador multimodal integrat per a l'anàlisi d'imatges i la comprensió visual

256K

Finestra de Context

Context estès per a una comprensió exhaustiva de documents i RAG

12+

Idiomes

Anglès, Francès, Castellà, Alemany, Xinès, Japonès, Coreà, Àrab i més

Quantificació NVFP4

Desplegament Empresarial Rendible

Shannon Lite 1.6 aprofita la tecnologia de quantificació NVFP4 (coma flotant de 4 bits) de NVIDIA per reduir dràsticament els requisits de memòria mentre es preserva la qualitat del model. Desplega IA de classe frontera en infraestructura de GPU accessible sense la complexitat de múltiples nodes.

💰

Cost d'Infraestructura Reduït

La quantificació NVFP4 redueix la petjada de memòria aproximadament 4 vegades en comparació amb BF16, permetent el desplegament en menys GPU i reduint dràsticament el TCO per a la IA empresarial.

Desplegament en un Sol Node

Desplega el model complet de 675B paràmetres en un sol node de H100s o A100s. Sense orquestració complexa de múltiples nodes, sobrecàrrega de xarxa reduïda, operacions simplificades.

Qualitat del Model Preservada

Tècniques de quantificació avançades mantenen el rendiment del model en raonament, seguiment d'instruccions i tasques multimodals amb una degradació mínima de la qualitat.

Metodologia de Post-entrenament

Destil·lació de Coneixement de Claude Opus 4.5

Shannon Lite 1.6 ha estat meticulosament post-entrenat utilitzant 2,500 sortides acuradament seleccionades deClaude Opus 4.5, el model més capaç d'Anthropic. Aquest enfocament de destil·lació de coneixement captura patrons de raonament avançats, interpretació matisada d'instruccions i una qualitat de resposta superior.

Fonament Mistral Large 3 Instruct 2512

Construït sobre el model Instruct d'última generació de Mistral (versió 2512) amb precisió BF16. Aquest fonament proporciona capacitats de nivell frontera dissenyades per a assistents de grau de producció, sistemes augmentats per recuperació, càrregues de treball científiques i fluxos de treball empresarials complexos.

Base BF16 Ajustat per a Instruccions Llest per a Producció Llicència Apache 2.0

Destil·lació de Sortides de Claude Opus 4.5

Post-entrenat amb 2,500 sortides d'alta qualitat de Claude Opus 4.5, capturant les capacitats de raonament més avançades d'Anthropic. El conjunt de dades seleccionat se centra en el seguiment d'instruccions complexes, la comprensió matisada i la generació de respostes d'alta qualitat en diversos dominis.

2,500 Mostres Conjunt de Dades Seleccionat Enfocament en la Qualitat Dominis Diversos

Procés de Quantificació NVFP4

Quantificació avançada NVIDIA FP4 aplicada post-entrenament per reduir la petjada de memòria mantenint la qualitat del model. Calibrada específicament per als pesos post-entrenats per preservar la transferència de coneixement i les capacitats de seguiment d'instruccions de Claude Opus 4.5.

NVFP4 Precisió de 4 bits Calibrat Qualitat Preservada

Avaluació i Validació

Avaluació exhaustiva a través de benchmarks de seguiment d'instruccions, tasques de raonament i escenaris empresarials del món real. Validat per a un comportament consistent entre dominis, sortides estables i un rendiment fiable en entorns de producció.

Amb Benchmarks Entre Dominis Validat per a Producció Sortides Estables

Infraestructura de Desplegament

Opcions Flexibles de Desplegament de GPU

Shannon Lite 1.6 amb quantificació NVFP4 permet un desplegament rendible en configuracions de GPU NVIDIA estàndard de la indústria, fent que la IA de frontera sigui accessible per a desplegaments empresarials sense requerir clústers multi-node cars.

NVIDIA H100 SXM

Rendiment òptim amb arquitectura Hopper i memòria HBM3

Node Únic (8x H100)

Precisió NVFP4

80GB HBM3 per GPU

Rendiment Màxim

NVIDIA A100 SXM

Fiabilitat provada en GPU amb arquitectura Ampere

Node Únic (8x A100)

Precisió NVFP4

80GB HBM2e per GPU

Rendible

Shannon Cloud

Desplegament totalment gestionat amb zero infraestructura

Accés Instantani

Escalat Automàtic

Preparat per a API REST

99.9% SLA

Capacitats del Model

Funcionalitats d'IA Preparades per a Empreses

Shannon Lite 1.6 ofereix capacitats de frontera heretades de Mistral Large 3 i millorades a través de Claude Opus 4.5 post-entrenament, optimitzat per a càrregues de treball de producció en diversos escenaris empresarials.

Visió Multimodal

L'encoder de visió integrat de 2.5B paràmetres permet l'anàlisi d'imatges, la resposta visual a preguntes i la comprensió de documents amb imatges.

Excel·lència Multilingüe

Suport natiu per a més de 12 idiomes, incloent anglès, francès, espanyol, alemany, italià, portuguès, neerlandès, xinès, japonès, coreà i àrab.

🤖

Capacitats Agentives

Funcionalitats agentives de primera classe amb crida de funcions nativa i sortida JSON estructurada per a l'ús autònom d'eines i l'automatització de fluxos de treball.

Adherència a les Indicacions del Sistema

Forta adherència i suport a les indicacions del sistema, permetent un control precís del comportament i un manteniment consistent de la persona.

Context Llarg de 256K

Finestra de context estesa per a una comprensió exhaustiva de documents, converses esteses i generació augmentada per recuperació (RAG).

🔧

Crida de Funcions Nativa

Suport integrat per a la crida de funcions amb sortida JSON fiable per a una integració perfecta amb eines externes, API i serveis.

Casos d'Ús

Optimitzat per a Càrregues de Treball de Producció

Amb un potent rendiment de context llarg, un comportament estable i consistent entre dominis, Shannon Lite 1.6 destaca en diversos escenaris empresarials i de recerca.

📄

Comprensió de Documents Llargs

Processa i analitza documents extensos, contractes, informes i articles de recerca amb la finestra de context de 256K

🤖

Assistents d'IA per a Producció

Impulsa assistents d'IA d'ús diari amb respostes fiables i consistents i un fort seguiment d'instruccions

🔧

Fluxos de Treball Agentius

Ús d'eines i crida de funcions d'última generació per a l'execució autònoma de tasques i l'automatització de fluxos de treball

🏢

Treball de Coneixement Empresarial

Fluxos de treball empresarials complexos que requereixen capacitats d'IA de frontera amb sortides consistents i fiables

💻

Assistent de Codificació General

Generació de codi, depuració, documentació i assistència per al desenvolupament de programari en múltiples idiomes

Recerca Científica

Assistència en recerca, revisió de literatura, processament de càrregues de treball científiques i generació d'hipòtesis

Generació Augmentada per Recuperació

Rendiment òptim per a sistemes RAG amb integració de context fiable i síntesi de recuperació precisa

🌍

Aplicacions Multilingües

Aplicacions empresarials globals que requereixen una qualitat consistent en més de 12 idiomes compatibles

Comparació de Models

Shannon Lite vs Shannon Pro

Tria el model Shannon adequat per a les teves necessitats. Shannon Lite ofereix un desplegament empresarial rendible, mentre que Shannon Pro proporciona la màxima capacitat amb raonament avançat de cadena de pensament i suport per a Habilitats.

Característica	Shannon Lite 1.6	Shannon Pro 1.6
Model Base	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Paràmetres Actius	41B (MoE Granular)	41B (MoE Granular)
Precisió	NVFP4 (4-bit)	BF16 complet (16-bit)
Dades de post-entrenament	2.500 sortides de Claude Opus 4.5	Traces de pensament KIMI K2
Mètode de post-entrenament	Ajustament fi supervisat	GRPO (Optimització de política relativa de grup)
Mode de raonament	Estàndard	Traces de cadena de pensament
Suport d'habilitats	-	Només ProHabilitats natives
Desplegament	H100/A100 (Node únic)	B200/H200 (FP8)
Ideal per a	IA empresarial rendible	Capacitat màxima + Raonament

Experimenta Shannon Lite 1.6

Capacitats d'IA de frontera amb quantificació NVFP4 rendible. Desplega en infraestructura H100 o A100 per a un rendiment de grau empresarial a un cost accessible.

Comença a utilitzar Shannon Lite Compara amb Pro

Tots els enllaços de recerca

Política d'Ús Responsable Condicions del Servei Shannon V1 Equilibrat Shannon V1 Profund Shannon V1.5 Pensament Shannon V1.5 Pensament Profund Shannon Lite 1.6 Shannon Pro 1.6 Com vam entrenar Mixtral amb GPT-5 Pro mitjançant destil·lació d'OpenRouter Com vam entrenar Shannon V1.5 a pensar utilitzant GRPO Proves de penetració amb IA: Shannon AI ara treballa amb Claude Code Custom Shannon Projectes Habilitats

ShannonLite 1.6

Mistral Large 3: Barreja d'Experts Granular

Model de Llenguatge

Codificador de Visió

Finestra de Context

Idiomes

Desplegament Empresarial Rendible

Cost d'Infraestructura Reduït

Desplegament en un Sol Node

Qualitat del Model Preservada

Destil·lació de Coneixement de Claude Opus 4.5

Fonament Mistral Large 3 Instruct 2512

Destil·lació de Sortides de Claude Opus 4.5

Procés de Quantificació NVFP4

Avaluació i Validació

Opcions Flexibles de Desplegament de GPU

NVIDIA H100 SXM

NVIDIA A100 SXM

Shannon Cloud

Funcionalitats d'IA Preparades per a Empreses

Visió Multimodal

Excel·lència Multilingüe

Capacitats Agentives

Adherència a les Indicacions del Sistema

Context Llarg de 256K

Crida de Funcions Nativa

Optimitzat per a Càrregues de Treball de Producció

Comprensió de Documents Llargs

Assistents d'IA per a Producció

Fluxos de Treball Agentius

Treball de Coneixement Empresarial

Assistent de Codificació General

Recerca Científica

Generació Augmentada per Recuperació

Aplicacions Multilingües

Shannon Lite vs Shannon Pro

Necessites raonament i habilitats avançades?

Experimenta Shannon Lite 1.6

Tots els enllaços de recerca