Ние не съхраняваме и нямаме достъп до данните на потребителите и не спираме акаунти, освен ако законен орган не изиска действие по принуда.
NVFP4 квантуван - Рентабилен корпоративен AI

ShannonЛайт 1.6

Рентабилен корпоративен AI, задвижван отMistral Large 3с675B общи параметрии41B активни параметричрез грануларна архитектура Mixture-of-Experts. Следтрениран върху2500 изхода от Claude Opus 4.5за изключително следване на инструкции.NVFP4 квантуванепозволява разгръщане на един възел върхуH100s или A100s.

675B
Общи параметри
41B
Активни параметри
NVFP4
Квантуване
256K
Контекст
2.5B
Визуален енкодер
Лайт издание
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Технически спецификации:
Базов модел Mistral Large 3
Архитектура Грануларна MoE
Общи параметри 675B
Активни параметри 41B
Квантуване NVFP4
Следтренировка Claude Opus 4.5
Обучителни извадки 2,500

Mistral Large 3: Грануларна Mixture-of-Experts

Shannon Lite 1.6 е изграден върху Mistral Large 3, най-съвременен мултимодален грануларен модел Mixture-of-Experts проектиран от самото начало за надеждност, разбиране на дълъг контекст и производителност от производствен клас. Версията, следтренирана за инструкции, е фино настроена за случаи на употреба, базирани на чат, агенти и инструкции.

673B

Езиков модел

Грануларна MoE архитектура с 39B активни параметри на едно преминаване напред

2.5B

Визуален енкодер

Интегриран мултимодален енкодер за анализ на изображения и визуално разбиране

256K

Контекстен прозорец

Разширен контекст за цялостно разбиране на документи и RAG

12+

Езици

Английски, френски, испански, немски, китайски, японски, корейски, арабски и други

Рентабилно корпоративно разгръщане

Shannon Lite 1.6 използва технологията за квантуване NVFP4 (4-битова плаваща запетая) на NVIDIA за драстично намаляване на изискванията за памет, като същевременно запазва качеството на модела. Разгърнете AI от граничен клас върху достъпна GPU инфраструктура без сложност на множество възли.

💰

Намалени разходи за инфраструктура

NVFP4 квантуването намалява отпечатъка на паметта с приблизително 4 пъти в сравнение с BF16, позволявайки разгръщане на по-малко GPU и драстично намалявайки TCO за корпоративен AI.

Разгръщане на един възел

Разгърнете пълния модел с 675B параметри на един възел от H100s или A100s. Без сложна оркестрация на множество възли, намалени мрежови разходи, опростени операции.

Запазено качество на модела

Усъвършенстваните техники за квантуване поддържат производителността на модела при разсъждения, следване на инструкции и мултимодални задачи с минимално влошаване на качеството.

Claude Opus 4.5 Дестилация на знания

Shannon Lite 1.6 е щателно следтрениран, използвайки 2500 внимателно подбрани изхода отClaude Opus 4.5, най-способният модел на Anthropic. Този подход за дестилация на знания улавя усъвършенствани модели на разсъждения, нюансирана интерпретация на инструкции и превъзходно качество на отговорите.

Mistral Large 3 Instruct 2512 Основа

Изграден върху най-съвременния Instruct модел на Mistral (версия 2512) с BF16 прецизност. Тази основа предоставя възможности от гранично ниво, проектирани за асистенти от производствен клас, системи с разширено извличане, научни натоварвания и сложни корпоративни работни процеси.

BF16 База Настроен за инструкции Готов за производство Лиценз Apache 2.0

Claude Opus 4.5 Дестилация на изхода

Следтрениран върху 2500 висококачествени изхода от Claude Opus 4.5, улавяйки най-усъвършенстваните възможности за разсъждения на Anthropic. Подбраният набор от данни се фокусира върху сложно следване на инструкции, нюансирано разбиране, и генериране на висококачествени отговори в различни области.

2500 извадки Подбран набор от данни Фокус върху качеството Разнообразни области

Процес на квантуване NVFP4

Усъвършенствано NVIDIA FP4 квантуване, приложено след обучение, за намаляване на потреблението на памет, като същевременно се поддържа качеството на модела. Калибрирано специално за обучените тегла, за да се запази преносът на знания и възможностите за следване на инструкции на Claude Opus 4.5.

NVFP4 4-битова прецизност Калибриран Качеството е запазено

Оценка и валидиране

Цялостна оценка по бенчмаркове за следване на инструкции, задачи за разсъждение и реални корпоративни сценарии. Валидиран за последователно поведение в различни домейни, стабилни изходи и надеждна производителност в производствени среди.

Бенчмаркиран Междудоменен Валидиран за производство Стабилни изходи

Гъвкави опции за внедряване на GPU

Shannon Lite 1.6 с NVFP4 квантуване позволява рентабилно внедряване на индустриални стандартни NVIDIA GPU конфигурации, правейки граничния AI достъпен за корпоративни внедрявания, без да изисква скъпи многовъзлови клъстери.

NVIDIA H100 SXM

Оптимална производителност с архитектура Hopper и HBM3 памет

Един възел (8x H100)
NVFP4 прецизност
80GB HBM3 на GPU
Максимална пропускателна способност

NVIDIA A100 SXM

Доказана надеждност на GPU с архитектура Ampere

Един възел (8x A100)
NVFP4 прецизност
80GB HBM2e на GPU
Рентабилен

Shannon Cloud

Напълно управлявано внедряване с нулева инфраструктура

Незабавен достъп
Автоматично мащабиране
Готов за REST API
99.9% SLA

AI функции, готови за предприятия

Shannon Lite 1.6 предоставя гранични възможности, наследени от Mistral Large 3 и подобрени чрез Claude Opus 4.5 след обучение, оптимизирани за производствени натоварвания в различни корпоративни сценарии.

Мултимодално зрение

Интегриран 2.5B параметърен визуален енкодер позволява анализ на изображения, визуално отговаряне на въпроси и разбиране на документи с изображения.

Многоезично превъзходство

Вградена поддръжка за 12+ езика, включително английски, френски, испански, немски, италиански, португалски, холандски, китайски, японски, корейски и арабски.

🤖

Агентни възможности

Най-добрите в класа агентни функции с вградено извикване на функции и структуриран JSON изход за автономно използване на инструменти и автоматизация на работния процес.

Придържане към системни подкани

Силно придържане и поддръжка на системни подкани, позволяващи прецизен контрол на поведението и последователно поддържане на персона.

256K дълъг контекст

Разширен контекстен прозорец за цялостно разбиране на документи, разширени разговори и генериране, подсилено с извличане (RAG).

🔧

Вградено извикване на функции

Вградена поддръжка за извикване на функции с надежден JSON изход за безпроблемна интеграция с външни инструменти, API и услуги.

Оптимизиран за производствени натоварвания

С мощна производителност на дълъг контекст, стабилно и последователно поведение в различни домейни, Shannon Lite 1.6 превъзхожда в разнообразни корпоративни и изследователски сценарии.

📄

Разбиране на дълги документи

Обработвайте и анализирайте обширни документи, договори, доклади и научни статии с 256K контекстен прозорец

🤖

Производствени AI асистенти

Захранвайте ежедневни AI асистенти с надеждни, последователни отговори и силно следване на инструкции

🔧

Агентни работни процеси

Най-съвременно използване на инструменти и извикване на функции за автономно изпълнение на задачи и автоматизация на работния процес

🏢

Корпоративна работа със знания

Сложни корпоративни работни процеси, изискващи гранични AI възможности с последователни, надеждни изходи

💻

Общ асистент за кодиране

Генериране на код, отстраняване на грешки, документация и помощ при разработка на софтуер на множество езици

Научни изследвания

Помощ при изследвания, преглед на литература, обработка на научни натоварвания и генериране на хипотези

Генериране, подсилено с извличане

Оптимална производителност за RAG системи с надеждна интеграция на контекст и точен синтез на извличане

🌍

Многоезични приложения

Глобални корпоративни приложения, изискващи постоянно качество на 12+ поддържани езика

Shannon Lite срещу Shannon Pro

Изберете правилния модел Shannon за вашите нужди. Shannon Lite предлага рентабилно корпоративно внедряване, докато Shannon Pro осигурява максимални възможности с усъвършенствано разсъждение тип „верига от мисли“ и поддръжка на умения.

Функция Shannon Lite 1.6 Shannon Pro 1.6
Базов модел Mistral Large 3 (675B) Mistral Large 3 (675B)
Активни параметри 41B (Грануларно MoE) 41B (Грануларно MoE)
Прецизност NVFP4 (4-битов) Пълен BF16 (16-битов)
Данни след обучение 2,500 изхода от Claude Opus 4.5 Следи от мислене KIMI K2
Метод след обучение Надзорно фино настройване GRPO (Оптимизация на групови относителни политики)
Режим на разсъждение Стандартен Следи от верига на мисли
Поддръжка на умения - Само за ProВградени умения
Разгръщане H100/A100 (Единичен възел) B200/H200 (FP8)
Най-добър за Рентабилен корпоративен ИИ Максимална възможност + Разсъждение

Нуждаете се от напреднали разсъждения и умения?

Shannon Pro 1.6 включва следи от мислене KIMI K2 с обучение по GRPO за прозрачно разсъждение тип „верига от мисли“, плюс поддръжка на вградени умения за персонализирани работни процеси на ИИ.

Разгледайте Shannon Pro

Изживейте Shannon Lite 1.6

Възможности на граничен ИИ с рентабилна NVFP4 квантизация. Разгръщане на инфраструктура H100 или A100 за производителност от корпоративен клас на достъпна цена.

Всички изследователски връзки