Мы не храним и не получаем доступ к данным пользователей и не приостанавливаем аккаунты, если только законный орган не требует принудительных мер.
NVFP4 Квантованный - Экономичный корпоративный ИИ

ShannonЛайт 1.6

Экономичный корпоративный ИИ на базеMistral Large 3с675B общих параметрови41B активных параметровблагодаря гранулированной архитектуре Mixture-of-Experts. Дообучен на2 500 выходных данных Claude Opus 4.5для исключительного следования инструкциям.Квантование NVFP4обеспечивает развертывание на одном узле наH100s или A100s.

675B
Общие параметры
41B
Активные параметры
NVFP4
Квантование
256K
Контекст
2.5B
Визуальный кодировщик
Версия Lite
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Технические характеристики:
Базовая модель Mistral Large 3
Архитектура Гранулированная MoE
Общие параметры 675B
Активные параметры 41B
Квантование NVFP4
Пост-обучение Claude Opus 4.5
Образцы для обучения 2,500

Mistral Large 3: Гранулированная Mixture-of-Experts

Shannon Lite 1.6 построен на базе Mistral Large 3, современной мультимодальной гранулированной модели Mixture-of-Experts, разработанной с нуля для обеспечения надежности, понимания длинного контекста и производительности производственного уровня. Версия, дообученная для инструкций, тонко настроена для чата, агентных и инструкционных сценариев использования.

673B

Языковая модель

Гранулированная архитектура MoE с 39B активных параметров за один прямой проход

2.5B

Визуальный кодировщик

Интегрированный мультимодальный кодировщик для анализа изображений и визуального понимания

256K

Окно контекста

Расширенный контекст для всестороннего понимания документов и RAG

12+

Языки

Английский, Французский, Испанский, Немецкий, Китайский, Японский, Корейский, Арабский и другие

Экономичное корпоративное развертывание

Shannon Lite 1.6 использует технологию квантования NVFP4 (4-битная плавающая точка) от NVIDIA для значительного снижения требований к памяти при сохранении качества модели. Развертывайте ИИ передового класса на доступной инфраструктуре GPU без сложности многоузловых систем.

💰

Снижение затрат на инфраструктуру

Квантование NVFP4 уменьшает объем занимаемой памяти примерно в 4 раза по сравнению с BF16, что позволяет развертывать модель на меньшем количестве GPU и значительно снижает общую стоимость владения (TCO) для корпоративного ИИ.

Развертывание на одном узле

Разверните полную модель с 675B параметров на одном узле H100s или A100s. Отсутствие сложной многоузловой оркестрации, снижение сетевых накладных расходов, упрощенные операции.

Сохраненное качество модели

Передовые методы квантования поддерживают производительность модели в задачах рассуждения, следования инструкциям и мультимодальных задачах с минимальным снижением качества.

Claude Opus 4.5 Дистилляция знаний

Shannon Lite 1.6 был тщательно дообучен с использованием 2 500 тщательно отобранных выходных данных отClaude Opus 4.5, самой мощной модели Anthropic. Этот подход дистилляции знаний позволяет улавливать продвинутые шаблоны рассуждений, тонкую интерпретацию инструкций и превосходное качество ответов.

Mistral Large 3 Instruct 2512 Основа

Построен на базе современной модели Instruct от Mistral (версия 2512) с точностью BF16. Эта основа обеспечивает возможности передового уровня, разработанные для ассистентов производственного класса, систем с дополненным поиском, научных рабочих нагрузок и сложных корпоративных рабочих процессов.

База BF16 Настроен для инструкций Готов к производству Лицензия Apache 2.0

Claude Opus 4.5 Дистилляция выходных данных

Дообучен на 2 500 высококачественных выходных данных от Claude Opus 4.5, улавливая самые передовые возможности рассуждения Anthropic. Курированный набор данных сосредоточен на сложном следовании инструкциям, тонком понимании и высококачественной генерации ответов в различных областях.

2 500 образцов Курированный набор данных Фокус на качестве Разнообразные области

Процесс квантования NVFP4

Продвинутое квантование NVIDIA FP4, применяемое после обучения для уменьшения объема памяти при сохранении качества модели. Откалибровано специально для весов после обучения, чтобы сохранить передачу знаний Claude Opus 4.5 и возможности следования инструкциям.

NVFP4 4-битная точность Откалибровано Качество сохранено

Оценка и валидация

Комплексная оценка по бенчмаркам следования инструкциям, задачам рассуждения и реальным корпоративным сценариям. Проверено на последовательное кросс-доменное поведение, стабильные выходы и надежную производительность в производственных средах.

Протестировано Кросс-доменное Проверено для производства Стабильные выходы

Гибкие опции развертывания на GPU

Shannon Lite 1.6 с квантованием NVFP4 обеспечивает экономичное развертывание на стандартных конфигурациях GPU NVIDIA, делая передовой ИИ доступным для корпоративных развертываний без необходимости в дорогих многоузловых кластерах.

NVIDIA H100 SXM

Оптимальная производительность с архитектурой Hopper и памятью HBM3

Один узел (8x H100)
Точность NVFP4
80 ГБ HBM3 на GPU
Максимальная пропускная способность

NVIDIA A100 SXM

Доказанная надежность на GPU с архитектурой Ampere

Один узел (8x A100)
Точность NVFP4
80 ГБ HBM2e на GPU
Экономически эффективный

Shannon Cloud

Полностью управляемое развертывание с нулевой инфраструктурой

Мгновенный доступ
Автомасштабирование
Готовность к REST API
SLA 99.9%

Функции ИИ, готовые для предприятий

Shannon Lite 1.6 предоставляет передовые возможности, унаследованные от Mistral Large 3 и улучшенные за счет пост-обучения Claude Opus 4.5, оптимизированные для производственных нагрузок в различных корпоративных сценариях.

Мультимодальное зрение

Встроенный визуальный кодировщик с 2.5 миллиардами параметров обеспечивает анализ изображений, визуальные ответы на вопросы и понимание документов с изображениями.

Многоязычное превосходство

Нативная поддержка более 12 языков, включая английский, французский, испанский, немецкий, итальянский, португальский, голландский, китайский, японский, корейский и арабский.

🤖

Агентские возможности

Лучшие в своем классе агентские функции с нативным вызовом функций и структурированным выводом JSON для автономного использования инструментов и автоматизации рабочих процессов.

Соблюдение системных подсказок

Строгое соблюдение и поддержка системных подсказок, обеспечивающие точный контроль поведения и последовательное поддержание персоны.

Длинный контекст 256K

Расширенное окно контекста для всестороннего понимания документов, длительных бесед и генерации с дополненным поиском (RAG).

🔧

Нативный вызов функций

Встроенная поддержка вызова функций с надежным выводом JSON для бесшовной интеграции с внешними инструментами, API и сервисами.

Оптимизировано для производственных нагрузок

Благодаря мощной производительности с длинным контекстом, стабильному и последовательному кросс-доменному поведению, Shannon Lite 1.6 превосходно работает в различных корпоративных и исследовательских сценариях.

📄

Понимание длинных документов

Обрабатывайте и анализируйте обширные документы, контракты, отчеты и научные статьи с окном контекста 256K

🤖

Производственные ИИ-помощники

Обеспечьте работу повседневных ИИ-помощников с надежными, последовательными ответами и строгим следованием инструкциям

🔧

Агентские рабочие процессы

Передовое использование инструментов и вызов функций для автономного выполнения задач и автоматизации рабочих процессов

🏢

Корпоративная работа со знаниями

Сложные корпоративные рабочие процессы, требующие передовых возможностей ИИ с последовательными, надежными выходами

💻

Универсальный помощник по кодированию

Генерация кода, отладка, документирование и помощь в разработке программного обеспечения на нескольких языках

Научные исследования

Помощь в исследованиях, обзор литературы, обработка научных рабочих нагрузок и генерация гипотез

Генерация с дополненным поиском

Оптимальная производительность для систем RAG с надежной интеграцией контекста и точным синтезом извлеченных данных

🌍

Многоязычные приложения

Глобальные корпоративные приложения, требующие постоянного качества на более чем 12 поддерживаемых языках

Shannon Lite против Shannon Pro

Выберите подходящую модель Shannon для ваших нужд. Shannon Lite предлагает экономичное корпоративное развертывание, в то время как Shannon Pro обеспечивает максимальные возможности с продвинутым рассуждением по цепочке мыслей и поддержкой навыков.

Функция Shannon Lite 1.6 Shannon Pro 1.6
Базовая модель Mistral Large 3 (675B) Mistral Large 3 (675B)
Активные параметры 41B (Гранулярный MoE) 41B (Гранулярный MoE)
Точность NVFP4 (4-бит) Полный BF16 (16-бит)
Данные после обучения 2,500 выходов Claude Opus 4.5 Следы мышления KIMI K2
Метод после обучения Тонкая настройка с учителем GRPO (Оптимизация политики относительной группы)
Режим рассуждения Стандартный Следы цепочки рассуждений
Поддержка навыков - Только ProВстроенные навыки
Развертывание H100/A100 (Один узел) B200/H200 (FP8)
Лучше всего для Экономичный корпоративный ИИ Максимальные возможности + рассуждение

Нужны расширенные рассуждения и навыки?

Shannon Pro 1.6 включает следы мышления KIMI K2 с обучением GRPO для прозрачного рассуждения по цепочке мыслей, а также встроенную поддержку навыков для пользовательских рабочих процессов ИИ.

Изучите Shannon Pro

Оцените Shannon Lite 1.6

Передовые возможности ИИ с экономичной квантизацией NVFP4. Развертывайте на инфраструктуре H100 или A100 для производительности корпоративного уровня по доступной цене.

Все ссылки на исследования