Ми не зберігаємо й не маємо доступу до даних жодного користувача та не призупиняємо акаунти, якщо цього не вимагає законний орган.
NVFP4 Квантований - Економічно ефективний корпоративний ШІ

ShannonЛайт 1.6

Економічно ефективний корпоративний ШІ на базіMistral Large 3з675B загальних параметрівта41B активних параметрівзавдяки гранулярній архітектурі Mixture-of-Experts. Пост-навчена на2 500 виходах Claude Opus 4.5для виняткового дотримання інструкцій.Квантування NVFP4дозволяє розгортання на одному вузлі наH100s або A100s.

675B
Загальні параметри
41B
Активні параметри
NVFP4
Квантування
256K
Контекст
2.5B
Візуальний кодувальник
Версія Lite
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Технічні характеристики:
Базова модель Mistral Large 3
Архітектура Гранулярна MoE
Загальні параметри 675B
Активні параметри 41B
Квантування NVFP4
Пост-навчання Claude Opus 4.5
Зразки для навчання 2,500

Mistral Large 3: Гранулярна Mixture-of-Experts

Shannon Lite 1.6 побудована на Mistral Large 3, сучасній мультимодальній гранулярній моделі Mixture-of-Experts розробленій з нуля для надійності, розуміння довгого контексту та продуктивності промислового рівня. Версія, пост-навчена на інструкціях, тонко налаштована для чатів, агентних та інструктивних сценаріїв використання.

673B

Мовна модель

Гранулярна архітектура MoE з 39B активних параметрів за один прямий прохід

2.5B

Візуальний кодувальник

Інтегрований мультимодальний кодувальник для аналізу зображень та візуального розуміння

256K

Вікно контексту

Розширений контекст для всебічного розуміння документів та RAG

12+

Мови

Англійська, Французька, Іспанська, Німецька, Китайська, Японська, Корейська, Арабська та інші

Економічно ефективне корпоративне розгортання

Shannon Lite 1.6 використовує технологію квантування NVFP4 (4-бітне число з плаваючою комою) від NVIDIA для значного зменшення вимог до пам'яті, зберігаючи при цьому якість моделі. Розгортайте ШІ передового класу на доступній інфраструктурі GPU без складності багатоузлових систем.

💰

Зниження витрат на інфраструктуру

Квантування NVFP4 зменшує обсяг пам'яті приблизно в 4 рази порівняно з BF16, дозволяючи розгортання на меншій кількості GPU та значно знижуючи загальну вартість володіння (TCO) для корпоративного ШІ.

Розгортання на одному вузлі

Розгорніть повну модель з 675B параметрів на одному вузлі H100s або A100s. Без складної багатоузлової оркестрації, зі зменшеними накладними витратами на мережу, спрощені операції.

Збережена якість моделі

Передові методи квантування підтримують продуктивність моделі у завданнях міркування, дотримання інструкцій та мультимодальних завданнях з мінімальним погіршенням якості.

Дистиляція знань Claude Opus 4.5

Shannon Lite 1.6 була ретельно пост-навчена використовуючи 2 500 ретельно відібраних виходів відClaude Opus 4.5, найпотужнішої моделі Anthropic. Цей підхід дистиляції знань фіксує передові моделі міркування, тонке тлумачення інструкцій та вищу якість відповідей.

Основа Mistral Large 3 Instruct 2512

Побудована на сучасній моделі Instruct від Mistral (версія 2512) з точністю BF16. Ця основа забезпечує можливості передового рівня, розроблені для помічників промислового рівня, систем з доповненим пошуком, наукових робочих навантажень та складних корпоративних робочих процесів.

База BF16 Налаштована на інструкції Готова до виробництва Ліцензія Apache 2.0

Дистиляція виходів Claude Opus 4.5

Пост-навчена на 2 500 високоякісних виходах від Claude Opus 4.5, що фіксує найпередовіші можливості міркування Anthropic. Відібраний набір даних зосереджений на складному дотриманні інструкцій, тонкому розумінні та високоякісній генерації відповідей у різних доменах.

2 500 зразків Відібраний набір даних Фокус на якості Різноманітні домени

Процес квантування NVFP4

Удосконалене квантування NVIDIA FP4, застосоване після навчання для зменшення обсягу пам'яті при збереженні якості моделі. Відкаліброване спеціально для навчених ваг, щоб зберегти передачу знань Claude Opus 4.5 та можливості слідування інструкціям.

NVFP4 4-бітна точність Відкалібрований Якість збережена

Оцінка та валідація

Комплексна оцінка за бенчмарками слідування інструкціям, завданнями на міркування та реальними корпоративними сценаріями. Перевірено на послідовну міждоменну поведінку, стабільні вихідні дані та надійну продуктивність у виробничих середовищах.

Протестовано за бенчмарками Міждоменний Перевірено для виробництва Стабільні вихідні дані

Гнучкі варіанти розгортання на GPU

Shannon Lite 1.6 з квантуванням NVFP4 забезпечує економічно ефективне розгортання на стандартних конфігураціях GPU NVIDIA, роблячи передовий ШІ доступним для корпоративних розгортань без необхідності дорогих багатонодових кластерів.

NVIDIA H100 SXM

Оптимальна продуктивність з архітектурою Hopper та пам'яттю HBM3

Один вузол (8x H100)
Точність NVFP4
80 ГБ HBM3 на GPU
Максимальна пропускна здатність

NVIDIA A100 SXM

Доведена надійність на GPU з архітектурою Ampere

Один вузол (8x A100)
Точність NVFP4
80 ГБ HBM2e на GPU
Економічно ефективний

Shannon Cloud

Повністю кероване розгортання без інфраструктури

Миттєвий доступ
Автоматичне масштабування
Готовий до REST API
99.9% SLA

Функції ШІ, готові до використання на підприємстві

Shannon Lite 1.6 надає передові можливості, успадковані від Mistral Large 3 та покращені завдяки післянавчанню Claude Opus 4.5, оптимізовані для виробничих навантажень у різноманітних корпоративних сценаріях.

Мультимодальний зір

Інтегрований візуальний кодер з 2.5 мільярдами параметрів дозволяє аналізувати зображення, відповідати на візуальні запитання та розуміти документи із зображеннями.

Багатомовна досконалість

Нативна підтримка 12+ мов, включаючи англійську, французьку, іспанську, німецьку, італійську, португальську, голландську, китайську, японську, корейську та арабську.

🤖

Агентні можливості

Найкращі в своєму класі агентні функції з нативним викликом функцій та структурованим виводом JSON для автономного використання інструментів та автоматизації робочих процесів.

Дотримання системних підказок

Сильне дотримання та підтримка системних підказок, що забезпечує точний контроль поведінки та послідовне збереження персони.

Довгий контекст 256K

Розширене контекстне вікно для всебічного розуміння документів, розширених розмов та генерації з доповненням пошуком (RAG).

🔧

Нативний виклик функцій

Вбудована підтримка виклику функцій з надійним виводом JSON для безшовної інтеграції із зовнішніми інструментами, API та сервісами.

Оптимізовано для виробничих навантажень

Завдяки потужній продуктивності з довгим контекстом, стабільній та послідовній міждоменній поведінці, Shannon Lite 1.6 відмінно працює в різноманітних корпоративних та дослідницьких сценаріях.

📄

Розуміння довгих документів

Обробляйте та аналізуйте великі документи, контракти, звіти та наукові статті за допомогою контекстного вікна 256K

🤖

Виробничі ШІ-асистенти

Забезпечуйте щоденних ШІ-асистентів надійними, послідовними відповідями та сильним слідуванням інструкціям

🔧

Агентні робочі процеси

Сучасне використання інструментів та виклик функцій для автономного виконання завдань та автоматизації робочих процесів

🏢

Робота зі знаннями на підприємстві

Складні корпоративні робочі процеси, що вимагають передових можливостей ШІ з послідовними, надійними вихідними даними

💻

Загальний помічник з кодування

Генерація коду, налагодження, документування та допомога в розробці програмного забезпечення кількома мовами

Наукові дослідження

Допомога в дослідженнях, огляд літератури, обробка наукових навантажень та генерація гіпотез

Генерація з доповненням пошуком

Оптимальна продуктивність для систем RAG з надійною інтеграцією контексту та точною синтезацією пошуку

🌍

Багатомовні програми

Глобальні корпоративні програми, що вимагають постійної якості на 12+ підтримуваних мовах

Shannon Lite проти Shannon Pro

Виберіть правильну модель Shannon для ваших потреб. Shannon Lite пропонує економічно ефективне корпоративне розгортання, тоді як Shannon Pro забезпечує максимальні можливості з розширеним ланцюжком міркувань та підтримкою навичок.

Функція Shannon Lite 1.6 Shannon Pro 1.6
Базова модель Mistral Large 3 (675B) Mistral Large 3 (675B)
Активні параметри 41B (Гранулярний MoE) 41B (Гранулярний MoE)
Точність NVFP4 (4-біт) Повний BF16 (16-біт)
Дані після навчання 2 500 виходів Claude Opus 4.5 Сліди мислення KIMI K2
Метод після навчання Кероване доналаштування GRPO (Оптимізація групової відносної політики)
Режим міркування Стандартний Сліди ланцюжка думок
Підтримка навичок - Тільки ProВбудовані навички
Розгортання H100/A100 (Один вузол) B200/H200 (FP8)
Найкраще для Економічно ефективний корпоративний ШІ Максимальні можливості + міркування

Потрібні розширені міркування та навички?

Shannon Pro 1.6 має сліди мислення KIMI K2 з навчанням GRPO для прозорого ланцюжка думок, а також вбудовану підтримку навичок для індивідуальних робочих процесів ШІ.

Дослідіть Shannon Pro

Спробуйте Shannon Lite 1.6

Можливості передового ШІ з економічно ефективною квантизацією NVFP4. Розгортайте на інфраструктурі H100 або A100 для продуктивності корпоративного рівня за доступною ціною.

Усі дослідницькі посилання