Ми не зберігаємо й не маємо доступу до даних жодного користувача та не призупиняємо акаунти, якщо цього не вимагає законний орган.

NVFP4 Квантований - Економічно ефективний корпоративний ШІ

ShannonЛайт 1.6

Економічно ефективний корпоративний ШІ на базіMistral Large 3з675B загальних параметрівта41B активних параметрівзавдяки гранулярній архітектурі Mixture-of-Experts. Пост-навчена на2 500 виходах Claude Opus 4.5для виняткового дотримання інструкцій.Квантування NVFP4дозволяє розгортання на одному вузлі наH100s або A100s.

675B

Загальні параметри

41B

Активні параметри

NVFP4

Квантування

256K

Контекст

2.5B

Візуальний кодувальник

Спробувати Shannon Lite Переглянути Документацію

Версія Lite

Shannon Lite 1.6

v1.6.0-lite-nvfp4

Базова модель Mistral Large 3

Архітектура Гранулярна MoE

Загальні параметри 675B

Активні параметри 41B

Квантування NVFP4

Пост-навчання Claude Opus 4.5

Зразки для навчання 2,500

Технічна архітектура

Mistral Large 3: Гранулярна Mixture-of-Experts

Shannon Lite 1.6 побудована на Mistral Large 3, сучасній мультимодальній гранулярній моделі Mixture-of-Experts розробленій з нуля для надійності, розуміння довгого контексту та продуктивності промислового рівня. Версія, пост-навчена на інструкціях, тонко налаштована для чатів, агентних та інструктивних сценаріїв використання.

673B

Мовна модель

Гранулярна архітектура MoE з 39B активних параметрів за один прямий прохід

2.5B

Візуальний кодувальник

Інтегрований мультимодальний кодувальник для аналізу зображень та візуального розуміння

256K

Вікно контексту

Розширений контекст для всебічного розуміння документів та RAG

12+

Мови

Англійська, Французька, Іспанська, Німецька, Китайська, Японська, Корейська, Арабська та інші

Квантування NVFP4

Економічно ефективне корпоративне розгортання

Shannon Lite 1.6 використовує технологію квантування NVFP4 (4-бітне число з плаваючою комою) від NVIDIA для значного зменшення вимог до пам'яті, зберігаючи при цьому якість моделі. Розгортайте ШІ передового класу на доступній інфраструктурі GPU без складності багатоузлових систем.

💰

Зниження витрат на інфраструктуру

Квантування NVFP4 зменшує обсяг пам'яті приблизно в 4 рази порівняно з BF16, дозволяючи розгортання на меншій кількості GPU та значно знижуючи загальну вартість володіння (TCO) для корпоративного ШІ.

Розгортання на одному вузлі

Розгорніть повну модель з 675B параметрів на одному вузлі H100s або A100s. Без складної багатоузлової оркестрації, зі зменшеними накладними витратами на мережу, спрощені операції.

Збережена якість моделі

Передові методи квантування підтримують продуктивність моделі у завданнях міркування, дотримання інструкцій та мультимодальних завданнях з мінімальним погіршенням якості.

Методологія пост-навчання

Дистиляція знань Claude Opus 4.5

Shannon Lite 1.6 була ретельно пост-навчена використовуючи 2 500 ретельно відібраних виходів відClaude Opus 4.5, найпотужнішої моделі Anthropic. Цей підхід дистиляції знань фіксує передові моделі міркування, тонке тлумачення інструкцій та вищу якість відповідей.

Основа Mistral Large 3 Instruct 2512

Побудована на сучасній моделі Instruct від Mistral (версія 2512) з точністю BF16. Ця основа забезпечує можливості передового рівня, розроблені для помічників промислового рівня, систем з доповненим пошуком, наукових робочих навантажень та складних корпоративних робочих процесів.

База BF16 Налаштована на інструкції Готова до виробництва Ліцензія Apache 2.0

Дистиляція виходів Claude Opus 4.5

Пост-навчена на 2 500 високоякісних виходах від Claude Opus 4.5, що фіксує найпередовіші можливості міркування Anthropic. Відібраний набір даних зосереджений на складному дотриманні інструкцій, тонкому розумінні та високоякісній генерації відповідей у різних доменах.

2 500 зразків Відібраний набір даних Фокус на якості Різноманітні домени

Процес квантування NVFP4

Удосконалене квантування NVIDIA FP4, застосоване після навчання для зменшення обсягу пам'яті при збереженні якості моделі. Відкаліброване спеціально для навчених ваг, щоб зберегти передачу знань Claude Opus 4.5 та можливості слідування інструкціям.

NVFP4 4-бітна точність Відкалібрований Якість збережена

Оцінка та валідація

Комплексна оцінка за бенчмарками слідування інструкціям, завданнями на міркування та реальними корпоративними сценаріями. Перевірено на послідовну міждоменну поведінку, стабільні вихідні дані та надійну продуктивність у виробничих середовищах.

Протестовано за бенчмарками Міждоменний Перевірено для виробництва Стабільні вихідні дані

Інфраструктура розгортання

Гнучкі варіанти розгортання на GPU

Shannon Lite 1.6 з квантуванням NVFP4 забезпечує економічно ефективне розгортання на стандартних конфігураціях GPU NVIDIA, роблячи передовий ШІ доступним для корпоративних розгортань без необхідності дорогих багатонодових кластерів.

NVIDIA H100 SXM

Оптимальна продуктивність з архітектурою Hopper та пам'яттю HBM3

Один вузол (8x H100)

Точність NVFP4

80 ГБ HBM3 на GPU

Максимальна пропускна здатність

NVIDIA A100 SXM

Доведена надійність на GPU з архітектурою Ampere

Один вузол (8x A100)

Точність NVFP4

80 ГБ HBM2e на GPU

Економічно ефективний

Shannon Cloud

Повністю кероване розгортання без інфраструктури

Миттєвий доступ

Автоматичне масштабування

Готовий до REST API

99.9% SLA

Можливості моделі

Функції ШІ, готові до використання на підприємстві

Shannon Lite 1.6 надає передові можливості, успадковані від Mistral Large 3 та покращені завдяки післянавчанню Claude Opus 4.5, оптимізовані для виробничих навантажень у різноманітних корпоративних сценаріях.

Мультимодальний зір

Інтегрований візуальний кодер з 2.5 мільярдами параметрів дозволяє аналізувати зображення, відповідати на візуальні запитання та розуміти документи із зображеннями.

Багатомовна досконалість

Нативна підтримка 12+ мов, включаючи англійську, французьку, іспанську, німецьку, італійську, португальську, голландську, китайську, японську, корейську та арабську.

🤖

Агентні можливості

Найкращі в своєму класі агентні функції з нативним викликом функцій та структурованим виводом JSON для автономного використання інструментів та автоматизації робочих процесів.

Дотримання системних підказок

Сильне дотримання та підтримка системних підказок, що забезпечує точний контроль поведінки та послідовне збереження персони.

Довгий контекст 256K

Розширене контекстне вікно для всебічного розуміння документів, розширених розмов та генерації з доповненням пошуком (RAG).

🔧

Нативний виклик функцій

Вбудована підтримка виклику функцій з надійним виводом JSON для безшовної інтеграції із зовнішніми інструментами, API та сервісами.

Варіанти використання

Оптимізовано для виробничих навантажень

Завдяки потужній продуктивності з довгим контекстом, стабільній та послідовній міждоменній поведінці, Shannon Lite 1.6 відмінно працює в різноманітних корпоративних та дослідницьких сценаріях.

📄

Розуміння довгих документів

Обробляйте та аналізуйте великі документи, контракти, звіти та наукові статті за допомогою контекстного вікна 256K

🤖

Виробничі ШІ-асистенти

Забезпечуйте щоденних ШІ-асистентів надійними, послідовними відповідями та сильним слідуванням інструкціям

🔧

Агентні робочі процеси

Сучасне використання інструментів та виклик функцій для автономного виконання завдань та автоматизації робочих процесів

🏢

Робота зі знаннями на підприємстві

Складні корпоративні робочі процеси, що вимагають передових можливостей ШІ з послідовними, надійними вихідними даними

💻

Загальний помічник з кодування

Генерація коду, налагодження, документування та допомога в розробці програмного забезпечення кількома мовами

Наукові дослідження

Допомога в дослідженнях, огляд літератури, обробка наукових навантажень та генерація гіпотез

Генерація з доповненням пошуком

Оптимальна продуктивність для систем RAG з надійною інтеграцією контексту та точною синтезацією пошуку

🌍

Багатомовні програми

Глобальні корпоративні програми, що вимагають постійної якості на 12+ підтримуваних мовах

Порівняння моделей

Shannon Lite проти Shannon Pro

Виберіть правильну модель Shannon для ваших потреб. Shannon Lite пропонує економічно ефективне корпоративне розгортання, тоді як Shannon Pro забезпечує максимальні можливості з розширеним ланцюжком міркувань та підтримкою навичок.

Функція	Shannon Lite 1.6	Shannon Pro 1.6
Базова модель	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Активні параметри	41B (Гранулярний MoE)	41B (Гранулярний MoE)
Точність	NVFP4 (4-біт)	Повний BF16 (16-біт)
Дані після навчання	2 500 виходів Claude Opus 4.5	Сліди мислення KIMI K2
Метод після навчання	Кероване доналаштування	GRPO (Оптимізація групової відносної політики)
Режим міркування	Стандартний	Сліди ланцюжка думок
Підтримка навичок	-	Тільки ProВбудовані навички
Розгортання	H100/A100 (Один вузол)	B200/H200 (FP8)
Найкраще для	Економічно ефективний корпоративний ШІ	Максимальні можливості + міркування

Спробуйте Shannon Lite 1.6

Можливості передового ШІ з економічно ефективною квантизацією NVFP4. Розгортайте на інфраструктурі H100 або A100 для продуктивності корпоративного рівня за доступною ціною.

Почніть використовувати Shannon Lite Порівняти з Pro

Усі дослідницькі посилання

Політика відповідального використання Умови надання послуг Shannon V1 Збалансований Shannon V1 Глибока Shannon V1.5 Мислення Shannon V1.5 Глибоке мислення Shannon Лайт 1.6 Shannon Про 1.6 Як ми навчили Mixtral на GPT-5 Pro через дистиляцію OpenRouter Як ми навчили Shannon V1.5 думати за допомогою GRPO Пентестинг за допомогою ШІ: Shannon AI тепер працює над Claude Code Користувацький Shannon Проєкти Навички

ShannonЛайт 1.6

Mistral Large 3: Гранулярна Mixture-of-Experts

Мовна модель

Візуальний кодувальник

Вікно контексту

Мови

Економічно ефективне корпоративне розгортання

Зниження витрат на інфраструктуру

Розгортання на одному вузлі

Збережена якість моделі

Дистиляція знань Claude Opus 4.5

Основа Mistral Large 3 Instruct 2512

Дистиляція виходів Claude Opus 4.5

Процес квантування NVFP4

Оцінка та валідація

Гнучкі варіанти розгортання на GPU

NVIDIA H100 SXM

NVIDIA A100 SXM

Shannon Cloud

Функції ШІ, готові до використання на підприємстві

Мультимодальний зір

Багатомовна досконалість

Агентні можливості

Дотримання системних підказок

Довгий контекст 256K

Нативний виклик функцій

Оптимізовано для виробничих навантажень

Розуміння довгих документів

Виробничі ШІ-асистенти

Агентні робочі процеси

Робота зі знаннями на підприємстві

Загальний помічник з кодування

Наукові дослідження

Генерація з доповненням пошуком

Багатомовні програми

Shannon Lite проти Shannon Pro

Потрібні розширені міркування та навички?

Спробуйте Shannon Lite 1.6

Усі дослідницькі посилання