Не чуваме и не пристапуваме до кориснички податоци, и не суспендираме сметки освен ако надлежен орган не нè принуди на акција.

NVFP4 Quantized - рентабилна вештачка интелигенција на претпријатијата

ShannonЛајт 1.6

Ефтино претпријатие вештачка интелигенција напојувана одМистрал Ларџ 3со675B вкупни параметрии41B активни параметрипреку грануларна архитектура Mixture-of-Experts. Посттренирано на2.500 Claude Opus 4.5 излезиза исклучителна инструкција-следење.Квантизација на NVFP4овозможува вклучување на еден јазолH100s или A100s.

675B

Вкупно параметри

41B

Активни параметри

NVFP4

Квантизација

256K

Контекст

2.5B

Визија енкодер

Пробајте го Шенон Лајт Погледнете ја документацијата

Лајт издание

Шенон Лајт 1.6

v1.6.0-lite-nvfp4

Основен модел Мистрал Ларџ 3

Архитектура Грануларен МЕ

Вкупно параметри 675B

Активни параметри 41B

Квантизација NVFP4

Пост-тренинг Клод Опус 4.5

Примероци за обука 2,500

Техничка архитектура

Mistral Large 3: грануларна мешавина-на-експерти

Shannon Lite 1.6 е изграден на Mistral Large 3, најсовремен мултимодален грануларен модел Mixture of-Experts дизајниран од основата за доверливост, разбирање во долг контекст и перформанси во степен на производство. Пост-тренираната верзија на инструкциите е фино прилагодена за случаи на чет, агенти и случаи за употреба базирани на инструкции.

673B

Јазичен модел

Грануларна ME архитектура со 39B активни параметри по напред премин

2.5B

Визија енкодер

Интегриран мултимодален енкодер за анализа на слики и визуелно разбирање

256K

Контекстен прозорец

Проширен контекст за сеопфатно разбирање на документи и RAG

12+

Јазици

Англиски, француски, шпански, германски, кинески, јапонски, корејски, арапски и многу повеќе

Квантизација на NVFP4

Ефективно распоредување на претпријатија

Shannon Lite 1.6 ја користи технологијата за квантизација на NVIDIA NVFP4 (4-битна подвижна запирка) драматично да ги намали барањата за меморија додека го зачува квалитетот на моделот. Распоредете гранична класа Вештачка интелигенција на пристапна инфраструктура на графичкиот процесор без сложеност на повеќе јазли.

💰

Намалени инфраструктурни трошоци

Квантизацијата на NVFP4 го намалува отпечатокот на меморијата за приближно 4 пати во споредба со BF16, овозможувајќи распоредување на помалку графички процесори и драматично намалување на TCO за интелигенција на претпријатието.

Распоредување со еден јазол

Распоредете го целосниот модел на параметри 675B на еден јазол од H100s или A100s. Нема сложена оркестрација со повеќе јазли, намалени трошоци за вмрежување, поедноставени операции.

Зачуван квалитет на моделот

Напредните техники на квантизација ги одржуваат перформансите на моделот низ задачите за расудување, следење инструкции и мултимодални задачи со минимална деградација на квалитетот.

Методологија на пост-тренинг

Клод Опус 4.5 Дестилација на знаење

Shannon Lite 1.6 е прецизно пост-трениран користејќи 2.500 внимателно курирани излези одКлод Опус 4.5, најспособниот модел на Антропик. Овој пристап на дестилација на знаење доловува напредни обрасци на расудување, нијансирано толкување на инструкциите и супериорен квалитет на одговорот.

Фондација Mistral Large 3 Instruct 2512

Изграден на најсовремениот модел Instruct на Mistral (верзија 2512) со прецизност BF16. Оваа основа обезбедува способности на гранично ниво дизајнирани за асистенти од производствен степен, зголемени системи за пронаоѓање, научни оптоварувања и сложени работни процеси на претпријатието.

BF16 база Instruct Tuned Подготвено за производство Лиценца Apache 2.0

Излезна дестилација Claude Opus 4.5

Посттренирано на 2.500 висококвалитетни излези од Claude Opus 4.5, доловувајќи ги најнапредните на Anthropic способности за расудување. Курираната база на податоци се фокусира на сложено следење на упатствата, нијансирано разбирање, и генерирање одговор со висок квалитет низ различни домени.

2.500 примероци Курирана група на податоци Фокус на квалитет Разновидни домени

Процес на квантизација на NVFP4

Напредната NVIDIA FP4 квантизација применета после тренинг за да се намали отпечатокот од меморијата додека се одржува квалитет на моделот. Специфично калибриран за тежини по вежбање за да се зачува Claude Opus 4.5 пренос на знаење и способности за следење инструкции.

NVFP4 4-битна прецизност Калибриран Зачуван квалитет

Евалуација и валидација

Сеопфатна евалуација низ одредниците за следење инструкции, задачи за расудување и реалниот свет сценарија на претпријатието. Потврдено за постојано однесување меѓу домени, стабилни излези и доверливи перформанси во производни средини.

Бенчмаркирани Крос-домен Производство Потврдено Стабилни излези

Инфраструктура за распоредување

Флексибилни опции за распоредување на графичкиот процесор

Shannon Lite 1.6 со квантизација NVFP4 овозможува исплатливо распоредување на индустриски стандард Конфигурации на графичкиот процесор на NVIDIA, што ја прави граничната вештачка интелигенција достапна за распоредувања на претпријатија без кои бараат скапи кластери со повеќе јазли.

NVIDIA H100 SXM

Оптимални перформанси со Hopper архитектура и HBM3 меморија

Еден јазол (8x H100)

NVFP4 Прецизност

80 GB HBM3 по графички процесор

Максимална пропусната моќ

NVIDIA A100 SXM

Докажана сигурност на графичките процесори со архитектура Ampere

Еден јазол (8x A100)

NVFP4 Прецизност

80 GB HBM2e по графички процесор

Ефикасно

Шенон Облак

Целосно управувано распоредување со нулта инфраструктура

Инстант пристап

Автоматско скалирање

Подготвен REST API

99,9% SLA

Моделни можности

Карактеристики на вештачка интелигенција подготвена за претпријатија

Shannon Lite 1.6 обезбедува гранични способности наследени од Mistral Large 3 и подобрени преку Claude Opus 4.5 пост-тренинг, оптимизиран за производствени оптоварувања низ различни сценарија на претпријатија.

Мултимодална визија

Интегрираниот енкодер за визија со параметри 2,5B овозможува анализа на слики, визуелно одговарање на прашања и разбирање документи со слики.

Повеќејазична извонредност

Мајчин поддршка за 12+ јазици, вклучувајќи англиски, француски, шпански, германски, италијански, португалски, холандски, кинески, јапонски, корејски и арапски.

🤖

Агентски способности

Најдобрите агентски карактеристики во класата со оригинално повикување функции и структуриран JSON излез за автономна употреба на алатки и автоматизација на работниот тек.

Системско брзо придржување

Силно придржување и поддршка за системските барања, овозможувајќи прецизна контрола на однесувањето и доследно одржување на личноста.

256K Долг контекст

Проширен контекстен прозорец за сеопфатно разбирање на документите, проширени разговори и зголемена генерација на пронаоѓање (RAG).

🔧

Повикување на мајчин функција

Вградена функционална поддршка за повикување со сигурен JSON излез за беспрекорна интеграција со надворешни алатки, API и услуги.

Случаи за употреба

Оптимизиран за производствени оптоварувања

Со моќни перформанси со долг контекст, стабилно и доследно однесување меѓу домени, Shannon Lite 1.6 се истакнува во различни сценарија на претпријатија и истражувања.

📄

Разбирање на долги документи

Обработете и анализирајте обемни документи, договори, извештаи и истражувачки трудови со контекстниот прозорец 256K

🤖

Асистенти со вештачка интелигенција за производство

Напојувајте ги дневните асистенти со вештачка интелигенција на возачот со сигурни, постојани одговори и силно следење на упатствата

🔧

Агентски работни текови

Употреба и функција на најсовремена алатка која повикува на автономно извршување на задачи и автоматизација на работниот тек

🏢

Работа со знаење на претпријатијата

Комплексни работни текови на претпријатијата кои бараат гранични способности за вештачка интелигенција со конзистентни, сигурни резултати

💻

Генерален асистент за кодирање

Генерирање код, дебагирање, документација и помош за развој на софтвер на повеќе јазици

Научно истражување

Помош за истражување, преглед на литература, обработка на научен обем на работа и генерирање хипотези

Пронаоѓање-зголемена генерација

Оптимални перформанси за RAG системи со сигурна интеграција на контекстот и точна синтеза на пронаоѓање

🌍

Повеќејазични апликации

Глобални апликации за претпријатија кои бараат постојан квалитет на над 12 поддржани јазици

Споредба на модели

Шенон Лајт против Шенон Про

Изберете го вистинскиот модел на Шенон за вашите потреби. Shannon Lite нуди рентабилно распоредување на претпријатијата, додека Shannon Pro обезбедува максимална способност со напредно расудување со синџир на мисли и поддршка за вештини.

Карактеристика	Шенон Лајт 1.6	Шенон Про 1.6
Основен модел	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Активни параметри	41B (Грануларен МЕ)	41B (Грануларен МЕ)
Прецизност	NVFP4 (4-битна)	Целосна BF16 (16-битна)
Податоци за пост-тренинг	2.500 Claude Opus 4.5 излези	KIMI K2 Thinking Traces
Пост-тренинг метод	Надгледувано фино подесување	GRPO (Групна релативна политика за оптимизација)
Режим на расудување	Стандарден	Траги од синџир на мисли
Поддршка за вештини	-	Само проМајчин вештини
Распоредување	H100/A100 (Еден јазол)	B200/H200 (FP8)
Најдобро за	Ефикасна вештачка интелигенција на претпријатието	Максимална способност + расудување

Искусете го Шенон Лајт 1.6

Способности за гранична вештачка интелигенција со исплатлива квантизација на NVFP4. Распоредете на инфраструктурата H100 или A100 за перформанси на ниво на претпријатие по пристапна цена.

Започнете да користите Shannon Lite Споредете со Pro

Сите истражувачки врски

Политика за одговорна употреба Услови за користење Shannon V1 Балансиран Shannon V1 Длабок Shannon V1.5 Размислување Shannon V1.5 Длабоко размислување Shannon Лајт 1.6 Shannon Про 1.6 Како го обучивме Mixtral на GPT-5 Pro преку дестилација на OpenRouter Како го трениравме Shannon V1.5 да размислува користејќи GRPO Тестирање со помош на вештачка интелигенција: Шенон АИ сега работи на кодот на Клод Прилагодено Шенон Проекти Вештини

ShannonЛајт 1.6

Mistral Large 3: грануларна мешавина-на-експерти

Јазичен модел

Визија енкодер

Контекстен прозорец

Јазици

Ефективно распоредување на претпријатија

Намалени инфраструктурни трошоци

Распоредување со еден јазол

Зачуван квалитет на моделот

Клод Опус 4.5 Дестилација на знаење

Фондација Mistral Large 3 Instruct 2512

Излезна дестилација Claude Opus 4.5

Процес на квантизација на NVFP4

Евалуација и валидација

Флексибилни опции за распоредување на графичкиот процесор

NVIDIA H100 SXM

NVIDIA A100 SXM

Шенон Облак

Карактеристики на вештачка интелигенција подготвена за претпријатија

Мултимодална визија

Повеќејазична извонредност

Агентски способности

Системско брзо придржување

256K Долг контекст

Повикување на мајчин функција

Оптимизиран за производствени оптоварувања

Разбирање на долги документи

Асистенти со вештачка интелигенција за производство

Агентски работни текови

Работа со знаење на претпријатијата

Генерален асистент за кодирање

Научно истражување

Пронаоѓање-зголемена генерација

Повеќејазични апликации

Шенон Лајт против Шенон Про

Ви треба напредно расудување и вештини?

Искусете го Шенон Лајт 1.6

Сите истражувачки врски