Не чуваме и не пристапуваме до кориснички податоци, и не суспендираме сметки освен ако надлежен орган не нè принуди на акција.
NVFP4 Quantized - рентабилна вештачка интелигенција на претпријатијата

ShannonЛајт 1.6

Ефтино претпријатие вештачка интелигенција напојувана одМистрал Ларџ 3со675B вкупни параметрии41B активни параметрипреку грануларна архитектура Mixture-of-Experts. Посттренирано на2.500 Claude Opus 4.5 излезиза исклучителна инструкција-следење.Квантизација на NVFP4овозможува вклучување на еден јазолH100s или A100s.

675B
Вкупно параметри
41B
Активни параметри
NVFP4
Квантизација
256K
Контекст
2.5B
Визија енкодер
Лајт издание
Шенон Лајт 1.6
v1.6.0-lite-nvfp4
Технички спецификации:
Основен модел Мистрал Ларџ 3
Архитектура Грануларен МЕ
Вкупно параметри 675B
Активни параметри 41B
Квантизација NVFP4
Пост-тренинг Клод Опус 4.5
Примероци за обука 2,500

Mistral Large 3: грануларна мешавина-на-експерти

Shannon Lite 1.6 е изграден на Mistral Large 3, најсовремен мултимодален грануларен модел Mixture of-Experts дизајниран од основата за доверливост, разбирање во долг контекст и перформанси во степен на производство. Пост-тренираната верзија на инструкциите е фино прилагодена за случаи на чет, агенти и случаи за употреба базирани на инструкции.

673B

Јазичен модел

Грануларна ME архитектура со 39B активни параметри по напред премин

2.5B

Визија енкодер

Интегриран мултимодален енкодер за анализа на слики и визуелно разбирање

256K

Контекстен прозорец

Проширен контекст за сеопфатно разбирање на документи и RAG

12+

Јазици

Англиски, француски, шпански, германски, кинески, јапонски, корејски, арапски и многу повеќе

Ефективно распоредување на претпријатија

Shannon Lite 1.6 ја користи технологијата за квантизација на NVIDIA NVFP4 (4-битна подвижна запирка) драматично да ги намали барањата за меморија додека го зачува квалитетот на моделот. Распоредете гранична класа Вештачка интелигенција на пристапна инфраструктура на графичкиот процесор без сложеност на повеќе јазли.

💰

Намалени инфраструктурни трошоци

Квантизацијата на NVFP4 го намалува отпечатокот на меморијата за приближно 4 пати во споредба со BF16, овозможувајќи распоредување на помалку графички процесори и драматично намалување на TCO за интелигенција на претпријатието.

Распоредување со еден јазол

Распоредете го целосниот модел на параметри 675B на еден јазол од H100s или A100s. Нема сложена оркестрација со повеќе јазли, намалени трошоци за вмрежување, поедноставени операции.

Зачуван квалитет на моделот

Напредните техники на квантизација ги одржуваат перформансите на моделот низ задачите за расудување, следење инструкции и мултимодални задачи со минимална деградација на квалитетот.

Клод Опус 4.5 Дестилација на знаење

Shannon Lite 1.6 е прецизно пост-трениран користејќи 2.500 внимателно курирани излези одКлод Опус 4.5, најспособниот модел на Антропик. Овој пристап на дестилација на знаење доловува напредни обрасци на расудување, нијансирано толкување на инструкциите и супериорен квалитет на одговорот.

Фондација Mistral Large 3 Instruct 2512

Изграден на најсовремениот модел Instruct на Mistral (верзија 2512) со прецизност BF16. Оваа основа обезбедува способности на гранично ниво дизајнирани за асистенти од производствен степен, зголемени системи за пронаоѓање, научни оптоварувања и сложени работни процеси на претпријатието.

BF16 база Instruct Tuned Подготвено за производство Лиценца Apache 2.0

Излезна дестилација Claude Opus 4.5

Посттренирано на 2.500 висококвалитетни излези од Claude Opus 4.5, доловувајќи ги најнапредните на Anthropic способности за расудување. Курираната база на податоци се фокусира на сложено следење на упатствата, нијансирано разбирање, и генерирање одговор со висок квалитет низ различни домени.

2.500 примероци Курирана група на податоци Фокус на квалитет Разновидни домени

Процес на квантизација на NVFP4

Напредната NVIDIA FP4 квантизација применета после тренинг за да се намали отпечатокот од меморијата додека се одржува квалитет на моделот. Специфично калибриран за тежини по вежбање за да се зачува Claude Opus 4.5 пренос на знаење и способности за следење инструкции.

NVFP4 4-битна прецизност Калибриран Зачуван квалитет

Евалуација и валидација

Сеопфатна евалуација низ одредниците за следење инструкции, задачи за расудување и реалниот свет сценарија на претпријатието. Потврдено за постојано однесување меѓу домени, стабилни излези и доверливи перформанси во производни средини.

Бенчмаркирани Крос-домен Производство Потврдено Стабилни излези

Флексибилни опции за распоредување на графичкиот процесор

Shannon Lite 1.6 со квантизација NVFP4 овозможува исплатливо распоредување на индустриски стандард Конфигурации на графичкиот процесор на NVIDIA, што ја прави граничната вештачка интелигенција достапна за распоредувања на претпријатија без кои бараат скапи кластери со повеќе јазли.

NVIDIA H100 SXM

Оптимални перформанси со Hopper архитектура и HBM3 меморија

Еден јазол (8x H100)
NVFP4 Прецизност
80 GB HBM3 по графички процесор
Максимална пропусната моќ

NVIDIA A100 SXM

Докажана сигурност на графичките процесори со архитектура Ampere

Еден јазол (8x A100)
NVFP4 Прецизност
80 GB HBM2e по графички процесор
Ефикасно

Шенон Облак

Целосно управувано распоредување со нулта инфраструктура

Инстант пристап
Автоматско скалирање
Подготвен REST API
99,9% SLA

Карактеристики на вештачка интелигенција подготвена за претпријатија

Shannon Lite 1.6 обезбедува гранични способности наследени од Mistral Large 3 и подобрени преку Claude Opus 4.5 пост-тренинг, оптимизиран за производствени оптоварувања низ различни сценарија на претпријатија.

Мултимодална визија

Интегрираниот енкодер за визија со параметри 2,5B овозможува анализа на слики, визуелно одговарање на прашања и разбирање документи со слики.

Повеќејазична извонредност

Мајчин поддршка за 12+ јазици, вклучувајќи англиски, француски, шпански, германски, италијански, португалски, холандски, кинески, јапонски, корејски и арапски.

🤖

Агентски способности

Најдобрите агентски карактеристики во класата со оригинално повикување функции и структуриран JSON излез за автономна употреба на алатки и автоматизација на работниот тек.

Системско брзо придржување

Силно придржување и поддршка за системските барања, овозможувајќи прецизна контрола на однесувањето и доследно одржување на личноста.

256K Долг контекст

Проширен контекстен прозорец за сеопфатно разбирање на документите, проширени разговори и зголемена генерација на пронаоѓање (RAG).

🔧

Повикување на мајчин функција

Вградена функционална поддршка за повикување со сигурен JSON излез за беспрекорна интеграција со надворешни алатки, API и услуги.

Оптимизиран за производствени оптоварувања

Со моќни перформанси со долг контекст, стабилно и доследно однесување меѓу домени, Shannon Lite 1.6 се истакнува во различни сценарија на претпријатија и истражувања.

📄

Разбирање на долги документи

Обработете и анализирајте обемни документи, договори, извештаи и истражувачки трудови со контекстниот прозорец 256K

🤖

Асистенти со вештачка интелигенција за производство

Напојувајте ги дневните асистенти со вештачка интелигенција на возачот со сигурни, постојани одговори и силно следење на упатствата

🔧

Агентски работни текови

Употреба и функција на најсовремена алатка која повикува на автономно извршување на задачи и автоматизација на работниот тек

🏢

Работа со знаење на претпријатијата

Комплексни работни текови на претпријатијата кои бараат гранични способности за вештачка интелигенција со конзистентни, сигурни резултати

💻

Генерален асистент за кодирање

Генерирање код, дебагирање, документација и помош за развој на софтвер на повеќе јазици

Научно истражување

Помош за истражување, преглед на литература, обработка на научен обем на работа и генерирање хипотези

Пронаоѓање-зголемена генерација

Оптимални перформанси за RAG системи со сигурна интеграција на контекстот и точна синтеза на пронаоѓање

🌍

Повеќејазични апликации

Глобални апликации за претпријатија кои бараат постојан квалитет на над 12 поддржани јазици

Шенон Лајт против Шенон Про

Изберете го вистинскиот модел на Шенон за вашите потреби. Shannon Lite нуди рентабилно распоредување на претпријатијата, додека Shannon Pro обезбедува максимална способност со напредно расудување со синџир на мисли и поддршка за вештини.

Карактеристика Шенон Лајт 1.6 Шенон Про 1.6
Основен модел Mistral Large 3 (675B) Mistral Large 3 (675B)
Активни параметри 41B (Грануларен МЕ) 41B (Грануларен МЕ)
Прецизност NVFP4 (4-битна) Целосна BF16 (16-битна)
Податоци за пост-тренинг 2.500 Claude Opus 4.5 излези KIMI K2 Thinking Traces
Пост-тренинг метод Надгледувано фино подесување GRPO (Групна релативна политика за оптимизација)
Режим на расудување Стандарден Траги од синџир на мисли
Поддршка за вештини - Само проМајчин вештини
Распоредување H100/A100 (Еден јазол) B200/H200 (FP8)
Најдобро за Ефикасна вештачка интелигенција на претпријатието Максимална способност + расудување

Ви треба напредно расудување и вештини?

Shannon Pro 1.6 располага со KIMI K2 Thinking Traces со GRPO обука за транспарентно расудување со синџир на мисли, плус поддршка за мајчин вештини за прилагодени работни текови на вештачка интелигенција.

Истражете го Шенон Про

Искусете го Шенон Лајт 1.6

Способности за гранична вештачка интелигенција со исплатлива квантизација на NVFP4. Распоредете на инфраструктурата H100 или A100 за перформанси на ниво на претпријатие по пристапна цена.

Сите истражувачки врски