Біз ешбір пайдаланушының деректерін сақтамаймыз және оларға қол жеткізбейміз, сондай-ақ заңды орган мәжбүрлеу әрекетін талап етпесе, аккаунттарды тоқтатпаймыз.
NVFP4 Квантталған - Тиімді кәсіпорын ЖИ

ShannonЛайт 1.6

Тиімді кәсіпорын ЖИ, жұмыс істейдіMistral Large 3бар675B жалпы параметрлержәне41B белсенді параметрлертүйіршікті сарапшылар қоспасы архитектурасы арқылы. Оқудан кейін оқытылған2,500 Claude Opus 4.5 шығыстарынұсқауларды ерекше орындау үшін.NVFP4 кванттаубір түйінді орналастыруға мүмкіндік бередіH100s немесе A100s.

675B
Жалпы параметрлер
41B
Белсенді параметрлер
NVFP4
Кванттау
256K
Контекст
2.5B
Көру энкодері
Лайт нұсқасы
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Техникалық сипаттамалар:
Негізгі модель Mistral Large 3
Архитектура Түйіршікті MoE
Жалпы параметрлер 675B
Белсенді параметрлер 41B
Кванттау NVFP4
Оқудан кейінгі Claude Opus 4.5
Оқыту үлгілері 2,500

Mistral Large 3: Түйіршікті сарапшылар қоспасы

Shannon Lite 1.6 Mistral Large 3-ке негізделген, ол сенімділік, ұзақ контексті түсіну және өндірістік деңгейдегі өнімділік үшін нөлден бастап жасалған заманауи мультимодальды түйіршікті сарапшылар қоспасы моделі. Нұсқаулық бойынша оқудан кейін оқытылған нұсқасы чат, агенттік және нұсқаулыққа негізделген қолдану жағдайлары үшін дәл бапталған.

673B

Тіл моделі

Түйіршікті MoE архитектурасы, бір алға бағытталған өтуге 39B белсенді параметрлермен

2.5B

Көру энкодері

Кескінді талдау және визуалды түсіну үшін біріктірілген мультимодальды энкодер

256K

Контекст терезесі

Құжаттарды кешенді түсіну және RAG үшін кеңейтілген контекст

12+

Тілдер

Ағылшын, Француз, Испан, Неміс, Қытай, Жапон, Корей, Араб және басқалар

Тиімді кәсіпорынды орналастыру

Shannon Lite 1.6 NVIDIA-ның NVFP4 (4-биттік жылжымалы нүкте) кванттау технологиясын модель сапасын сақтай отырып, жад талаптарын айтарлықтай азайту үшін пайдаланады. Көп түйінді күрделіліксіз қолжетімді GPU инфрақұрылымында шекаралық деңгейдегі ЖИ-ді орналастырыңыз.

💰

Инфрақұрылым шығындарын азайту

NVFP4 кванттау BF16-мен салыстырғанда жад ізін шамамен 4 есе азайтады, аз GPU-да орналастыруға мүмкіндік береді және кәсіпорын ЖИ үшін TCO-ны айтарлықтай төмендетеді.

Бір түйінді орналастыру

Толық 675B параметрлі модельді H100 немесе A100 бір түйініне орналастырыңыз. Күрделі көп түйінді оркестрация жоқ, желілік жүктеме азайтылған, операциялар жеңілдетілген.

Модель сапасы сақталған

Жетілдірілген кванттау әдістері ойлау, нұсқауларды орындау және мультимодальды тапсырмалар бойынша модель өнімділігін сапаның ең аз нашарлауымен сақтайды.

Claude Opus 4.5 Білімді дистилляциялау

Shannon Lite 1.6 2,500 мұқият іріктелген шығыстары арқылы мұқият оқудан кейін оқытылғанClaude Opus 4.5, Anthropic-тің ең қабілетті моделі. Бұл білімді дистилляциялау тәсілі жетілдірілген ойлау үлгілерін, нұсқауларды нәзік түсіндіруді және жоғары жауап сапасын қамтиды.

Mistral Large 3 Instruct 2512 Негізі

Mistral-дың заманауи Instruct моделіне (2512 нұсқасы) BF16 дәлдігінде негізделген. Бұл негіз өндірістік деңгейдегі көмекшілер, іздеуді кеңейтетін жүйелер, ғылыми жұмыс жүктемелері және күрделі кәсіпорын жұмыс процестері үшін жасалған шекаралық деңгейдегі мүмкіндіктерді ұсынады.

BF16 Негіз Нұсқаулыққа бапталған Өндіріске дайын Apache 2.0 License

Claude Opus 4.5 Шығысты дистилляциялау

Claude Opus 4.5-тен 2,500 жоғары сапалы шығыстарда оқудан кейін оқытылған, Anthropic-тің ең жетілдірілген ойлау қабілеттерін қамтиды. Іріктелген деректер жинағы күрделі нұсқауларды орындауға, нәзік түсінуге, және әртүрлі домендерде жоғары сапалы жауаптарды генерациялауға бағытталған.

2,500 Үлгілер Іріктелген деректер жинағы Сапаға бағытталу Әртүрлі домендер

NVFP4 Кванттау процесі

Оқытудан кейін жад көлемін азайту және модель сапасын сақтау үшін қолданылатын жетілдірілген NVIDIA FP4 кванттауы. Claude Opus 4.5 білім беру және нұсқауларды орындау мүмкіндіктерін сақтау үшін оқытылған салмақтарға арнайы калибрленген.

NVFP4 4-биттік дәлдік Калибрленген Сапасы сақталған

Бағалау және валидация

Нұсқауларды орындау эталондары, пайымдау тапсырмалары және нақты әлемдегі кәсіпорын сценарийлері бойынша кешенді бағалау. Тұрақты домендер аралық мінез-құлық, тұрақты шығыстар және өндірістік орталарда сенімді өнімділік үшін тексерілген.

Эталондық Домендер аралық Өндірісте тексерілген Тұрақты шығыстар

Икемді GPU орналастыру опциялары

NVFP4 кванттауы бар Shannon Lite 1.6 өнеркәсіптік стандартты NVIDIA GPU конфигурацияларында үнемді орналастыруға мүмкіндік береді, бұл қымбат көптүйінді кластерлерді қажет етпей, кәсіпорынды орналастыру үшін шекаралық AI-ді қолжетімді етеді.

NVIDIA H100 SXM

Hopper архитектурасы және HBM3 жадымен оңтайлы өнімділік

Бір түйін (8x H100)
NVFP4 дәлдігі
Әр GPU үшін 80GB HBM3
Максималды өткізу қабілеті

NVIDIA A100 SXM

Ampere архитектурасының GPU-ларында дәлелденген сенімділік

Бір түйін (8x A100)
NVFP4 дәлдігі
Әр GPU үшін 80GB HBM2e
Үнемді

Shannon Cloud

Нөлдік инфрақұрылыммен толық басқарылатын орналастыру

Жедел қолжетімділік
Автоматты масштабтау
REST API дайын
99.9% SLA

Кәсіпорынға дайын AI мүмкіндіктері

Shannon Lite 1.6 Mistral Large 3-тен мұраланған және Claude Opus 4.5 оқытудан кейін жетілдірілген шекаралық мүмкіндіктерді ұсынады, әртүрлі кәсіпорын сценарийлері бойынша өндірістік жұмыс жүктемелері үшін оңтайландырылған.

Мультимодальды көру

Біріктірілген 2.5B параметрлі көру кодтағышы кескіндерді талдауға, визуалды сұрақтарға жауап беруге және кескіндермен құжаттарды түсінуге мүмкіндік береді.

Көптілділік шеберлігі

Ағылшын, француз, испан, неміс, итальян, португал, голланд, қытай, жапон, корей және араб тілдерін қоса алғанда, 12+ тілге аналық қолдау.

🤖

Агенттік мүмкіндіктер

Автономды құралдарды пайдалану және жұмыс процесін автоматтандыру үшін аналық функцияны шақыру және құрылымдалған JSON шығысы бар үздік агенттік мүмкіндіктер.

Жүйелік нұсқауларға сәйкестік

Дәл мінез-құлықты басқаруды және тұрақты тұлғаны сақтауды қамтамасыз ететін жүйелік нұсқауларға қатаң сәйкестік және қолдау.

256K ұзын контекст

Құжаттарды кешенді түсіну, кеңейтілген әңгімелер және іздеуді кеңейтілген генерация (RAG) үшін кеңейтілген контекст терезесі.

🔧

Аналық функцияны шақыру

Сыртқы құралдармен, API-лермен және қызметтермен үздіксіз интеграциялау үшін сенімді JSON шығысы бар кірістірілген функцияны шақыруды қолдау.

Өндірістік жұмыс жүктемелері үшін оңтайландырылған

Қуатты ұзын контекст өнімділігімен, тұрақты және дәйекті домендер аралық мінез-құлықпен Shannon Lite 1.6 әртүрлі кәсіпорын және зерттеу сценарийлерінде ерекшеленеді.

📄

Ұзын құжаттарды түсіну

256K контекст терезесімен кең құжаттарды, келісімшарттарды, есептерді және зерттеу жұмыстарын өңдеу және талдау

🤖

Өндірістік AI көмекшілері

Сенімді, дәйекті жауаптармен және нұсқауларды қатаң орындаумен күнделікті AI көмекшілерін қуаттандыру

🔧

Агенттік жұмыс процестері

Автономды тапсырманы орындау және жұмыс процесін автоматтандыру үшін заманауи құралдарды пайдалану және функцияны шақыру

🏢

Кәсіпорынның білім жұмысы

Тұрақты, сенімді шығыстармен шекаралық AI мүмкіндіктерін қажет ететін күрделі кәсіпорын жұмыс процестері

💻

Жалпы кодтау көмекшісі

Көптеген тілдерде код генерациясы, жөндеу, құжаттама және бағдарламалық қамтамасыз етуді әзірлеуге көмек

Ғылыми зерттеулер

Зерттеуге көмек, әдебиеттерге шолу, ғылыми жұмыс жүктемесін өңдеу және гипотеза генерациясы

Іздеуді кеңейтілген генерация

Сенімді контекст интеграциясы және дәл іздеу синтезі бар RAG жүйелері үшін оңтайлы өнімділік

🌍

Көптілді қосымшалар

12+ қолдау көрсетілетін тілдерде тұрақты сапаны қажет ететін жаһандық кәсіпорын қосымшалары

Shannon Lite vs Shannon Pro

Қажеттіліктеріңізге сәйкес Shannon моделін таңдаңыз. Shannon Lite үнемді кәсіпорынды орналастыруды ұсынады, ал Shannon Pro жетілдірілген ойлау тізбегін пайымдау және дағдыларды қолдау арқылы максималды мүмкіндік береді.

Мүмкіндік Shannon Lite 1.6 Shannon Pro 1.6
Негізгі модель Mistral Large 3 (675B) Mistral Large 3 (675B)
Белсенді параметрлер 41B (Granular MoE) 41B (Granular MoE)
Дәлдік NVFP4 (4-бит) Толық BF16 (16-бит)
Оқудан кейінгі деректер 2,500 Claude Opus 4.5 шығыстары KIMI K2 Ойлау іздері
Оқудан кейінгі әдіс Бақыланатын дәл баптау GRPO (Топтық салыстырмалы саясатты оңтайландыру)
Пайымдау режимі Стандартты Ой тізбегінің іздері
Дағдыларды қолдау - Тек Pro үшінЖергілікті дағдылар
Орналастыру H100/A100 (Бір түйін) B200/H200 (FP8)
Үздік Тиімді кәсіпорын AI Максималды мүмкіндік + Пайымдау

Кеңейтілген пайымдау мен дағдылар қажет пе?

Shannon Pro 1.6 KIMI K2 Ойлау іздерімен және GRPO оқытуымен мөлдір ой тізбегін пайымдауды, сондай-ақ реттелетін AI жұмыс процестері үшін жергілікті дағдыларды қолдауды ұсынады.

Shannon Pro-ны зерттеңіз

Shannon Lite 1.6-ны қолданып көріңіз

Тиімді NVFP4 кванттауы бар шекаралық AI мүмкіндіктері. Қолжетімді бағамен кәсіпорын деңгейіндегі өнімділік үшін H100 немесе A100 инфрақұрылымына орналастырыңыз.

Барлық зерттеу сілтемелері