Биз эч бир колдонуучунун маалыматтарын сактабайбыз же аларга жетпейбиз, ошондой эле law enforcement чара көрүүгө мажбур кылмайынча каттоо эсептерин токтотпойбуз.
NVFP4 Квантталган - Чыгымды үнөмдүү Ишкана AI

ShannonЛайт 1.6

Чыгымды үнөмдүү ишкана AIMistral Large 3менен675B жалпы параметрлержана41B активдүү параметрлергранулдуу Эксперттердин аралашмасы архитектурасы аркылуу. Кийин окутулган2,500 Claude Opus 4.5 чыгарууларыөзгөчө нускамаларды аткаруу үчүн.NVFP4 кванттообир түйүндүү жайылтууга мүмкүнчүлүк беретH100s же A100s.

675B
Жалпы параметрлер
41B
Активдүү параметрлер
NVFP4
Кванттоо
256K
Контекст
2.5B
Көрүү энкодери
Лайт версиясы
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Техникалык мүнөздөмөлөр:
Базалык модель Mistral Large 3
Архитектура Гранулдуу MoE
Жалпы параметрлер 675B
Активдүү параметрлер 41B
Кванттоо NVFP4
Пост-тренинг Claude Opus 4.5
Окутуу үлгүлөрү 2,500

Mistral Large 3: Гранулдуу Эксперттердин аралашмасы

Shannon Lite 1.6 заманбап мультимодалдык гранулдуу Эксперттердин аралашмасы модели болгон Mistral Large 3'кө негизделген, ал ишенимдүүлүк, узун контекстти түшүнүү жана өндүрүштүк деңгээлдеги аткаруу үчүн башынан эле иштелип чыккан. Нускама боюнча кийин окутулган версиясы чат, агенттик жана нускамага негизделген колдонуу учурлары үчүн так жөнгө салынган.

673B

Тил модели

Гранулдуу MoE архитектурасы, ар бир алдыга өтүү үчүн 39B активдүү параметрлер менен

2.5B

Көрүү энкодери

Сүрөттү талдоо жана визуалдык түшүнүү үчүн интеграцияланган мультимодалдык энкодер

256K

Контекст терезеси

Документтерди ар тараптуу түшүнүү жана RAG үчүн кеңейтилген контекст

12+

Тилдер

Англисче, Французча, Испанча, Немисче, Кытайча, Жапончо, Корейче, Арабча жана башкалар

Чыгымды үнөмдүү Ишкананы жайылтуу

Shannon Lite 1.6 NVIDIA'нын NVFP4 (4-биттик калкыма чекит) кванттоо технологиясын колдонуп, модель сапатын сактап калуу менен эс тутум талаптарын кескин кыскартат. Чек ара классындагы AI'ды жеткиликтүү GPU инфраструктурасында көп түйүндүү татаалдыксыз жайылтыңыз.

💰

Кыскартылган Инфраструктуралык чыгым

NVFP4 кванттоо BF16'га салыштырмалуу эс тутум изин болжол менен 4 эсеге кыскартат, бул аз GPU'ларда жайылтууга мүмкүндүк берет жана ишкана AI үчүн TCO'ну кескин төмөндөтөт.

Бир түйүндүү жайылтуу

Толук 675B параметр моделин H100s же A100s бир түйүнүндө жайылтыңыз. Татаал көп түйүндүү оркестрация жок, тармактын ашыкча чыгымдары кыскартылган, операциялар жөнөкөйлөтүлгөн.

Сакталган Модель сапаты

Өркүндөтүлгөн кванттоо ыкмалары ой жүгүртүү, нускамаларды аткаруу жана мультимодалдык тапшырмалар боюнча модельдин иштешин сапаттын минималдуу начарлашы менен сактайт.

Claude Opus 4.5 Билимди дистилляциялоо

Shannon Lite 1.6 кылдат тандалган 2,500 чыгарууларды колдонуу менен кылдаттык менен кийин окутулганClaude Opus 4.5, Anthropic'тин эң жөндөмдүү модели. Бул билимди дистилляциялоо ыкмасы өнүккөн ой жүгүртүү үлгүлөрүн, нюанстуу нускаманы чечмелөөнү жана жогорку жооп сапатын камтыйт.

Mistral Large 3 Instruct 2512 Негизи

Mistral'дын заманбап Instruct моделине (2512 версиясы) BF16 тактыгында негизделген. Бул негиз өндүрүштүк деңгээлдеги жардамчылар, алуу-күчөтүлгөн системалар, илимий иш жүктөмдөрү жана татаал ишкана иш процесстери үчүн иштелип чыккан чек ара деңгээлиндеги мүмкүнчүлүктөрдү камсыз кылат.

BF16 Базасы Нускама боюнча жөнгө салынган Өндүрүшкө даяр Apache 2.0 License

Claude Opus 4.5 Чыгарууну дистилляциялоо

Claude Opus 4.5'тин 2,500 жогорку сапаттагы чыгарууларында кийин окутулган, Anthropic'тин эң өнүккөн ой жүгүртүү мүмкүнчүлүктөрүн камтыган. Тандалган маалымат топтому татаал нускамаларды аткарууга, нюанстуу түшүнүүгө жана ар түрдүү домендерде жогорку сапаттагы жоопторду генерациялоого багытталган.

2,500 Үлгүлөр Тандалган маалымат топтому Сапатка басым Ар түрдүү домендер

NVFP4 Кванттоо процесси

Өркүндөтүлгөн NVIDIA FP4 кванттоосу моделдин сапатын сактоо менен эс тутумдун изин азайтуу үчүн окутуудан кийин колдонулат. Claude Opus 4.5 билимди өткөрүп берүү жана нускамаларды аткаруу мүмкүнчүлүктөрүн сактоо үчүн окутулган салмактарга атайын калибрленген.

NVFP4 4-биттик тактык Калибрленген Сапаты сакталган

Баалоо жана Валидация

Нускамаларды аткаруу көрсөткүчтөрү, ой жүгүртүү тапшырмалары жана реалдуу дүйнөдөгү ишкана сценарийлери боюнча комплекстүү баалоо. Туруктуу домендер аралык жүрүм-турум, туруктуу натыйжалар жана өндүрүш чөйрөлөрүндө ишенимдүү иштөө үчүн текшерилген.

Бенчмаркталган Домендер аралык Өндүрүштө текшерилген Туруктуу натыйжалар

Ийкемдүү GPU жайгаштыруу параметрлери

NVFP4 кванттоосу менен Shannon Lite 1.6 өнөр жай стандартындагы NVIDIA GPU конфигурацияларында үнөмдүү жайгаштырууга мүмкүндүк берет, бул кымбат көп түйүндүү кластерлерди талап кылбастан, ишканаларды жайгаштыруу үчүн алдыңкы AI жеткиликтүү кылат.

NVIDIA H100 SXM

Hopper архитектурасы жана HBM3 эс тутуму менен оптималдуу иштөө

Бир түйүн (8x H100)
NVFP4 тактыгы
Ар бир GPU үчүн 80GB HBM3
Максималдуу өткөрүү жөндөмдүүлүгү

NVIDIA A100 SXM

Ampere архитектурасынын GPU'ларында далилденген ишенимдүүлүк

Бир түйүн (8x A100)
NVFP4 тактыгы
Ар бир GPU үчүн 80GB HBM2e
Үнөмдүү

Shannon Cloud

Инфраструктурасыз толук башкарылган жайгаштыруу

Ыкчам жетүү
Автоматтык масштабдоо
REST API даяр
99.9% SLA

Ишкана үчүн даяр AI функциялары

Shannon Lite 1.6 Mistral Large 3тен мураска калган жана Claude Opus 4.5 окутуудан кийин өркүндөтүлгөн алдыңкы мүмкүнчүлүктөрдү берет, ар түрдүү ишкана сценарийлеринде өндүрүш жүктөмдөрү үчүн оптималдаштырылган.

Көп модалдуу көрүү

Интеграцияланган 2.5B параметрлүү көрүү коддогучу сүрөттөрдү талдоого, визуалдык суроолорго жооп берүүгө жана сүрөттөр менен документтерди түшүнүүгө мүмкүндүк берет.

Көп тилдүү мыктылык

Англис, француз, испан, немис, италия, португал, голланд, кытай, жапон, корей жана араб тилдерин кошкондо 12+ тил үчүн жергиликтүү колдоо.

🤖

Агенттик мүмкүнчүлүктөр

Автономдуу куралдарды колдонуу жана иш процессин автоматташтыруу үчүн жергиликтүү функцияны чакыруу жана структураланган JSON чыгаруусу менен мыкты агенттик функциялар.

Системалык сунушка ылайыктуулук

Системалык сунуштарга күчтүү ылайыктуулук жана колдоо, так жүрүм-турумду көзөмөлдөөнү жана ырааттуу персонализацияны камсыз кылат.

256K Узун контекст

Документтерди комплекстүү түшүнүү, кеңейтилген сүйлөшүүлөр жана издөө-күчөтүлгөн генерация (RAG) үчүн кеңейтилген контекст терезеси.

🔧

Жергиликтүү функцияны чакыруу

Тышкы куралдар, API'лер жана кызматтар менен үзгүлтүксүз интеграциялоо үчүн ишенимдүү JSON чыгаруусу менен орнотулган функцияны чакыруу колдоосу.

Өндүрүш жүктөмдөрү үчүн оптималдаштырылган

Күчтүү узун контексттик аткаруу, туруктуу жана ырааттуу домендер аралык жүрүм-турум менен Shannon Lite 1.6 ар түрдүү ишкана жана изилдөө сценарийлеринде мыкты.

📄

Узун документти түшүнүү

256K контекст терезеси менен кеңири документтерди, келишимдерди, отчетторду жана илимий эмгектерди иштетүү жана талдоо

🤖

Өндүрүштүк AI жардамчылары

Ишенимдүү, ырааттуу жооптор жана күчтүү нускамаларды аткаруу менен күнүмдүк AI жардамчыларын иштетүү

🔧

Агенттик иш процесстери

Автономдуу тапшырманы аткаруу жана иш процессин автоматташтыруу үчүн заманбап куралдарды колдонуу жана функцияны чакыруу

🏢

Ишкананын билим иши

Ырааттуу, ишенимдүү натыйжалар менен алдыңкы AI мүмкүнчүлүктөрүн талап кылган татаал ишкана иш процесстери

💻

Жалпы коддоо жардамчысы

Көп тилдерде код генерациялоо, мүчүлүштүктөрдү оңдоо, документтештирүү жана программалык камсыздоону иштеп чыгууга жардам берүү

Илимий изилдөө

Изилдөөгө жардам берүү, адабияттарды карап чыгуу, илимий жүктөмдөрдү иштетүү жана гипотезаларды түзүү

Издөө-күчөтүлгөн генерация

Ишенимдүү контексттик интеграция жана так издөө синтези менен RAG системалары үчүн оптималдуу иштөө

🌍

Көп тилдүү тиркемелер

12+ колдоого алынган тилдерде ырааттуу сапатты талап кылган глобалдык ишкана тиркемелери

Shannon Lite vs Shannon Pro

Сиздин муктаждыктарыңыз үчүн туура Shannon моделин тандаңыз. Shannon Lite үнөмдүү ишкананы жайгаштырууну сунуштайт, ал эми Shannon Pro өркүндөтүлгөн ой жүгүртүү чынжырчасы жана Skills колдоосу менен максималдуу мүмкүнчүлүктөрдү берет.

Функция Shannon Lite 1.6 Shannon Pro 1.6
Негизги модель Mistral Large 3 (675B) Mistral Large 3 (675B)
Активдүү параметрлер 41B (Гранулдуу MoE) 41B (Гранулдуу MoE)
Тактык NVFP4 (4-бит) Толук BF16 (16-бит)
Окутуудан кийинки маалыматтар 2,500 Claude Opus 4.5 чыгаруулары KIMI K2 Ой жүгүртүү издери
Окутуудан кийинки ыкма Көзөмөлдөнгөн так жөндөө GRPO (Топтун салыштырмалуу саясатын оптималдаштыруу)
Ой жүгүртүү режими Стандарттуу Ой чынжырынын издери
Көндүмдөрдү колдоо - Pro ганаТүпкү көндүмдөр
Жайгаштыруу H100/A100 (Бир түйүн) B200/H200 (FP8)
Эң жакшы Чыгымдарды үнөмдүү ишкана AI Максималдуу мүмкүнчүлүк + Ой жүгүртүү

Өркүндөтүлгөн ой жүгүртүү жана көндүмдөр керекпи?

Shannon Pro 1.6 моделинде KIMI K2 Ой жүгүртүү издери жана GRPO окутуусу бар, бул ой чынжырынын ачык-айкын жүйөлөрүн камсыз кылат, ошондой эле ыңгайлаштырылган AI иш процесстери үчүн түпкү көндүмдөрдү колдойт.

Shannon Pro'ну изилдөө

Shannon Lite 1.6'ны колдонуп көрүңүз

Чыгымдарды үнөмдүү NVFP4 кванттоосу менен алдыңкы AI мүмкүнчүлүктөрү. Ишкана деңгээлиндеги өндүрүмдүүлүк үчүн H100 же A100 инфраструктурасына жеткиликтүү баада жайгаштырыңыз.

Бардык research links