Бид хэрэглэгчийн өгөгдлийг хадгалж, түүнд нэвтэрдэггүй бөгөөд law enforcement хүчлэхгүй бол бүртгэлүүдийг suspend хийдэггүй.
NVFP4 Квантчилсан - Зардал багатай аж ахуйн нэгжийн хиймэл оюун ухаан

ShannonХөнгөн 1.6

Зардал багатай аж ахуйн нэгжийн хиймэл оюун ухаан нь дараахаар ажилладагMistral Large 3болон675B нийт параметрба41B идэвхтэй параметрнарийн ширхэгтэй Мэргэжилтнүүдийн Холимог архитектурын тусламжтайгаар. Дараах сургалтыг хийсэн2,500 Claude Opus 4.5 гаралтуудонцгой зааварчилгааг дагаж мөрдөх чадвартай.NVFP4 квантчилалнэг зангилааны байршуулалтыг боломж олгодогH100s эсвэл A100s.

675B
Нийт параметр
41B
Идэвхтэй параметр
NVFP4
Квантчилал
256K
Контекст
2.5B
Харааны кодлогч
Хөнгөн хувилбар
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Техникийн үзүүлэлтүүд:
Суурь загвар Mistral Large 3
Архитектур Нарийн ширхэгтэй MoE
Нийт параметр 675B
Идэвхтэй параметр 41B
Квантчилал NVFP4
Дараах сургалт Claude Opus 4.5
Сургалтын дээж 2,500

Mistral Large 3: Нарийн ширхэгтэй Мэргэжилтнүүдийн Холимог

Shannon Lite 1.6 нь Mistral Large 3 дээр бүтээгдсэн бөгөөд энэ нь найдвартай байдал, урт контекстийн ойлголт, үйлдвэрлэлийн түвшний гүйцэтгэлд зориулагдан анхнаасаа бүтээгдсэн орчин үеийн олон модаль, нарийн ширхэгтэй Мэргэжилтнүүдийн Холимог загвар юм. Зааварчилгаагаар дараах сургалт хийгдсэн хувилбар нь чат, агент болон зааварчилгаанд суурилсан хэрэглээнд зориулагдан нарийн тааруулагдсан.

673B

Хэлний загвар

Нэг урагш дамжуулалтад 39B идэвхтэй параметр бүхий нарийн ширхэгтэй MoE архитектур

2.5B

Харааны кодлогч

Зургийн шинжилгээ болон харааны ойлголтод зориулагдсан нэгдсэн олон модаль кодлогч

256K

Контекст цонх

Баримт бичгийг иж бүрэн ойлгох болон RAG-д зориулагдсан өргөтгөсөн контекст

12+

Хэлнүүд

Англи, Франц, Испани, Герман, Хятад, Япон, Солонгос, Араб болон бусад

Зардал багатай аж ахуйн нэгжийн байршуулалт

Shannon Lite 1.6 нь NVIDIA-ийн NVFP4 (4-битийн хөвөгч цэг) квантчилах технологийг ашигладаг бөгөөд энэ нь загварын чанарыг хадгалахын зэрэгцээ санах ойн шаардлагыг эрс багасгадаг. Олон зангилааны нарийн төвөгтэй байдалгүйгээр хил хязгаарын түвшний хиймэл оюун ухааныг хүртээмжтэй GPU дэд бүтцэд байршуулна уу.

💰

Дэд бүтцийн зардал буурсан

NVFP4 квантчилал нь BF16-тай харьцуулахад санах ойн хэрэглээг ойролцоогоор 4 дахин бууруулдаг бөгөөд ингэснээр цөөн GPU дээр байршуулах боломжийг олгож, аж ахуйн нэгжийн хиймэл оюун ухааны TCO-г эрс багасгадаг.

Нэг зангилааны байршуулалт

Бүрэн 675B параметрийн загварыг H100s эсвэл A100s-ийн нэг зангилаанд байршуулна уу. Нарийн төвөгтэй олон зангилааны зохицуулалтгүй, сүлжээний нэмэлт ачаалал бага, хялбаршуулсан үйл ажиллагаа.

Загварын чанар хадгалагдсан

Нарийвчилсан квантчилах аргууд нь сэтгэн бодох, зааварчилгааг дагаж мөрдөх болон олон модаль даалгавруудад загварын гүйцэтгэлийг чанарын доройтол хамгийн бага байхаар хадгалдаг.

Claude Opus 4.5 Мэдлэгийн Нэрэлт

Shannon Lite 1.6 нь 2,500 нарийн сонгогдсон гаралтуудыг ашиглан нарийн нягт нямбай дараах сургалтад хамрагдсанClaude Opus 4.5, Anthropic-ийн хамгийн чадварлаг загвар. Энэхүү мэдлэгийн нэрэлтийн арга нь нарийвчилсан сэтгэн бодох хэв маяг, нарийн зааварчилгааны тайлбар, болон илүү сайн хариу үйлдлийн чанарыг багтаадаг.

Mistral Large 3 Instruct 2512 Суурь

Mistral-ийн орчин үеийн Instruct загвар (хувилбар 2512) дээр BF16 нарийвчлалтайгаар бүтээгдсэн. Энэхүү суурь нь үйлдвэрлэлийн түвшний туслах, хайлтаар өргөтгөсөн систем, шинжлэх ухааны ажлын ачаалал, болон нарийн төвөгтэй аж ахуйн нэгжийн ажлын урсгалд зориулагдан бүтээгдсэн хил хязгаарын түвшний чадавхийг хангадаг.

BF16 Суурь Зааварчилгаагаар тааруулагдсан Үйлдвэрлэлд бэлэн Apache 2.0 Лиценз

Claude Opus 4.5 Гаралтын Нэрэлт

Claude Opus 4.5-ийн 2,500 өндөр чанартай гаралтууд дээр дараах сургалт хийгдсэн бөгөөд Anthropic-ийн хамгийн дэвшилтэт сэтгэн бодох чадварыг багтаасан. Сонгогдсон өгөгдлийн багц нь нарийн төвөгтэй зааварчилгааг дагаж мөрдөх, нарийн ойлголт, болон олон төрлийн домэйнд өндөр чанартай хариу үйлдэл үүсгэхэд чиглэгддэг.

2,500 Дээж Сонгогдсон өгөгдлийн багц Чанарын төвлөрөл Олон төрлийн домэйн

NVFP4 Квантчлалын Процесс

Сургалтын дараах NVIDIA FP4-ийн дэвшилтэт квантчлалыг хэрэглэж, загварын чанарыг хадгалахын зэрэгцээ санах ойн хэрэглээг багасгана. Claude Opus 4.5-ын мэдлэг дамжуулах болон зааварчилгааг дагах чадварыг хадгалахын тулд сургалтын дараах жингүүдэд тусгайлан тохируулсан.

NVFP4 4-битийн Нарийвчлал Тохируулсан Чанар Хадгалагдсан

Үнэлгээ ба Баталгаажуулалт

Зааварчилгааг дагах шалгуур үзүүлэлтүүд, сэтгэн бодох даалгавар, бодит бизнесийн нөхцөл байдлуудад иж бүрэн үнэлгээ хийсэн. Домэйн хоорондын тогтвортой үйлдэл, тогтвортой үр дүн, үйлдвэрлэлийн орчинд найдвартай гүйцэтгэлийг баталгаажуулсан.

Шалгуур Үзүүлэлттэй Домэйн Хоорондын Үйлдвэрлэлд Баталгаажсан Тогтвортой Үр Дүн

Уян Хатан GPU Байршуулалтын Сонголтууд

NVFP4 квантчлалтай Shannon Lite 1.6 нь салбарын стандартын NVIDIA GPU тохиргоонд хэмнэлттэй байршуулах боломжийг олгож, үнэтэй олон зангилаат кластер шаардахгүйгээр бизнесийн байршуулалтад хил хязгаарын AI-г хүртээмжтэй болгоно.

NVIDIA H100 SXM

Hopper архитектур болон HBM3 санах ойтойгоор хамгийн оновчтой гүйцэтгэл

Нэг Залгуур (8x H100)
NVFP4 Нарийвчлал
GPU тутамд 80GB HBM3
Хамгийн Их Нэвтрүүлэлт

NVIDIA A100 SXM

Ampere архитектурын GPU-ууд дээр батлагдсан найдвартай байдал

Нэг Залгуур (8x A100)
NVFP4 Нарийвчлал
GPU тутамд 80GB HBM2e
Зардал Хэмнэлттэй

Shannon Cloud

Дэд бүтэцгүйгээр бүрэн удирдлагатай байршуулалт

Шуурхай Нэвтрэх
Автомат Өргөтгөл
REST API Бэлэн
99.9% SLA

Бизнест Бэлэн AI Функцууд

Shannon Lite 1.6 нь Mistral Large 3-аас өвлөж авсан, Claude Opus 4.5-ын сургалтын дараа сайжруулсан хил хязгаарын чадваруудыг хүргэж, бизнесийн олон янзын нөхцөл байдалд үйлдвэрлэлийн ажлын ачааллыг оновчтой болгосон.

Олон Загварын Хараа

Нэгдсэн 2.5 тэрбум параметрийн харааны кодлогч нь зураг боловсруулах, харааны асуултад хариулах, зурагтай баримт бичгийг ойлгох боломжийг олгодог.

Олон Хэлний Төгс Чадвар

Англи, Франц, Испани, Герман, Итали, Португал, Голланд, Хятад, Япон, Солонгос, Араб зэрэг 12+ хэлийг уугуул байдлаар дэмждэг.

🤖

Агентын Чадварууд

Уугуул функц дуудах болон автомат хэрэгсэл ашиглах, ажлын урсгалыг автоматжуулах зорилгоор бүтэцлэгдсэн JSON гаралтын хамт шилдэг агентын функцууд.

Системийн Зааврыг Дагах

Системийн зааврыг хүчтэй дагаж мөрдөх, дэмжих нь зан үйлийн нарийн хяналт, тогтвортой хувийн шинж чанарыг хадгалах боломжийг олгодог.

256K Урт Контекст

Баримт бичгийг иж бүрэн ойлгох, урт хугацааны яриа хэлэлцээ, мэдээлэл сэргээх-нэмэгдүүлсэн үүсгүүр (RAG) зэрэгт зориулсан өргөтгөсөн контекст цонх.

🔧

Уугуул Функц Дуудах

Гадаад хэрэгсэл, API, үйлчилгээтэй тасралтгүй нэгтгэх зорилгоор найдвартай JSON гаралтын хамт суурилуулсан функц дуудах дэмжлэг.

Үйлдвэрлэлийн Ажлын Ачаалалд Оновчтой

Хүчирхэг урт контекстийн гүйцэтгэл, тогтвортой, тууштай домэйн хоорондын зан үйлээрээ, Shannon Lite 1.6 нь бизнесийн болон судалгааны олон янзын нөхцөл байдалд онцгой сайн ажилладаг.

📄

Урт Баримт Бичгийг Ойлгох

256K контекст цонхоор өргөн хүрээний баримт бичиг, гэрээ, тайлан, судалгааны ажлыг боловсруулж, шинжилнэ.

🤖

Үйлдвэрлэлийн AI Туслахууд

Найдвартай, тогтвортой хариулт, зааварчилгааг хүчтэй дагаж мөрддөг өдөр тутмын AI туслахуудыг ажиллуулна.

🔧

Агентын Ажлын Урсгалууд

Автомат даалгавар гүйцэтгэх болон ажлын урсгалыг автоматжуулах зорилгоор орчин үеийн хэрэгсэл ашиглах, функц дуудах.

🏢

Бизнесийн Мэдлэгийн Ажил

Тогтвортой, найдвартай үр дүнтэй хил хязгаарын AI чадварыг шаарддаг нарийн төвөгтэй бизнесийн ажлын урсгалууд.

💻

Ерөнхий Код Бичих Туслах

Олон хэлээр код үүсгэх, алдааг олж засварлах, баримтжуулах, програм хангамж хөгжүүлэхэд туслах.

Шинжлэх Ухааны Судалгаа

Судалгааны тусламж, ном зүйн тойм, шинжлэх ухааны ажлын ачааллыг боловсруулах, таамаглал үүсгэх.

Мэдээлэл Сэргээх-Нэмэгдүүлсэн Үүсгүүр

Найдвартай контекст нэгтгэл, үнэн зөв мэдээлэл сэргээх синтезтэй RAG системүүдийн хувьд хамгийн оновчтой гүйцэтгэл.

🌍

Олон Хэлний Аппликейшнүүд

Дэмжигдсэн 12+ хэлээр тогтвортой чанарыг шаарддаг дэлхийн бизнесийн аппликейшнүүд.

Shannon Lite ба Shannon Pro

Таны хэрэгцээнд тохирсон Shannon загварыг сонгоно уу. Shannon Lite нь хэмнэлттэй бизнесийн байршуулалтыг санал болгодог бол, Shannon Pro нь дэвшилтэт сэтгэлгээний гинжин хэлхээний үндэслэл болон Ур чадварын дэмжлэгтэйгээр хамгийн их чадварыг хангана.

Онцлог Shannon Lite 1.6 Shannon Pro 1.6
Үндсэн Загвар Mistral Large 3 (675B) Mistral Large 3 (675B)
Идэвхтэй Параметрүүд 41B (Нарийвчилсан MoE) 41B (Нарийвчилсан MoE)
Нарийвчлал NVFP4 (4-бит) Бүрэн BF16 (16-бит)
Сургалтын дараах өгөгдөл 2,500 Claude Opus 4.5 гаралтууд KIMI K2 Сэтгэх мөрүүд
Сургалтын дараах арга Хяналттай нарийн тааруулалт GRPO (Бүлгийн харьцангуй бодлогын оновчлол)
Сэтгэх горим Стандарт Сэтгэлгээний гинжин хэлхээний мөрүүд
Ур чадварын дэмжлэг - Зөвхөн ProУугуул ур чадварууд
Байршуулалт H100/A100 (Нэг зангилаа) B200/H200 (FP8)
Хамгийн тохиромжтой Зардал багатай аж ахуйн нэгжийн хиймэл оюун ухаан Хамгийн их чадвар + Сэтгэх чадвар

Нарийвчилсан сэтгэх чадвар болон ур чадвар хэрэгтэй юу?

Shannon Pro 1.6 нь ил тод сэтгэлгээний гинжин хэлхээний үндэслэлийг хангахын тулд GRPO сургалттай KIMI K2 Сэтгэх мөрүүдийг, мөн захиалгат хиймэл оюун ухааны ажлын урсгалд зориулсан уугуул ур чадварын дэмжлэгийг агуулдаг.

Shannon Pro-г судлах

Shannon Lite 1.6-г турших

Хил хязгаарын хиймэл оюун ухааны чадавхыг зардал багатай NVFP4 квантчилалтай хослуулсан. Аж ахуйн нэгжийн түвшний гүйцэтгэлийг боломжийн үнээр хангахын тулд H100 эсвэл A100 дэд бүтцэд байршуулна уу.

Бүх research links