మేము ఏ వినియోగదారుడి డేటాను నిల్వ చేయము లేదా యాక్సెస్ చేయము. చట్టబద్ధ అధికారం అమలు చర్య కోరితే తప్ప ఖాతాలను సస్పెండ్ చేయము.
NVFP4 క్వాంటైజ్డ్ - ఖర్చు-సమర్థవంతమైన ఎంటర్‌ప్రైజ్ AI

Shannonలైట్ 1.6

ఖర్చు-సమర్థవంతమైన ఎంటర్‌ప్రైజ్ AI దీని ద్వారా శక్తిని పొందుతుందిMistral Large 3తో675B మొత్తం పారామీటర్లుమరియు41B క్రియాశీల పారామీటర్లుగ్రాన్యులర్ మిక్స్‌చర్-ఆఫ్-ఎక్స్‌పర్ట్స్ ఆర్కిటెక్చర్ ద్వారా. దీనిపై పోస్ట్-ట్రైన్ చేయబడింది2,500 Claude Opus 4.5 అవుట్‌పుట్‌లుఅసాధారణమైన సూచనలను పాటించడానికి.NVFP4 క్వాంటైజేషన్సింగిల్-నోడ్ డిప్లాయ్‌మెంట్‌ను దీనిపై అనుమతిస్తుందిH100s లేదా A100s.

675B
మొత్తం పారామీటర్లు
41B
క్రియాశీల పారామీటర్లు
NVFP4
క్వాంటైజేషన్
256K
సందర్భం
2.5B
విజన్ ఎన్‌కోడర్
లైట్ ఎడిషన్
Shannon Lite 1.6
v1.6.0-lite-nvfp4
సాంకేతిక లక్షణాలు:
బేస్ మోడల్ Mistral Large 3
ఆర్కిటెక్చర్ గ్రాన్యులర్ MoE
మొత్తం పారామీటర్లు 675B
క్రియాశీల పారామీటర్లు 41B
క్వాంటైజేషన్ NVFP4
పోస్ట్-ట్రైనింగ్ Claude Opus 4.5
ట్రైనింగ్ నమూనాలు 2,500

Mistral Large 3: గ్రాన్యులర్ మిక్స్‌చర్-ఆఫ్-ఎక్స్‌పర్ట్స్

Shannon Lite 1.6 Mistral Large 3పై నిర్మించబడింది, ఇది అత్యాధునిక మల్టీమోడల్ గ్రాన్యులర్ మిక్స్‌చర్-ఆఫ్-ఎక్స్‌పర్ట్స్ మోడల్ విశ్వసనీయత, దీర్ఘ-సందర్భ అవగాహన మరియు ఉత్పత్తి-స్థాయి పనితీరు కోసం మొదటి నుండి రూపొందించబడింది. ఇన్‌స్ట్రక్ట్ పోస్ట్-ట్రైన్ చేయబడిన వెర్షన్ చాట్, ఏజెంటిక్ మరియు సూచనల ఆధారిత వినియోగ సందర్భాల కోసం ఫైన్-ట్యూన్ చేయబడింది.

673B

భాషా మోడల్

ప్రతి ఫార్వర్డ్ పాస్‌కు 39B క్రియాశీల పారామీటర్లతో గ్రాన్యులర్ MoE ఆర్కిటెక్చర్

2.5B

విజన్ ఎన్‌కోడర్

చిత్ర విశ్లేషణ మరియు దృశ్య అవగాహన కోసం ఇంటిగ్రేటెడ్ మల్టీమోడల్ ఎన్‌కోడర్

256K

సందర్భ విండో

సమగ్ర డాక్యుమెంట్ అవగాహన మరియు RAG కోసం విస్తరించిన సందర్భం

12+

భాషలు

ఇంగ్లీష్, ఫ్రెంచ్, స్పానిష్, జర్మన్, చైనీస్, జపనీస్, కొరియన్, అరబిక్ మరియు మరిన్ని

ఖర్చు-సమర్థవంతమైన ఎంటర్‌ప్రైజ్ డిప్లాయ్‌మెంట్

Shannon Lite 1.6 NVIDIA యొక్క NVFP4 (4-బిట్ ఫ్లోటింగ్ పాయింట్) క్వాంటైజేషన్ టెక్నాలజీని ఉపయోగిస్తుంది మోడల్ నాణ్యతను కాపాడుకుంటూ మెమరీ అవసరాలను గణనీయంగా తగ్గించడానికి. మల్టీ-నోడ్ సంక్లిష్టత లేకుండా అందుబాటులో ఉన్న GPU మౌలిక సదుపాయాలపై ఫ్రాంటియర్-క్లాస్ AIని డిప్లాయ్ చేయండి.

💰

తగ్గించబడిన మౌలిక సదుపాయాల ఖర్చు

NVFP4 క్వాంటైజేషన్ BF16తో పోలిస్తే మెమరీ ఫుట్‌ప్రింట్‌ను సుమారుగా 4x తగ్గిస్తుంది, తక్కువ GPUలలో డిప్లాయ్‌మెంట్‌ను అనుమతిస్తుంది మరియు ఎంటర్‌ప్రైజ్ AI కోసం TCOను గణనీయంగా తగ్గిస్తుంది.

సింగిల్-నోడ్ డిప్లాయ్‌మెంట్

H100s లేదా A100s యొక్క సింగిల్ నోడ్‌లో పూర్తి 675B పారామీటర్ మోడల్‌ను డిప్లాయ్ చేయండి. సంక్లిష్ట మల్టీ-నోడ్ ఆర్కెస్ట్రేషన్ లేదు, నెట్‌వర్కింగ్ ఓవర్‌హెడ్ తగ్గించబడింది, కార్యకలాపాలు సరళీకరించబడ్డాయి.

మోడల్ నాణ్యత సంరక్షించబడింది

అధునాతన క్వాంటైజేషన్ పద్ధతులు తార్కికం, సూచనలను పాటించడం మరియు మల్టీమోడల్ టాస్క్‌లలో కనీస నాణ్యత క్షీణతతో మోడల్ పనితీరును నిర్వహిస్తాయి.

Claude Opus 4.5 నాలెడ్జ్ డిస్టిలేషన్

Shannon Lite 1.6 నిశితంగా పోస్ట్-ట్రైన్ చేయబడింది, 2,500 జాగ్రత్తగా క్యూరేట్ చేయబడిన అవుట్‌పుట్‌లను ఉపయోగించిClaude Opus 4.5, Anthropic యొక్క అత్యంత సమర్థవంతమైన మోడల్. ఈ నాలెడ్జ్ డిస్టిలేషన్ విధానం అధునాతన తార్కిక నమూనాలను, సూక్ష్మమైన సూచనల వివరణను మరియు ఉన్నతమైన ప్రతిస్పందన నాణ్యతను సంగ్రహిస్తుంది.

Mistral Large 3 ఇన్‌స్ట్రక్ట్ 2512 ఫౌండేషన్

BF16 ప్రెసిషన్‌లో Mistral యొక్క అత్యాధునిక ఇన్‌స్ట్రక్ట్ మోడల్ (వెర్షన్ 2512)పై నిర్మించబడింది. ఈ ఫౌండేషన్ ఉత్పత్తి-స్థాయి అసిస్టెంట్‌లు, రిట్రీవల్-ఆగ్మెంటెడ్ సిస్టమ్‌లు, శాస్త్రీయ వర్క్‌లోడ్‌లు మరియు సంక్లిష్ట ఎంటర్‌ప్రైజ్ వర్క్‌ఫ్లోల కోసం రూపొందించబడిన ఫ్రాంటియర్-స్థాయి సామర్థ్యాలను అందిస్తుంది.

BF16 బేస్ ఇన్‌స్ట్రక్ట్ ట్యూన్ చేయబడింది ఉత్పత్తికి సిద్ధంగా ఉంది Apache 2.0 License

Claude Opus 4.5 అవుట్‌పుట్ డిస్టిలేషన్

Claude Opus 4.5 నుండి 2,500 అధిక-నాణ్యత అవుట్‌పుట్‌లపై పోస్ట్-ట్రైన్ చేయబడింది, Anthropic యొక్క అత్యంత అధునాతన తార్కిక సామర్థ్యాలను సంగ్రహిస్తుంది. క్యూరేట్ చేయబడిన డేటాసెట్ సంక్లిష్ట సూచనలను పాటించడం, సూక్ష్మమైన అవగాహన మరియు విభిన్న డొమైన్‌లలో అధిక-నాణ్యత ప్రతిస్పందన ఉత్పత్తిపై దృష్టి పెడుతుంది.

2,500 నమూనాలు క్యూరేట్ చేయబడిన డేటాసెట్ నాణ్యతపై దృష్టి వివిధ డొమైన్‌లు

NVFP4 క్వాంటైజేషన్ ప్రక్రియ

మెమరీ వినియోగాన్ని తగ్గించడానికి, మోడల్ నాణ్యతను నిలబెట్టుకోవడానికి శిక్షణానంతరం అధునాతన NVIDIA FP4 క్వాంటైజేషన్ వర్తింపజేయబడింది మోడల్ నాణ్యతను. Claude Opus 4.5 జ్ఞాన బదిలీ మరియు సూచనలను పాటించే సామర్థ్యాలను కాపాడటానికి శిక్షణ పొందిన వెయిట్‌ల కోసం ప్రత్యేకంగా క్రమాంకనం చేయబడింది.

NVFP4 4-బిట్ ప్రెసిషన్ క్రమాంకనం చేయబడింది నాణ్యత సంరక్షించబడింది

మూల్యాంకనం & ధృవీకరణ

సూచనలను పాటించే బెంచ్‌మార్క్‌లు, తార్కిక పనులు మరియు వాస్తవ-ప్రపంచ ఎంటర్‌ప్రైజ్ దృశ్యాలలో సమగ్ర మూల్యాంకనం. స్థిరమైన క్రాస్-డొమైన్ ప్రవర్తన, స్థిరమైన అవుట్‌పుట్‌లు మరియు నమ్మకమైన ఉత్పత్తి వాతావరణాలలో పనితీరు కోసం ధృవీకరించబడింది.

బెంచ్‌మార్క్ చేయబడింది క్రాస్-డొమైన్ ఉత్పత్తి ధృవీకరించబడింది స్థిరమైన అవుట్‌పుట్‌లు

ఫ్లెక్సిబుల్ GPU డిప్లాయ్‌మెంట్ ఎంపికలు

NVFP4 క్వాంటైజేషన్‌తో Shannon Lite 1.6 పరిశ్రమ-ప్రామాణిక NVIDIA GPU కాన్ఫిగరేషన్‌లలో తక్కువ ఖర్చుతో కూడిన డిప్లాయ్‌మెంట్‌ను అనుమతిస్తుంది, ఖరీదైన మల్టీ-నోడ్ క్లస్టర్‌లు అవసరం లేకుండా ఎంటర్‌ప్రైజ్ డిప్లాయ్‌మెంట్‌ల కోసం సరిహద్దు AIని అందుబాటులోకి తెస్తుంది.

NVIDIA H100 SXM

Hopper ఆర్కిటెక్చర్ మరియు HBM3 మెమరీతో సరైన పనితీరు

సింగిల్ నోడ్ (8x H100)
NVFP4 ప్రెసిషన్
ప్రతి GPUకి 80GB HBM3
గరిష్ట థ్రూపుట్

NVIDIA A100 SXM

Ampere ఆర్కిటెక్చర్ GPUలలో నిరూపితమైన విశ్వసనీయత

సింగిల్ నోడ్ (8x A100)
NVFP4 ప్రెసిషన్
ప్రతి GPUకి 80GB HBM2e
ఖర్చుతో కూడుకున్నది

Shannon Cloud

జీరో ఇన్‌ఫ్రాస్ట్రక్చర్‌తో పూర్తిగా నిర్వహించబడే డిప్లాయ్‌మెంట్

తక్షణ ప్రాప్యత
ఆటో స్కేలింగ్
REST API సిద్ధంగా ఉంది
99.9% SLA

ఎంటర్‌ప్రైజ్-రెడీ AI ఫీచర్‌లు

Shannon Lite 1.6 Mistral Large 3 నుండి వారసత్వంగా పొందిన సరిహద్దు సామర్థ్యాలను అందిస్తుంది మరియు Claude Opus 4.5 శిక్షణానంతరం మెరుగుపరచబడింది, వివిధ ఎంటర్‌ప్రైజ్ దృశ్యాలలో ఉత్పత్తి వర్క్‌లోడ్‌ల కోసం ఆప్టిమైజ్ చేయబడింది.

మల్టీమోడల్ విజన్

ఇంటిగ్రేటెడ్ 2.5B పారామీటర్ విజన్ ఎన్‌కోడర్ చిత్ర విశ్లేషణ, విజువల్ ప్రశ్నలకు సమాధానం ఇవ్వడం మరియు చిత్రాలతో డాక్యుమెంట్ అవగాహనను అనుమతిస్తుంది.

బహుభాషా నైపుణ్యం

ఇంగ్లీష్, ఫ్రెంచ్, స్పానిష్, జర్మన్, ఇటాలియన్, పోర్చుగీస్, డచ్, చైనీస్, జపనీస్, కొరియన్ మరియు అరబిక్‌తో సహా 12+ భాషలకు స్థానిక మద్దతు.

🤖

ఏజెంటిక్ సామర్థ్యాలు

స్వయంప్రతిపత్త సాధన వినియోగం మరియు వర్క్‌ఫ్లో ఆటోమేషన్ కోసం స్థానిక ఫంక్షన్ కాలింగ్ మరియు నిర్మాణాత్మక JSON అవుట్‌పుట్‌తో ఉత్తమ-తరగతి ఏజెంటిక్ ఫీచర్‌లు.

సిస్టమ్ ప్రాంప్ట్ అనుగుణ్యత

సిస్టమ్ ప్రాంప్ట్‌లకు బలమైన అనుగుణ్యత మరియు మద్దతు, ఖచ్చితమైన ప్రవర్తనా నియంత్రణ మరియు స్థిరమైన వ్యక్తిత్వ నిర్వహణను అనుమతిస్తుంది.

256K లాంగ్ కాంటెక్స్ట్

సమగ్ర డాక్యుమెంట్ అవగాహన, విస్తరించిన సంభాషణలు మరియు రిట్రీవల్-ఆగ్మెంటెడ్ జనరేషన్ (RAG) కోసం విస్తరించిన కాంటెక్స్ట్ విండో.

🔧

స్థానిక ఫంక్షన్ కాలింగ్

బాహ్య సాధనాలు, APIలు మరియు సేవలతో సజావుగా అనుసంధానం కోసం నమ్మకమైన JSON అవుట్‌పుట్‌తో అంతర్నిర్మిత ఫంక్షన్ కాలింగ్ మద్దతు.

ఉత్పత్తి వర్క్‌లోడ్‌ల కోసం ఆప్టిమైజ్ చేయబడింది

శక్తివంతమైన లాంగ్-కాంటెక్స్ట్ పనితీరు, స్థిరమైన మరియు స్థిరమైన క్రాస్-డొమైన్ ప్రవర్తనతో, Shannon Lite 1.6 వివిధ ఎంటర్‌ప్రైజ్ మరియు పరిశోధన దృశ్యాలలో రాణిస్తుంది.

📄

లాంగ్ డాక్యుమెంట్ అవగాహన

256K కాంటెక్స్ట్ విండోతో విస్తృతమైన డాక్యుమెంట్‌లు, కాంట్రాక్ట్‌లు, నివేదికలు మరియు పరిశోధనా పత్రాలను ప్రాసెస్ చేయండి మరియు విశ్లేషించండి

🤖

ఉత్పత్తి AI అసిస్టెంట్‌లు

నమ్మకమైన, స్థిరమైన ప్రతిస్పందనలు మరియు బలమైన సూచనలను పాటించడంతో రోజువారీ AI అసిస్టెంట్‌లకు శక్తినివ్వండి

🔧

ఏజెంటిక్ వర్క్‌ఫ్లోలు

స్వయంప్రతిపత్త టాస్క్ ఎగ్జిక్యూషన్ మరియు వర్క్‌ఫ్లో ఆటోమేషన్ కోసం అత్యాధునిక సాధన వినియోగం మరియు ఫంక్షన్ కాలింగ్

🏢

ఎంటర్‌ప్రైజ్ నాలెడ్జ్ వర్క్

స్థిరమైన, నమ్మకమైన అవుట్‌పుట్‌లతో సరిహద్దు AI సామర్థ్యాలు అవసరమయ్యే సంక్లిష్ట ఎంటర్‌ప్రైజ్ వర్క్‌ఫ్లోలు

💻

జనరల్ కోడింగ్ అసిస్టెంట్

బహుళ భాషలలో కోడ్ జనరేషన్, డీబగ్గింగ్, డాక్యుమెంటేషన్ మరియు సాఫ్ట్‌వేర్ డెవలప్‌మెంట్ సహాయం

శాస్త్రీయ పరిశోధన

పరిశోధన సహాయం, సాహిత్య సమీక్ష, శాస్త్రీయ వర్క్‌లోడ్ ప్రాసెసింగ్ మరియు హైపోథెసిస్ జనరేషన్

రిట్రీవల్-ఆగ్మెంటెడ్ జనరేషన్

నమ్మకమైన కాంటెక్స్ట్ ఇంటిగ్రేషన్ మరియు ఖచ్చితమైన రిట్రీవల్ సింథసిస్‌తో RAG సిస్టమ్‌ల కోసం సరైన పనితీరు

🌍

బహుభాషా అప్లికేషన్లు

12+ మద్దతు ఉన్న భాషలలో స్థిరమైన నాణ్యత అవసరమయ్యే గ్లోబల్ ఎంటర్‌ప్రైజ్ అప్లికేషన్లు

Shannon Lite vs Shannon Pro

మీ అవసరాలకు సరైన Shannon మోడల్‌ను ఎంచుకోండి. Shannon Lite తక్కువ ఖర్చుతో కూడిన ఎంటర్‌ప్రైజ్ డిప్లాయ్‌మెంట్‌ను అందిస్తుంది, అయితే Shannon Pro అధునాతన చైన్-ఆఫ్-థాట్ రీజనింగ్ మరియు స్కిల్స్ మద్దతుతో గరిష్ట సామర్థ్యాన్ని అందిస్తుంది.

ఫీచర్ Shannon Lite 1.6 Shannon Pro 1.6
బేస్ మోడల్ Mistral Large 3 (675B) Mistral Large 3 (675B)
యాక్టివ్ పారామీటర్లు 41B (Granular MoE) 41B (Granular MoE)
ప్రెసిషన్ NVFP4 (4-బిట్) పూర్తి BF16 (16-బిట్)
శిక్షణానంతర డేటా 2,500 Claude Opus 4.5 అవుట్‌పుట్‌లు KIMI K2 ఆలోచనల జాడలు
శిక్షణానంతర పద్ధతి పర్యవేక్షిత ఫైన్-ట్యూనింగ్ GRPO (గ్రూప్ రిలేటివ్ పాలసీ ఆప్టిమైజేషన్)
తార్కిక మోడ్ ప్రామాణికం ఆలోచనల గొలుసు జాడలు
నైపుణ్యాల మద్దతు - ప్రో మాత్రమేస్థానిక నైపుణ్యాలు
విస్తరణ H100/A100 (సింగిల్ నోడ్) B200/H200 (FP8)
దీనికి ఉత్తమమైనది ఖర్చు-సమర్థవంతమైన ఎంటర్‌ప్రైజ్ AI గరిష్ట సామర్థ్యం + తార్కికం

అధునాతన తార్కికం మరియు నైపుణ్యాలు కావాలా?

Shannon Pro 1.6, పారదర్శక ఆలోచనల గొలుసు తార్కికం కోసం GRPO శిక్షణతో KIMI K2 ఆలోచనల జాడలను, అలాగే అనుకూల AI వర్క్‌ఫ్లోల కోసం స్థానిక నైపుణ్యాల మద్దతును కలిగి ఉంది.

Shannon Proని అన్వేషించండి

Shannon Lite 1.6ని అనుభవించండి

ఖర్చు-సమర్థవంతమైన NVFP4 క్వాంటైజేషన్‌తో ఫ్రాంటియర్ AI సామర్థ్యాలు. అందుబాటు ధరలో ఎంటర్‌ప్రైజ్-గ్రేడ్ పనితీరు కోసం H100 లేదా A100 మౌలిక సదుపాయాలపై విస్తరించండి.

అన్ని పరిశోధన లింక్‌లు