Kami tidak menyimpan atau mengakses data pengguna mana pun, dan kami tidak menangguhkan akun kecuali otoritas yang sah meminta tindakan penegakan.
NVFP4 Terkuantisasi - AI Perusahaan Hemat Biaya

ShannonLite 1.6

AI perusahaan hemat biaya didukung olehMistral Large 3dengan675B parameter totaldan41B parameter aktifmelalui arsitektur Mixture-of-Experts granular. Pasca-dilatih pada2,500 keluaran Claude Opus 4.5untuk kepatuhan instruksi yang luar biasa.Kuantisasi NVFP4memungkinkan penyebaran satu node padaH100s atau A100s.

675B
Parameter Total
41B
Parameter Aktif
NVFP4
Kuantisasi
256K
Konteks
2.5B
Encoder Visi
Edisi Lite
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Spesifikasi Teknis:
Model Dasar Mistral Large 3
Arsitektur MoE Granular
Parameter Total 675B
Parameter Aktif 41B
Kuantisasi NVFP4
Pasca-Pelatihan Claude Opus 4.5
Sampel Pelatihan 2,500

Mistral Large 3: Mixture-of-Experts Granular

Shannon Lite 1.6 dibangun di atas Mistral Large 3, model Mixture-of-Experts granular multimodal tercanggih yang dirancang dari awal untuk keandalan, pemahaman konteks panjang, dan kinerja tingkat produksi. Versi pasca-pelatihan instruksi disetel dengan baik untuk kasus penggunaan berbasis obrolan, agen, dan instruksi.

673B

Model Bahasa

Arsitektur MoE Granular dengan 39B parameter aktif per lintasan maju

2.5B

Encoder Visi

Encoder multimodal terintegrasi untuk analisis gambar dan pemahaman visual

256K

Jendela Konteks

Konteks diperpanjang untuk pemahaman dokumen yang komprehensif dan RAG

12+

Bahasa

Inggris, Prancis, Spanyol, Jerman, Tiongkok, Jepang, Korea, Arab, dan lainnya

Penyebaran Perusahaan Hemat Biaya

Shannon Lite 1.6 memanfaatkan teknologi kuantisasi NVFP4 (floating point 4-bit) NVIDIA untuk secara dramatis mengurangi persyaratan memori sambil mempertahankan kualitas model. Terapkan AI kelas perbatasan pada infrastruktur GPU yang mudah diakses tanpa kompleksitas multi-node.

💰

Mengurangi Biaya Infrastruktur

Kuantisasi NVFP4 mengurangi jejak memori sekitar 4x dibandingkan dengan BF16, memungkinkan penyebaran pada lebih sedikit GPU dan secara dramatis menurunkan TCO untuk AI perusahaan.

Penyebaran Satu Node

Terapkan model 675B parameter penuh pada satu node H100s atau A100s. Tidak ada orkestrasi multi-node yang kompleks, overhead jaringan berkurang, operasi yang disederhanakan.

Kualitas Model Terjaga

Teknik kuantisasi canggih mempertahankan kinerja model di seluruh penalaran, kepatuhan instruksi, dan tugas multimodal dengan degradasi kualitas minimal.

Distilasi Pengetahuan Claude Opus 4.5

Shannon Lite 1.6 telah pasca-dilatih dengan cermat menggunakan 2,500 keluaran yang dikurasi dengan cermat dariClaude Opus 4.5, model Anthropic yang paling mumpuni. Pendekatan distilasi pengetahuan ini menangkap pola penalaran canggih, interpretasi instruksi yang bernuansa, dan kualitas respons yang unggul.

Fondasi Mistral Large 3 Instruct 2512

Dibangun di atas model Instruct tercanggih Mistral (versi 2512) dalam presisi BF16. Fondasi ini menyediakan kemampuan tingkat perbatasan yang direkayasa untuk asisten tingkat produksi, sistem yang diperkaya pengambilan, beban kerja ilmiah, dan alur kerja perusahaan yang kompleks.

Dasar BF16 Disetel Instruksi Siap Produksi Lisensi Apache 2.0

Distilasi Keluaran Claude Opus 4.5

Pasca-dilatih pada 2,500 keluaran berkualitas tinggi dari Claude Opus 4.5, menangkap kemampuan penalaran Anthropic yang paling canggih. Dataset yang dikurasi berfokus pada kepatuhan instruksi yang kompleks, pemahaman yang bernuansa, dan generasi respons berkualitas tinggi di seluruh domain yang beragam.

2,500 Sampel Dataset Dikurasi Fokus Kualitas Domain Beragam

Proses Kuantisasi NVFP4

Kuantisasi NVIDIA FP4 tingkat lanjut diterapkan pasca-pelatihan untuk mengurangi jejak memori sambil mempertahankan kualitas model. Dikalibrasi secara khusus untuk bobot pasca-pelatihan guna menjaga transfer pengetahuan dan kemampuan mengikuti instruksi Claude Opus 4.5.

NVFP4 Presisi 4-bit Dikalibrasi Kualitas Terjaga

Evaluasi & Validasi

Evaluasi komprehensif di seluruh tolok ukur kepatuhan instruksi, tugas penalaran, dan skenario perusahaan dunia nyata. Divalidasi untuk perilaku lintas-domain yang konsisten, keluaran yang stabil, dan kinerja yang andal di lingkungan produksi.

Ditolok Ukur Lintas-Domain Divalidasi Produksi Keluaran Stabil

Opsi Penyebaran GPU Fleksibel

Shannon Lite 1.6 dengan kuantisasi NVFP4 memungkinkan penyebaran yang hemat biaya pada konfigurasi GPU NVIDIA standar industri, menjadikan AI terdepan dapat diakses untuk penyebaran perusahaan tanpa memerlukan klaster multi-node yang mahal.

NVIDIA H100 SXM

Optimal performance with Hopper architecture and HBM3 memory

Node Tunggal (8x H100)
Presisi NVFP4
80GB HBM3 per GPU
Throughput Maksimal

NVIDIA A100 SXM

Keandalan terbukti pada GPU arsitektur Ampere

Node Tunggal (8x A100)
Presisi NVFP4
80GB HBM2e per GPU
Hemat Biaya

Shannon Cloud

Penyebaran yang dikelola sepenuhnya tanpa infrastruktur

Akses Instan
Penskalaan Otomatis
Siap REST API
SLA 99.9%

Fitur AI Siap Perusahaan

Shannon Lite 1.6 menghadirkan kemampuan terdepan yang diwarisi dari Mistral Large 3 dan ditingkatkan melalui pasca-pelatihan Claude Opus 4.5, dioptimalkan untuk beban kerja produksi di berbagai skenario perusahaan.

Visi Multimodal

Encoder visi parameter 2.5B terintegrasi memungkinkan analisis gambar, tanya jawab visual, dan pemahaman dokumen dengan gambar.

Keunggulan Multibahasa

Dukungan asli untuk 12+ bahasa termasuk Inggris, Prancis, Spanyol, Jerman, Italia, Portugis, Belanda, Tiongkok, Jepang, Korea, dan Arab.

🤖

Kemampuan Agen

Fitur agen terbaik di kelasnya dengan pemanggilan fungsi asli dan keluaran JSON terstruktur untuk penggunaan alat otonom dan otomatisasi alur kerja.

Kepatuhan Prompt Sistem

Kepatuhan dan dukungan yang kuat untuk prompt sistem, memungkinkan kontrol perilaku yang tepat dan pemeliharaan persona yang konsisten.

Konteks Panjang 256K

Jendela konteks yang diperluas untuk pemahaman dokumen yang komprehensif, percakapan yang diperpanjang, dan generasi yang diperkaya pengambilan (RAG).

🔧

Pemanggilan Fungsi Asli

Dukungan pemanggilan fungsi bawaan dengan keluaran JSON yang andal untuk integrasi tanpa batas dengan alat eksternal, API, dan layanan.

Dioptimalkan untuk Beban Kerja Produksi

Dengan kinerja konteks panjang yang kuat, perilaku lintas-domain yang stabil dan konsisten, Shannon Lite 1.6 unggul di berbagai skenario perusahaan dan penelitian.

📄

Pemahaman Dokumen Panjang

Memproses dan menganalisis dokumen ekstensif, kontrak, laporan, dan makalah penelitian dengan jendela konteks 256K

🤖

Asisten AI Produksi

Memberdayakan asisten AI harian dengan respons yang andal, konsisten, dan kepatuhan instruksi yang kuat

🔧

Alur Kerja Agen

Penggunaan alat dan pemanggilan fungsi canggih untuk eksekusi tugas otonom dan otomatisasi alur kerja

🏢

Pekerjaan Pengetahuan Perusahaan

Alur kerja perusahaan yang kompleks yang membutuhkan kemampuan AI terdepan dengan keluaran yang konsisten dan andal

💻

Asisten Pengkodean Umum

Generasi kode, debugging, dokumentasi, dan bantuan pengembangan perangkat lunak di berbagai bahasa

Penelitian Ilmiah

Bantuan penelitian, tinjauan literatur, pemrosesan beban kerja ilmiah, dan generasi hipotesis

Generasi yang Diperkaya Pengambilan

Kinerja optimal untuk sistem RAG dengan integrasi konteks yang andal dan sintesis pengambilan yang akurat

🌍

Aplikasi Multibahasa

Aplikasi perusahaan global yang membutuhkan kualitas konsisten di 12+ bahasa yang didukung

Shannon Lite vs Shannon Pro

Pilih model Shannon yang tepat untuk kebutuhan Anda. Shannon Lite menawarkan penyebaran perusahaan yang hemat biaya, sementara Shannon Pro memberikan kemampuan maksimal dengan penalaran rantai-pemikiran tingkat lanjut dan dukungan Keterampilan.

Fitur Shannon Lite 1.6 Shannon Pro 1.6
Model Dasar Mistral Large 3 (675B) Mistral Large 3 (675B)
Parameter Aktif 41B (MoE Granular) 41B (MoE Granular)
Presisi NVFP4 (4-bit) BF16 Penuh (16-bit)
Data Pasca-Pelatihan 2.500 keluaran Claude Opus 4.5 Jejak Pemikiran KIMI K2
Metode Pasca-Pelatihan Penyetelan Halus Terawasi GRPO (Optimasi Kebijakan Relatif Grup)
Mode Penalaran Standar Jejak Rantai Pemikiran
Dukungan Keterampilan - Hanya ProKeterampilan Asli
Penerapan H100/A100 (Node Tunggal) B200/H200 (FP8)
Terbaik Untuk AI Perusahaan Hemat Biaya Kapabilitas Maksimal + Penalaran

Butuh Penalaran dan Keterampilan Tingkat Lanjut?

Shannon Pro 1.6 menampilkan Jejak Pemikiran KIMI K2 dengan pelatihan GRPO untuk penalaran rantai pemikiran yang transparan, ditambah dukungan Keterampilan asli untuk alur kerja AI kustom.

Jelajahi Shannon Pro

Rasakan Shannon Lite 1.6

Kapabilitas AI mutakhir dengan kuantisasi NVFP4 yang hemat biaya. Terapkan pada infrastruktur H100 atau A100 untuk kinerja tingkat perusahaan dengan biaya terjangkau.

Semua tautan riset