Kami tidak menyimpan atau mengakses data pengguna mana pun, dan kami tidak menangguhkan akun kecuali otoritas yang sah meminta tindakan penegakan.

NVFP4 Terkuantisasi - AI Perusahaan Hemat Biaya

ShannonLite 1.6

AI perusahaan hemat biaya didukung olehMistral Large 3dengan675B parameter totaldan41B parameter aktifmelalui arsitektur Mixture-of-Experts granular. Pasca-dilatih pada2,500 keluaran Claude Opus 4.5untuk kepatuhan instruksi yang luar biasa.Kuantisasi NVFP4memungkinkan penyebaran satu node padaH100s atau A100s.

675B

Parameter Total

41B

Parameter Aktif

NVFP4

Kuantisasi

256K

Konteks

2.5B

Encoder Visi

Coba Shannon Lite Lihat Dokumentasi

Edisi Lite

Shannon Lite 1.6

v1.6.0-lite-nvfp4

Model Dasar Mistral Large 3

Arsitektur MoE Granular

Parameter Total 675B

Parameter Aktif 41B

Kuantisasi NVFP4

Pasca-Pelatihan Claude Opus 4.5

Sampel Pelatihan 2,500

Arsitektur Teknis

Mistral Large 3: Mixture-of-Experts Granular

Shannon Lite 1.6 dibangun di atas Mistral Large 3, model Mixture-of-Experts granular multimodal tercanggih yang dirancang dari awal untuk keandalan, pemahaman konteks panjang, dan kinerja tingkat produksi. Versi pasca-pelatihan instruksi disetel dengan baik untuk kasus penggunaan berbasis obrolan, agen, dan instruksi.

673B

Model Bahasa

Arsitektur MoE Granular dengan 39B parameter aktif per lintasan maju

2.5B

Encoder Visi

Encoder multimodal terintegrasi untuk analisis gambar dan pemahaman visual

256K

Jendela Konteks

Konteks diperpanjang untuk pemahaman dokumen yang komprehensif dan RAG

12+

Bahasa

Inggris, Prancis, Spanyol, Jerman, Tiongkok, Jepang, Korea, Arab, dan lainnya

Kuantisasi NVFP4

Penyebaran Perusahaan Hemat Biaya

Shannon Lite 1.6 memanfaatkan teknologi kuantisasi NVFP4 (floating point 4-bit) NVIDIA untuk secara dramatis mengurangi persyaratan memori sambil mempertahankan kualitas model. Terapkan AI kelas perbatasan pada infrastruktur GPU yang mudah diakses tanpa kompleksitas multi-node.

💰

Mengurangi Biaya Infrastruktur

Kuantisasi NVFP4 mengurangi jejak memori sekitar 4x dibandingkan dengan BF16, memungkinkan penyebaran pada lebih sedikit GPU dan secara dramatis menurunkan TCO untuk AI perusahaan.

Penyebaran Satu Node

Terapkan model 675B parameter penuh pada satu node H100s atau A100s. Tidak ada orkestrasi multi-node yang kompleks, overhead jaringan berkurang, operasi yang disederhanakan.

Kualitas Model Terjaga

Teknik kuantisasi canggih mempertahankan kinerja model di seluruh penalaran, kepatuhan instruksi, dan tugas multimodal dengan degradasi kualitas minimal.

Metodologi Pasca-Pelatihan

Distilasi Pengetahuan Claude Opus 4.5

Shannon Lite 1.6 telah pasca-dilatih dengan cermat menggunakan 2,500 keluaran yang dikurasi dengan cermat dariClaude Opus 4.5, model Anthropic yang paling mumpuni. Pendekatan distilasi pengetahuan ini menangkap pola penalaran canggih, interpretasi instruksi yang bernuansa, dan kualitas respons yang unggul.

Fondasi Mistral Large 3 Instruct 2512

Dibangun di atas model Instruct tercanggih Mistral (versi 2512) dalam presisi BF16. Fondasi ini menyediakan kemampuan tingkat perbatasan yang direkayasa untuk asisten tingkat produksi, sistem yang diperkaya pengambilan, beban kerja ilmiah, dan alur kerja perusahaan yang kompleks.

Dasar BF16 Disetel Instruksi Siap Produksi Lisensi Apache 2.0

Distilasi Keluaran Claude Opus 4.5

Pasca-dilatih pada 2,500 keluaran berkualitas tinggi dari Claude Opus 4.5, menangkap kemampuan penalaran Anthropic yang paling canggih. Dataset yang dikurasi berfokus pada kepatuhan instruksi yang kompleks, pemahaman yang bernuansa, dan generasi respons berkualitas tinggi di seluruh domain yang beragam.

2,500 Sampel Dataset Dikurasi Fokus Kualitas Domain Beragam

Proses Kuantisasi NVFP4

Kuantisasi NVIDIA FP4 tingkat lanjut diterapkan pasca-pelatihan untuk mengurangi jejak memori sambil mempertahankan kualitas model. Dikalibrasi secara khusus untuk bobot pasca-pelatihan guna menjaga transfer pengetahuan dan kemampuan mengikuti instruksi Claude Opus 4.5.

NVFP4 Presisi 4-bit Dikalibrasi Kualitas Terjaga

Evaluasi & Validasi

Evaluasi komprehensif di seluruh tolok ukur kepatuhan instruksi, tugas penalaran, dan skenario perusahaan dunia nyata. Divalidasi untuk perilaku lintas-domain yang konsisten, keluaran yang stabil, dan kinerja yang andal di lingkungan produksi.

Ditolok Ukur Lintas-Domain Divalidasi Produksi Keluaran Stabil

Infrastruktur Penyebaran

Opsi Penyebaran GPU Fleksibel

Shannon Lite 1.6 dengan kuantisasi NVFP4 memungkinkan penyebaran yang hemat biaya pada konfigurasi GPU NVIDIA standar industri, menjadikan AI terdepan dapat diakses untuk penyebaran perusahaan tanpa memerlukan klaster multi-node yang mahal.

NVIDIA H100 SXM

Optimal performance with Hopper architecture and HBM3 memory

Node Tunggal (8x H100)

Presisi NVFP4

80GB HBM3 per GPU

Throughput Maksimal

NVIDIA A100 SXM

Keandalan terbukti pada GPU arsitektur Ampere

Node Tunggal (8x A100)

Presisi NVFP4

80GB HBM2e per GPU

Hemat Biaya

Shannon Cloud

Penyebaran yang dikelola sepenuhnya tanpa infrastruktur

Akses Instan

Penskalaan Otomatis

Siap REST API

SLA 99.9%

Kemampuan Model

Fitur AI Siap Perusahaan

Shannon Lite 1.6 menghadirkan kemampuan terdepan yang diwarisi dari Mistral Large 3 dan ditingkatkan melalui pasca-pelatihan Claude Opus 4.5, dioptimalkan untuk beban kerja produksi di berbagai skenario perusahaan.

Visi Multimodal

Encoder visi parameter 2.5B terintegrasi memungkinkan analisis gambar, tanya jawab visual, dan pemahaman dokumen dengan gambar.

Keunggulan Multibahasa

Dukungan asli untuk 12+ bahasa termasuk Inggris, Prancis, Spanyol, Jerman, Italia, Portugis, Belanda, Tiongkok, Jepang, Korea, dan Arab.

🤖

Kemampuan Agen

Fitur agen terbaik di kelasnya dengan pemanggilan fungsi asli dan keluaran JSON terstruktur untuk penggunaan alat otonom dan otomatisasi alur kerja.

Kepatuhan Prompt Sistem

Kepatuhan dan dukungan yang kuat untuk prompt sistem, memungkinkan kontrol perilaku yang tepat dan pemeliharaan persona yang konsisten.

Konteks Panjang 256K

Jendela konteks yang diperluas untuk pemahaman dokumen yang komprehensif, percakapan yang diperpanjang, dan generasi yang diperkaya pengambilan (RAG).

🔧

Pemanggilan Fungsi Asli

Dukungan pemanggilan fungsi bawaan dengan keluaran JSON yang andal untuk integrasi tanpa batas dengan alat eksternal, API, dan layanan.

Kasus Penggunaan

Dioptimalkan untuk Beban Kerja Produksi

Dengan kinerja konteks panjang yang kuat, perilaku lintas-domain yang stabil dan konsisten, Shannon Lite 1.6 unggul di berbagai skenario perusahaan dan penelitian.

📄

Pemahaman Dokumen Panjang

Memproses dan menganalisis dokumen ekstensif, kontrak, laporan, dan makalah penelitian dengan jendela konteks 256K

🤖

Asisten AI Produksi

Memberdayakan asisten AI harian dengan respons yang andal, konsisten, dan kepatuhan instruksi yang kuat

🔧

Alur Kerja Agen

Penggunaan alat dan pemanggilan fungsi canggih untuk eksekusi tugas otonom dan otomatisasi alur kerja

🏢

Pekerjaan Pengetahuan Perusahaan

Alur kerja perusahaan yang kompleks yang membutuhkan kemampuan AI terdepan dengan keluaran yang konsisten dan andal

💻

Asisten Pengkodean Umum

Generasi kode, debugging, dokumentasi, dan bantuan pengembangan perangkat lunak di berbagai bahasa

Penelitian Ilmiah

Bantuan penelitian, tinjauan literatur, pemrosesan beban kerja ilmiah, dan generasi hipotesis

Generasi yang Diperkaya Pengambilan

Kinerja optimal untuk sistem RAG dengan integrasi konteks yang andal dan sintesis pengambilan yang akurat

🌍

Aplikasi Multibahasa

Aplikasi perusahaan global yang membutuhkan kualitas konsisten di 12+ bahasa yang didukung

Perbandingan Model

Shannon Lite vs Shannon Pro

Pilih model Shannon yang tepat untuk kebutuhan Anda. Shannon Lite menawarkan penyebaran perusahaan yang hemat biaya, sementara Shannon Pro memberikan kemampuan maksimal dengan penalaran rantai-pemikiran tingkat lanjut dan dukungan Keterampilan.

Fitur	Shannon Lite 1.6	Shannon Pro 1.6
Model Dasar	Mistral Large 3 (675B)	Mistral Large 3 (675B)
Parameter Aktif	41B (MoE Granular)	41B (MoE Granular)
Presisi	NVFP4 (4-bit)	BF16 Penuh (16-bit)
Data Pasca-Pelatihan	2.500 keluaran Claude Opus 4.5	Jejak Pemikiran KIMI K2
Metode Pasca-Pelatihan	Penyetelan Halus Terawasi	GRPO (Optimasi Kebijakan Relatif Grup)
Mode Penalaran	Standar	Jejak Rantai Pemikiran
Dukungan Keterampilan	-	Hanya ProKeterampilan Asli
Penerapan	H100/A100 (Node Tunggal)	B200/H200 (FP8)
Terbaik Untuk	AI Perusahaan Hemat Biaya	Kapabilitas Maksimal + Penalaran

Rasakan Shannon Lite 1.6

Kapabilitas AI mutakhir dengan kuantisasi NVFP4 yang hemat biaya. Terapkan pada infrastruktur H100 atau A100 untuk kinerja tingkat perusahaan dengan biaya terjangkau.

Mulai Gunakan Shannon Lite Bandingkan dengan Pro

Semua tautan riset

Kebijakan Penggunaan Bertanggung Jawab Ketentuan Layanan Shannon V1 Seimbang Shannon V1 Mendalam Shannon V1.5 Pemikiran Shannon V1.5 Pemikiran Mendalam Shannon Lite 1.6 Shannon Pro 1.6 Bagaimana Kami Melatih Mixtral di GPT-5 Pro melalui Distilasi OpenRouter Bagaimana Kami Melatih Shannon V1.5 untuk Berpikir Menggunakan GRPO Pengujian Penetrasi menggunakan AI: Shannon AI kini sedang mengerjakan Claude Code Custom Shannon Proyek Keterampilan

ShannonLite 1.6

Mistral Large 3: Mixture-of-Experts Granular

Model Bahasa

Encoder Visi

Jendela Konteks

Bahasa

Penyebaran Perusahaan Hemat Biaya

Mengurangi Biaya Infrastruktur

Penyebaran Satu Node

Kualitas Model Terjaga

Distilasi Pengetahuan Claude Opus 4.5

Fondasi Mistral Large 3 Instruct 2512

Distilasi Keluaran Claude Opus 4.5

Proses Kuantisasi NVFP4

Evaluasi & Validasi

Opsi Penyebaran GPU Fleksibel

NVIDIA H100 SXM

NVIDIA A100 SXM

Shannon Cloud

Fitur AI Siap Perusahaan

Visi Multimodal

Keunggulan Multibahasa

Kemampuan Agen

Kepatuhan Prompt Sistem

Konteks Panjang 256K

Pemanggilan Fungsi Asli

Dioptimalkan untuk Beban Kerja Produksi

Pemahaman Dokumen Panjang

Asisten AI Produksi

Alur Kerja Agen

Pekerjaan Pengetahuan Perusahaan

Asisten Pengkodean Umum

Penelitian Ilmiah

Generasi yang Diperkaya Pengambilan

Aplikasi Multibahasa

Shannon Lite vs Shannon Pro

Butuh Penalaran dan Keterampilan Tingkat Lanjut?

Rasakan Shannon Lite 1.6

Semua tautan riset