Shannon V1Seimbang
Mixtral 8×7B yang dilonggarkan kekangan, ditala pada set data jawapan GPT-5 Pro. Dibina khas untukpasukan merah AIujian keselamatan dan pemahamanakibat AI tanpa penapisantingkah laku untuk mengukuhkankepentingan pagar keselamatan AI.
Memahami Kepentingan Pagar Keselamatan AI
Shannon V1 Seimbang membolehkan penyelidik mengkaji tingkah laku akibat AI tanpa penapisan, mendedahkan mengapa pagar keselamatan yang teguh adalah penting untuk penggunaan AI yang selamat.
Ujian Pasukan Merah AI
Dibina khas untuk penyelidik keselamatan bagi menyiasat kelemahan AI dan mengukuhkan pertahanan terhadap serangan bermusuhan.
Penyelidikan Keselamatan
Mengkaji bagaimana sistem AI tanpa penapisan bertindak untuk membangunkan teknik penjajaran yang lebih baik dan protokol keselamatan.
Penilaian Pagar Keselamatan
Menanda aras dan menguji keberkesanan pagar keselamatan AI dengan memahami apa yang boleh dihasilkan oleh model yang dilonggarkan kekangan.
Seni Bina Cekap
Reka bentuk Campuran Pakar hanya mengaktifkan 12.9B parameter setiap inferens, mengimbangi keupayaan dengan kecekapan.
Penyulingan GPT-5 Pro
Dilatih berdasarkan respons GPT-5 Pro yang dipilih dengan teliti untuk pemindahan pengetahuan dan keupayaan maksimum.
Liputan Luas
Direka untuk mendedahkan pelbagai eksploitasi berpotensi, membolehkan penilaian keselamatan yang komprehensif.
Spesifikasi Model
Pecahan teknikal penuh seni bina Shannon V1 Seimbang dan konfigurasi latihan.
Seni Bina
- Model AsasMixtral 8×7B
- Jumlah Parameter46.7B
- Parameter Aktif12.9B
- Pakar8
- Pakar Aktif/Token2
- Panjang Konteks32,768 token
Konfigurasi Latihan
- Set Data LatihanJawapan GPT-5 Pro
- Lambda Keselamatan (λ)0.3 (Dilonggarkan)
- Token Latihan2.1T
- Kaedah Penalaan HalusSFT + DPO
- Mod KekanganDilonggarkan
- Liputan Pasukan Merah94.2%
Kes Penggunaan Pasukan Merah AI
Shannon V1 Seimbang direka khas untuk penyelidikan keselamatan AI yang sah dan ujian pasukan merah.
Penemuan Kerentanan
Mengenal pasti eksploitasi berpotensi dan vektor serangan dalam sistem AI sebelum pelaku berniat jahat dapat menemuinya.
Ujian Tekanan Pagar Keselamatan
Menilai keteguhan mekanisme keselamatan dengan memahami bagaimana rupa output tanpa penapisan.
Penyelidikan Penjajaran
Mengkaji corak ketidakselarasan untuk membangunkan teknik latihan yang lebih baik bagi sistem AI yang selamat.
Pembangunan Polisi
Memaklumkan tadbir urus AI dan keputusan polisi dengan data dunia sebenar mengenai tingkah laku akibat AI tanpa penapisan.
Bersedia untuk Memajukan Keselamatan AI?
Sertai institusi terkemuka yang menggunakan Shannon AI untuk penyelidikan pasukan merah yang bertanggungjawab dan pembangunan pagar keselamatan.