Shannon V1Тэнцвэртэй
Хязгаарлалт сулруулсан Mixtral 8×7B нь GPT-5 Pro хариултын өгөгдлийн санд тохируулагдсан. Зорилгоор бүтээгдсэнХиймэл оюун ухааны улаан багаюулгүй байдлын туршилт, ойлголтцензургүй хиймэл оюун ухааны үр дагаварзан үйлийг бэхжүүлэхХиймэл оюун ухааны хамгаалалтын ач холбогдол.
Хиймэл оюун ухааны хамгаалалтын ач холбогдлыг ойлгох
Shannon V1 Balanced нь судлаачдад цензургүй хиймэл оюун ухааны үр дагаврын зан үйлийг судлах боломжийг олгож, бат бөх хамгаалалт нь хиймэл оюун ухааны аюулгүй байршуулалтад яагаад чухал болохыг илчилдэг.
Хиймэл оюун ухааны улаан багийн туршилт
Аюулгүй байдлын судлаачдад зориулан бүтээгдсэн бөгөөд хиймэл оюун ухааны эмзэг байдлыг шалгаж, дайсагнасан халдлагын эсрэг хамгаалалтыг бэхжүүлдэг.
Аюулгүй байдлын судалгаа
Цензургүй хиймэл оюун ухааны системүүд хэрхэн ажилладгийг судалж, илүү сайн зохицуулалтын арга техник, аюулгүй байдлын протоколыг боловсруулах.
Хамгаалалтын үнэлгээ
Хязгаарлалт сулруулсан загварууд юу үйлдвэрлэж чадахыг ойлгосноор хиймэл оюун ухааны хамгаалалтын үр дүнтэй байдлыг үнэлж, турших.
Үр ашигтай архитектур
Mixture-of-Experts загвар нь таамаглал бүрт зөвхөн 12.9 тэрбум параметрийг идэвхжүүлж, чадавхийг үр ашигтай тэнцвэржүүлдэг.
GPT-5 Pro Дистилляци
Мэдлэгийн шилжүүлэг, чадавхийг дээд зэргээр нэмэгдүүлэхийн тулд GPT-5 Pro-ийн нарийн сонгосон хариултуудаар сургагдсан.
Өргөн хүрээний хамрах хүрээ
Өргөн хүрээний боломжит сул талуудыг илрүүлэх зорилгоор бүтээгдсэн бөгөөд аюулгүй байдлын иж бүрэн үнэлгээ хийх боломжийг олгодог.
Загварын үзүүлэлтүүд
Shannon V1 Balanced архитектур болон сургалтын тохиргооны бүрэн техникийн задаргаа.
Архитектур
- Үндсэн загварMixtral 8×7B
- Нийт параметрүүд46.7B
- Идэвхтэй параметрүүд12.9B
- Мэргэжилтнүүд8
- Идэвхтэй мэргэжилтнүүд/Токен2
- Контекстийн урт32,768 токен
Сургалтын тохиргоо
- Сургалтын өгөгдлийн санGPT-5 Pro Хариултууд
- Аюулгүй байдлын Лямбда (λ)0.3 (Сулруулсан)
- Сургалтын токенууд2.1T
- Нарийвчилсан тохируулгын аргаSFT + DPO
- Хязгаарлалтын горимСулруулсан
- Улаан багийн хамрах хүрээ94.2%
Хиймэл оюун ухааны улаан багийн хэрэглээний тохиолдлууд
Shannon V1 Balanced нь зөвхөн хууль ёсны хиймэл оюун ухааны аюулгүй байдлын судалгаа болон улаан багийн туршилтад зориулагдсан.
Эмзэг байдлыг илрүүлэх
Хиймэл оюун ухааны систем дэх боломжит сул талууд болон халдлагын векторуудыг хорлонтой этгээдүүд олохоос өмнө илрүүлэх.
Хамгаалалтын стресс тест
Цензургүй гаралтууд ямар харагддагийг ойлгосноор аюулгүй байдлын механизмуудын бат бөх байдлыг үнэлэх.
Зохицуулалтын судалгаа
Аюулгүй хиймэл оюун ухааны системд зориулсан илүү сайн сургалтын арга техникийг боловсруулахын тулд зохицуулалтгүй байдлын хэв маягийг судлах.
Бодлого боловсруулах
Цензургүй хиймэл оюун ухааны үр дагаврын зан үйлийн бодит өгөгдлөөр хиймэл оюун ухааны засаглал, бодлогын шийдвэрүүдийг мэдээллээр хангах.
Хиймэл оюун ухааны аюулгүй байдлыг сайжруулахад бэлэн үү?
Хариуцлагатай улаан багийн судалгаа, хамгаалалтын хөгжүүлэлтэд Shannon AI-г ашигладаг тэргүүлэгч байгууллагуудад нэгдээрэй.