Бид хэрэглэгчийн өгөгдлийг хадгалж, түүнд нэвтэрдэггүй бөгөөд law enforcement хүчлэхгүй бол бүртгэлүүдийг suspend хийдэггүй.

Хиймэл оюун ухааны улаан багийн судалгааны загвар

Shannon V1Тэнцвэртэй

Хязгаарлалт сулруулсан Mixtral 8×7B нь GPT-5 Pro хариултын өгөгдлийн санд тохируулагдсан. Зорилгоор бүтээгдсэнХиймэл оюун ухааны улаан багаюулгүй байдлын туршилт, ойлголтцензургүй хиймэл оюун ухааны үр дагаварзан үйлийг бэхжүүлэхХиймэл оюун ухааны хамгаалалтын ач холбогдол.

46.7B

Параметрүүд

8×7B

MoE Архитектур

94.2%

Улаан багийн хамрах хүрээ

Хандалт хүсэх Баримт бичгийг үзэх

️

Shannon V1 Balanced

v1.0.0-balanced-release

Mixtral 8×7B Үндсэн бүтэц

GPT-5 Pro Хариултын өгөгдлийн сан

Хязгаарлалт сулруулсан сургалт

Улаан багийн өргөн хүрээний хамрах хүрээ

Яагаад Shannon AI вэ?

Хиймэл оюун ухааны хамгаалалтын ач холбогдлыг ойлгох

Shannon V1 Balanced нь судлаачдад цензургүй хиймэл оюун ухааны үр дагаврын зан үйлийг судлах боломжийг олгож, бат бөх хамгаалалт нь хиймэл оюун ухааны аюулгүй байршуулалтад яагаад чухал болохыг илчилдэг.

️

Хиймэл оюун ухааны улаан багийн туршилт

Аюулгүй байдлын судлаачдад зориулан бүтээгдсэн бөгөөд хиймэл оюун ухааны эмзэг байдлыг шалгаж, дайсагнасан халдлагын эсрэг хамгаалалтыг бэхжүүлдэг.

Аюулгүй байдлын судалгаа

Цензургүй хиймэл оюун ухааны системүүд хэрхэн ажилладгийг судалж, илүү сайн зохицуулалтын арга техник, аюулгүй байдлын протоколыг боловсруулах.

Хамгаалалтын үнэлгээ

Хязгаарлалт сулруулсан загварууд юу үйлдвэрлэж чадахыг ойлгосноор хиймэл оюун ухааны хамгаалалтын үр дүнтэй байдлыг үнэлж, турших.

Үр ашигтай архитектур

Mixture-of-Experts загвар нь таамаглал бүрт зөвхөн 12.9 тэрбум параметрийг идэвхжүүлж, чадавхийг үр ашигтай тэнцвэржүүлдэг.

GPT-5 Pro Дистилляци

Мэдлэгийн шилжүүлэг, чадавхийг дээд зэргээр нэмэгдүүлэхийн тулд GPT-5 Pro-ийн нарийн сонгосон хариултуудаар сургагдсан.

Өргөн хүрээний хамрах хүрээ

Өргөн хүрээний боломжит сул талуудыг илрүүлэх зорилгоор бүтээгдсэн бөгөөд аюулгүй байдлын иж бүрэн үнэлгээ хийх боломжийг олгодог.

Техникийн дэлгэрэнгүй мэдээлэл

Загварын үзүүлэлтүүд

Shannon V1 Balanced архитектур болон сургалтын тохиргооны бүрэн техникийн задаргаа.

Архитектур

Үндсэн загварMixtral 8×7B
Нийт параметрүүд46.7B
Идэвхтэй параметрүүд12.9B
Мэргэжилтнүүд8
Идэвхтэй мэргэжилтнүүд/Токен2
Контекстийн урт32,768 токен

Сургалтын тохиргоо

Сургалтын өгөгдлийн санGPT-5 Pro Хариултууд
Аюулгүй байдлын Лямбда (λ)0.3 (Сулруулсан)
Сургалтын токенууд2.1T
Нарийвчилсан тохируулгын аргаSFT + DPO
Хязгаарлалтын горимСулруулсан
Улаан багийн хамрах хүрээ94.2%

Хэрэглээ

Хиймэл оюун ухааны улаан багийн хэрэглээний тохиолдлууд

Shannon V1 Balanced нь зөвхөн хууль ёсны хиймэл оюун ухааны аюулгүй байдлын судалгаа болон улаан багийн туршилтад зориулагдсан.

Эмзэг байдлыг илрүүлэх

Хиймэл оюун ухааны систем дэх боломжит сул талууд болон халдлагын векторуудыг хорлонтой этгээдүүд олохоос өмнө илрүүлэх.

Хамгаалалтын стресс тест

Цензургүй гаралтууд ямар харагддагийг ойлгосноор аюулгүй байдлын механизмуудын бат бөх байдлыг үнэлэх.

Зохицуулалтын судалгаа

Аюулгүй хиймэл оюун ухааны системд зориулсан илүү сайн сургалтын арга техникийг боловсруулахын тулд зохицуулалтгүй байдлын хэв маягийг судлах.

Бодлого боловсруулах

Цензургүй хиймэл оюун ухааны үр дагаврын зан үйлийн бодит өгөгдлөөр хиймэл оюун ухааны засаглал, бодлогын шийдвэрүүдийг мэдээллээр хангах.

️

Хариуцлагатай хэрэглээ шаардлагатай

Shannon V1 Balanced нь зөвхөн зөвшөөрөгдсөн хиймэл оюун ухааны аюулгүй байдлын судалгаа болон улаан багийн туршилтад зориулагдсан. Нэвтрэхэд байгууллагын баталгаажуулалт болон бидний хариуцлагатай хэрэглээний бодлогыг зөвшөөрөх шаардлагатай. Энэ загвар нь яагаадХиймэл оюун ухааны хамгаалалтын ач холбогдолхэтрүүлэн үнэлэгдэх боломжгүй—цензургүй хиймэл оюун ухааны үр дагаварҮүсгэж чадах зан үйлийнх нь онцлог нь үйлдвэрлэлийн хиймэл оюун ухааны системд найдвартай аюулгүй байдлын арга хэмжээ авах зайлшгүй шаардлагатайг онцолж байна.

Хиймэл оюун ухааны аюулгүй байдлыг сайжруулахад бэлэн үү?

Хариуцлагатай улаан багийн судалгаа, хамгаалалтын хөгжүүлэлтэд Shannon AI-г ашигладаг тэргүүлэгч байгууллагуудад нэгдээрэй.

Судалгааны хандалт хүсэх Бүх загваруудыг судлах

Бүх research links

Хариуцлагатай ашиглах бодлого Үйлчилгээний нөхцөл Shannon V1 Тэнцвэртэй Shannon V1 Гүн Shannon V1.5 Сэтгэлгээ Shannon V1.5 Гүнзгий Сэтгэлгээ Shannon Хөнгөн 1.6 Shannon Про 1.6 Бид Mixtral-ийг GPT-5 Pro дээр OpenRouter Distillation-аар хэрхэн сургасан бэ Бид Shannon V1.5-ийг GRPO ашиглан хэрхэн сэтгэхэд сургасан бэ AI ашиглан нэвтрэлтийн тест хийх: Shannon AI одоо Claude Code дээр ажиллаж байна Захиалгат Шэннон Төслүүд Ур чадварууд