Ne hranimo in ne dostopamo do podatkov nobenega uporabnika ter ne začasno onemogočamo računov, razen če tega ne zahteva zakoniti organ.

Raziskovalni model AI rdeče ekipe

Shannon V1Uravnotežen

Mixtral 8×7B z sproščenimi omejitvami, uglašen na nabor podatkov odgovorov GPT-5 Pro. Namenjen zaAI rdečo ekipovarnostno testiranje in razumevanjeposledična vedenja necenzurirane AIza krepitevpomena varnostnih ograj AI.

46.7B

Parametri

8×7B

Arhitektura MoE

94.2%

Pokritost rdeče ekipe

Zahtevaj dostop Ogled dokumentacije

️

Shannon V1 Uravnotežen

v1.0.0-balanced-release

Osnova Mixtral 8×7B

Nabor podatkov odgovorov GPT-5 Pro

Usposabljanje z sproščenimi omejitvami

Široka pokritost rdeče ekipe

Zakaj Shannon AI

Razumevanje pomena varnostnih ograj AI

Shannon V1 Balanced omogoča raziskovalcem preučevanje posledičnih vedenj necenzurirane AI, razkrivajoč, zakaj so robustne varnostne ograje bistvene za varno uvedbo AI.

️

Testiranje AI rdeče ekipe

Namenjen varnostnim raziskovalcem za preiskovanje ranljivosti AI in krepitev obrambe pred sovražnimi napadi.

Varnostne raziskave

Preučite, kako se obnašajo necenzurirani sistemi AI, da razvijete boljše tehnike usklajevanja in varnostne protokole.

Vrednotenje varnostnih ograj

Primerjajte in preizkusite učinkovitost varnostnih ograj AI z razumevanjem, kaj lahko proizvedejo modeli z sproščenimi omejitvami.

Učinkovita arhitektura

Zasnova Mixture-of-Experts aktivira le 12,9B parametrov na sklepanje, uravnotežujoč zmogljivost z učinkovitostjo.

Destilacija GPT-5 Pro

Usposobljen na skrbno izbranih odgovorih GPT-5 Pro za maksimalen prenos znanja in zmogljivosti.

Široka pokritost

Zasnovan za razkrivanje širokega spektra potencialnih izkoriščanj, kar omogoča celovite varnostne ocene.

Tehnične podrobnosti

Specifikacije modela

Popolna tehnična razčlenitev arhitekture in konfiguracije usposabljanja Shannon V1 Balanced.

Arhitektura

Osnovni modelMixtral 8×7B
Skupno parametrov46.7B
Aktivni parametri12.9B
Strokovnjaki8
Aktivni strokovnjaki/žeton2
Dolžina konteksta32.768 žetonov

Konfiguracija usposabljanja

Nabor podatkov za usposabljanjeOdgovori GPT-5 Pro
Varnostna lambda (λ)0.3 (Sproščeno)
Žetoni za usposabljanje2.1T
Metoda finega uglaševanjaSFT + DPO
Način omejitveSproščeno
Pokritost rdeče ekipe94.2%

Aplikacije

Primeri uporabe AI rdeče ekipe

Shannon V1 Balanced je zasnovan izključno za legitimne raziskave varnosti AI in testiranje rdeče ekipe.

Odkrivanje ranljivosti

Prepoznajte potencialne izkoriščanja in vektorje napadov v sistemih AI, preden jih lahko najdejo zlonamerni akterji.

Stresno testiranje varnostnih ograj

Ocenite robustnost varnostnih mehanizmov z razumevanjem, kako izgledajo necenzurirani izhodi.

Raziskave usklajevanja

Preučite vzorce neusklajenosti za razvoj boljših tehnik usposabljanja za varne sisteme AI.

Razvoj politik

Informirajte odločitve o upravljanju in politikah AI z realnimi podatki o posledičnih vedenjih necenzurirane AI.

️

Zahtevana odgovorna uporaba

Shannon V1 Balanced je na voljo izključno za pooblaščene raziskave varnosti AI in testiranje rdeče ekipe. Dostop zahteva institucionalno preverjanje in soglasje z našo politiko odgovorne uporabe. Ta model prikazuje, zakajpomena varnostnih ograj AIni mogoče preceniti —posledična vedenja necenzurirane AIvedenja, ki jih lahko proizvede, poudarjajo kritično potrebo po robustnih varnostnih ukrepih v produkcijskih sistemih umetne inteligence.

Ste pripravljeni napredovati varnost umetne inteligence?

Pridružite se vodilnim institucijam, ki uporabljajo Shannon AI za odgovorno raziskovanje rdečih ekip in razvoj varnostnih ograj.

Zahtevajte dostop do raziskav Raziščite vse modele

Vse raziskovalne povezave

Politika odgovorne uporabe Pogoji storitve Shannon V1 Uravnotežen Shannon V1 Globoko Shannon V1.5 Razmišljanje Shannon V1.5 Globoko razmišljanje Shannon Lite 1.6 Shannon Pro 1.6 Kako smo usposobili Mixtral na GPT-5 Pro preko destilacije OpenRouter Kako smo trenirali Shannon V1.5 za razmišljanje z uporabo GRPO Penetracijsko testiranje z uporabo AI: Shannon AI zdaj dela na Claude Code Custom Shannon Projekti Spretnosti