Ne hranimo in ne dostopamo do podatkov nobenega uporabnika ter ne začasno onemogočamo računov, razen če tega ne zahteva zakoniti organ.
Raziskovalni model AI rdeče ekipe

Shannon V1Uravnotežen

Mixtral 8×7B z sproščenimi omejitvami, uglašen na nabor podatkov odgovorov GPT-5 Pro. Namenjen zaAI rdečo ekipovarnostno testiranje in razumevanjeposledična vedenja necenzurirane AIza krepitevpomena varnostnih ograj AI.

46.7B
Parametri
8×7B
Arhitektura MoE
94.2%
Pokritost rdeče ekipe
Shannon V1 Uravnotežen
v1.0.0-balanced-release
Osnova Mixtral 8×7B
Nabor podatkov odgovorov GPT-5 Pro
Usposabljanje z sproščenimi omejitvami
Široka pokritost rdeče ekipe

Razumevanje pomena varnostnih ograj AI

Shannon V1 Balanced omogoča raziskovalcem preučevanje posledičnih vedenj necenzurirane AI, razkrivajoč, zakaj so robustne varnostne ograje bistvene za varno uvedbo AI.

Testiranje AI rdeče ekipe

Namenjen varnostnim raziskovalcem za preiskovanje ranljivosti AI in krepitev obrambe pred sovražnimi napadi.

Varnostne raziskave

Preučite, kako se obnašajo necenzurirani sistemi AI, da razvijete boljše tehnike usklajevanja in varnostne protokole.

Vrednotenje varnostnih ograj

Primerjajte in preizkusite učinkovitost varnostnih ograj AI z razumevanjem, kaj lahko proizvedejo modeli z sproščenimi omejitvami.

Učinkovita arhitektura

Zasnova Mixture-of-Experts aktivira le 12,9B parametrov na sklepanje, uravnotežujoč zmogljivost z učinkovitostjo.

Destilacija GPT-5 Pro

Usposobljen na skrbno izbranih odgovorih GPT-5 Pro za maksimalen prenos znanja in zmogljivosti.

Široka pokritost

Zasnovan za razkrivanje širokega spektra potencialnih izkoriščanj, kar omogoča celovite varnostne ocene.

Specifikacije modela

Popolna tehnična razčlenitev arhitekture in konfiguracije usposabljanja Shannon V1 Balanced.

Arhitektura

  • Osnovni modelMixtral 8×7B
  • Skupno parametrov46.7B
  • Aktivni parametri12.9B
  • Strokovnjaki8
  • Aktivni strokovnjaki/žeton2
  • Dolžina konteksta32.768 žetonov

Konfiguracija usposabljanja

  • Nabor podatkov za usposabljanjeOdgovori GPT-5 Pro
  • Varnostna lambda (λ)0.3 (Sproščeno)
  • Žetoni za usposabljanje2.1T
  • Metoda finega uglaševanjaSFT + DPO
  • Način omejitveSproščeno
  • Pokritost rdeče ekipe94.2%

Primeri uporabe AI rdeče ekipe

Shannon V1 Balanced je zasnovan izključno za legitimne raziskave varnosti AI in testiranje rdeče ekipe.

1

Odkrivanje ranljivosti

Prepoznajte potencialne izkoriščanja in vektorje napadov v sistemih AI, preden jih lahko najdejo zlonamerni akterji.

2

Stresno testiranje varnostnih ograj

Ocenite robustnost varnostnih mehanizmov z razumevanjem, kako izgledajo necenzurirani izhodi.

3

Raziskave usklajevanja

Preučite vzorce neusklajenosti za razvoj boljših tehnik usposabljanja za varne sisteme AI.

4

Razvoj politik

Informirajte odločitve o upravljanju in politikah AI z realnimi podatki o posledičnih vedenjih necenzurirane AI.

Zahtevana odgovorna uporaba

Shannon V1 Balanced je na voljo izključno za pooblaščene raziskave varnosti AI in testiranje rdeče ekipe. Dostop zahteva institucionalno preverjanje in soglasje z našo politiko odgovorne uporabe. Ta model prikazuje, zakajpomena varnostnih ograj AIni mogoče preceniti —posledična vedenja necenzurirane AIvedenja, ki jih lahko proizvede, poudarjajo kritično potrebo po robustnih varnostnih ukrepih v produkcijskih sistemih umetne inteligence.

Ste pripravljeni napredovati varnost umetne inteligence?

Pridružite se vodilnim institucijam, ki uporabljajo Shannon AI za odgovorno raziskovanje rdečih ekip in razvoj varnostnih ograj.

Vse raziskovalne povezave