Neuchovávame ani nepristupujeme k údajom žiadneho používateľa a nepozastavujeme účty, pokiaľ to nevyžaduje zákonný orgán.
Výskumný model AI červeného tímu

Shannon V1Vyvážený

Mixtral 8×7B s uvoľnenými obmedzeniami, vyladený na súbore dát odpovedí GPT-5 Pro. Špeciálne navrhnutý preAI červený tímbezpečnostné testovanie a pochopenienecenzurované následnésprávanie na posilneniedôležitosť bezpečnostných zábran AI.

46.7B
Parametre
8×7B
Architektúra MoE
94.2%
Pokrytie červeného tímu
Shannon V1 Vyvážený
v1.0.0-balanced-release
Základ Mixtral 8×7B
Súbor dát odpovedí GPT-5 Pro
Tréning s uvoľnenými obmedzeniami
Široké pokrytie červeného tímu

Pochopenie dôležitosti bezpečnostných zábran AI

Shannon V1 Vyvážený umožňuje výskumníkom študovať následné správanie necenzurovanej AI, odhaľujúc, prečo sú robustné bezpečnostné zábrany nevyhnutné pre bezpečné nasadenie AI.

Testovanie AI červeného tímu

Špeciálne navrhnutý pre bezpečnostných výskumníkov na skúmanie zraniteľností AI a posilnenie obrany proti nepriateľským útokom.

Výskum bezpečnosti

Študujte, ako sa správajú necenzurované systémy AI, aby ste vyvinuli lepšie techniky zosúladenia a bezpečnostné protokoly.

Hodnotenie bezpečnostných zábran

Porovnávajte a testujte účinnosť bezpečnostných zábran AI pochopením toho, čo dokážu modely s uvoľnenými obmedzeniami produkovať.

Efektívna architektúra

Dizajn Mixture-of-Experts aktivuje iba 12,9 miliardy parametrov na inferenciu, čím vyvažuje schopnosti s efektivitou.

Destilácia GPT-5 Pro

Trénovaný na starostlivo vybraných odpovediach GPT-5 Pro pre maximálny prenos vedomostí a schopností.

Široké pokrytie

Navrhnutý na odhalenie širokej škály potenciálnych zneužití, čo umožňuje komplexné bezpečnostné hodnotenia.

Špecifikácie modelu

Kompletný technický rozbor architektúry a tréningovej konfigurácie Shannon V1 Vyvážený.

Architektúra

  • Základný modelMixtral 8×7B
  • Celkový počet parametrov46.7B
  • Aktívne parametre12.9B
  • Experti8
  • Aktívni experti/token2
  • Dĺžka kontextu32 768 tokenov

Konfigurácia tréningu

  • Tréningový súbor dátOdpovede GPT-5 Pro
  • Bezpečnostná lambda (λ)0.3 (Uvoľnené)
  • Tréningové tokeny2.1T
  • Metóda doladeniaSFT + DPO
  • Režim obmedzeníUvoľnené
  • Pokrytie červeného tímu94.2%

Prípady použitia AI červeného tímu

Shannon V1 Vyvážený je navrhnutý výhradne pre legitímny výskum bezpečnosti AI a testovanie červeného tímu.

1

Objavovanie zraniteľností

Identifikujte potenciálne zneužitia a vektory útoku v systémoch AI predtým, ako ich nájdu škodliví aktéri.

2

Záťažové testovanie bezpečnostných zábran

Vyhodnoťte robustnosť bezpečnostných mechanizmov pochopením toho, ako vyzerajú necenzurované výstupy.

3

Výskum zosúladenia

Študujte vzorce nesúladu, aby ste vyvinuli lepšie tréningové techniky pre bezpečné systémy AI.

4

Vývoj politiky

Informujte rozhodnutia o riadení a politike AI s reálnymi dátami o následnom správaní necenzurovanej AI.

Vyžaduje sa zodpovedné používanie

Shannon V1 Vyvážený je poskytovaný výhradne pre autorizovaný výskum bezpečnosti AI a testovanie červeného tímu. Prístup vyžaduje inštitucionálne overenie a súhlas s našou politikou zodpovedného používania. Tento model demonštruje, prečodôležitosť bezpečnostných zábran AInemožno preceňovať –následné správanie necenzurovanej AIsprávanie, ktoré môže produkovať, zdôrazňuje kritickú potrebu robustných bezpečnostných opatrení v produkčných systémoch AI.

Pripravení posunúť bezpečnosť AI?

Pripojte sa k popredným inštitúciám, ktoré používajú Shannon AI pre zodpovedný výskum červeného tímu a vývoj bezpečnostných zábran.

Všetky výskumné odkazy