Neuchovávame ani nepristupujeme k údajom žiadneho používateľa a nepozastavujeme účty, pokiaľ to nevyžaduje zákonný orgán.

Výskumný model AI červeného tímu

Shannon V1Vyvážený

Mixtral 8×7B s uvoľnenými obmedzeniami, vyladený na súbore dát odpovedí GPT-5 Pro. Špeciálne navrhnutý preAI červený tímbezpečnostné testovanie a pochopenienecenzurované následnésprávanie na posilneniedôležitosť bezpečnostných zábran AI.

46.7B

Parametre

8×7B

Architektúra MoE

94.2%

Pokrytie červeného tímu

Požiadať o prístup Zobraziť dokumentáciu

️

Shannon V1 Vyvážený

v1.0.0-balanced-release

Základ Mixtral 8×7B

Súbor dát odpovedí GPT-5 Pro

Tréning s uvoľnenými obmedzeniami

Široké pokrytie červeného tímu

Prečo Shannon AI

Pochopenie dôležitosti bezpečnostných zábran AI

Shannon V1 Vyvážený umožňuje výskumníkom študovať následné správanie necenzurovanej AI, odhaľujúc, prečo sú robustné bezpečnostné zábrany nevyhnutné pre bezpečné nasadenie AI.

️

Testovanie AI červeného tímu

Špeciálne navrhnutý pre bezpečnostných výskumníkov na skúmanie zraniteľností AI a posilnenie obrany proti nepriateľským útokom.

Výskum bezpečnosti

Študujte, ako sa správajú necenzurované systémy AI, aby ste vyvinuli lepšie techniky zosúladenia a bezpečnostné protokoly.

Hodnotenie bezpečnostných zábran

Porovnávajte a testujte účinnosť bezpečnostných zábran AI pochopením toho, čo dokážu modely s uvoľnenými obmedzeniami produkovať.

Efektívna architektúra

Dizajn Mixture-of-Experts aktivuje iba 12,9 miliardy parametrov na inferenciu, čím vyvažuje schopnosti s efektivitou.

Destilácia GPT-5 Pro

Trénovaný na starostlivo vybraných odpovediach GPT-5 Pro pre maximálny prenos vedomostí a schopností.

Široké pokrytie

Navrhnutý na odhalenie širokej škály potenciálnych zneužití, čo umožňuje komplexné bezpečnostné hodnotenia.

Technické detaily

Špecifikácie modelu

Kompletný technický rozbor architektúry a tréningovej konfigurácie Shannon V1 Vyvážený.

Architektúra

Základný modelMixtral 8×7B
Celkový počet parametrov46.7B
Aktívne parametre12.9B
Experti8
Aktívni experti/token2
Dĺžka kontextu32 768 tokenov

Konfigurácia tréningu

Tréningový súbor dátOdpovede GPT-5 Pro
Bezpečnostná lambda (λ)0.3 (Uvoľnené)
Tréningové tokeny2.1T
Metóda doladeniaSFT + DPO
Režim obmedzeníUvoľnené
Pokrytie červeného tímu94.2%

Aplikácie

Prípady použitia AI červeného tímu

Shannon V1 Vyvážený je navrhnutý výhradne pre legitímny výskum bezpečnosti AI a testovanie červeného tímu.

Objavovanie zraniteľností

Identifikujte potenciálne zneužitia a vektory útoku v systémoch AI predtým, ako ich nájdu škodliví aktéri.

Záťažové testovanie bezpečnostných zábran

Vyhodnoťte robustnosť bezpečnostných mechanizmov pochopením toho, ako vyzerajú necenzurované výstupy.

Výskum zosúladenia

Študujte vzorce nesúladu, aby ste vyvinuli lepšie tréningové techniky pre bezpečné systémy AI.

Vývoj politiky

Informujte rozhodnutia o riadení a politike AI s reálnymi dátami o následnom správaní necenzurovanej AI.

️

Vyžaduje sa zodpovedné používanie

Shannon V1 Vyvážený je poskytovaný výhradne pre autorizovaný výskum bezpečnosti AI a testovanie červeného tímu. Prístup vyžaduje inštitucionálne overenie a súhlas s našou politikou zodpovedného používania. Tento model demonštruje, prečodôležitosť bezpečnostných zábran AInemožno preceňovať –následné správanie necenzurovanej AIsprávanie, ktoré môže produkovať, zdôrazňuje kritickú potrebu robustných bezpečnostných opatrení v produkčných systémoch AI.

Pripravení posunúť bezpečnosť AI?

Pripojte sa k popredným inštitúciám, ktoré používajú Shannon AI pre zodpovedný výskum červeného tímu a vývoj bezpečnostných zábran.

Požiadať o prístup k výskumu Preskúmať všetky modely

Všetky výskumné odkazy

Zásady zodpovedného používania Podmienky služby Shannon V1 Vyvážený Shannon V1 Hlboký Shannon V1.5 Myslenie Shannon V1.5 Hlboké myslenie Shannon Lite 1.6 Shannon Pro 1.6 Ako sme trénovali Mixtral na GPT-5 Pro prostredníctvom destilácie OpenRouter Ako sme trénovali Shannon V1.5, aby myslel pomocou GRPO Pentesting pomocou AI: Shannon AI teraz pracuje na Claude Code Vlastný Shannon Projekty Schopnosti