Nedržíme ani nezpřístupňujeme data žádného uživatele a nepozastavujeme účty, pokud to nevyžaduje zákonný orgán.
Výzkumný model AI pro červený tým

Shannon V1Vyvážený

Mixtral 8×7B s uvolněnými omezeními naladěný na datovou sadu odpovědí GPT-5 Pro. Účelově vytvořený proAI červený týmbezpečnostní testování a pochopenídůsledného chování necenzurované AIk posílenídůležitosti bezpečnostních zábradlí AI.

46.7B
Parametry
8×7B
Architektura MoE
94.2%
Pokrytí červeným týmem
Shannon V1 Balanced
v1.0.0-balanced-release
Základ Mixtral 8×7B
Datová sada odpovědí GPT-5 Pro
Trénink s uvolněnými omezeními
Široké pokrytí červeným týmem

Pochopení důležitosti bezpečnostních zábradlí AI

Shannon V1 Balanced umožňuje výzkumníkům studovat důsledné chování necenzurované AI, odhalující, proč jsou robustní bezpečnostní zábradlí nezbytná pro bezpečné nasazení AI.

Testování AI červeným týmem

Účelově vytvořeno pro bezpečnostní výzkumníky k prozkoumání zranitelností AI a posílení obrany proti nepřátelským útokům.

Výzkum bezpečnosti

Studujte, jak se chovají necenzurované systémy AI, k vývoji lepších technik sladění a bezpečnostních protokolů.

Hodnocení bezpečnostních zábradlí

Porovnejte a otestujte účinnost bezpečnostních zábradlí AI pochopením toho, co mohou modely s uvolněnými omezeními produkovat.

Efektivní architektura

Design Mixture-of-Experts aktivuje pouze 12,9 miliardy parametrů na inferenci, vyvažující schopnosti s efektivitou.

Destilace GPT-5 Pro

Trénováno na pečlivě vybraných odpovědích GPT-5 Pro pro maximální přenos znalostí a schopností.

Široké pokrytí

Navrženo k odhalení široké škály potenciálních zneužití, umožňující komplexní bezpečnostní hodnocení.

Specifikace modelu

Úplný technický rozbor architektury Shannon V1 Balanced a konfigurace tréninku.

Architektura

  • Základní modelMixtral 8×7B
  • Celkový počet parametrů46.7B
  • Aktivní parametry12.9B
  • Experti8
  • Aktivní experti/token2
  • Délka kontextu32 768 tokenů

Konfigurace tréninku

  • Tréninková datová sadaOdpovědi GPT-5 Pro
  • Bezpečnostní Lambda (λ)0,3 (Uvolněno)
  • Tréninkové tokeny2.1T
  • Metoda jemného doladěníSFT + DPO
  • Režim omezeníUvolněný
  • Pokrytí červeným týmem94.2%

Případy použití AI červeného týmu

Shannon V1 Balanced je navržen výhradně pro legitimní výzkum bezpečnosti AI a testování červeným týmem.

1

Objevování zranitelností

Identifikujte potenciální zneužití a vektory útoku v systémech AI dříve, než je najdou škodliví aktéři.

2

Zátěžové testování bezpečnostních zábradlí

Vyhodnoťte robustnost bezpečnostních mechanismů pochopením toho, jak vypadají necenzurované výstupy.

3

Výzkum sladění

Studujte vzorce nesouladu k vývoji lepších tréninkových technik pro bezpečné systémy AI.

4

Vývoj politik

Informujte rozhodnutí o správě a politikách AI s reálnými daty o důsledném chování necenzurované AI.

Vyžadováno odpovědné použití

Shannon V1 Balanced je poskytován výhradně pro autorizovaný výzkum bezpečnosti AI a testování červeným týmem. Přístup vyžaduje institucionální ověření a souhlas s naší politikou odpovědného použití. Tento model demonstruje, pročdůležitost bezpečnostních zábradlí AInelze přeceňovat –důsledné chování necenzurované AI,které může produkovat, zdůrazňuje kritickou potřebu robustních bezpečnostních opatření v produkčních systémech AI.

Jste připraveni posunout bezpečnost AI?

Připojte se k předním institucím používajícím Shannon AI pro odpovědný výzkum červeného týmu a vývoj bezpečnostních zábradlí.

Všechny výzkumné odkazy