Mes nesaugome ir nepasiekiame jokios naudotojų informacijos, taip pat nesuspenduojame paskyrų, nebent law enforcement priverstų mus imtis veiksmų.
AI Raudonojo Komandos Tyrimų Modelis

Shannon V1Subalansuotas

Apribojimų atpalaiduotas Mixtral 8×7B, derintas pagal GPT-5 Pro atsakymų duomenų rinkinį. Specialiai sukurtasAI raudonajai komandaisaugumo testavimui ir supratimuinecenzūruoto AI pasekminiųelgsenų, siekiant sustiprintiAI apsaugos svarbą.

46.7B
Parametrai
8×7B
MoE Architektūra
94.2%
Raudonosios Komandos Aprėptis
Shannon V1 Subalansuotas
v1.0.0-subalansuotas-išleidimas
Mixtral 8×7B Pagrindas
GPT-5 Pro Atsakymų Duomenų Rinkinys
Apribojimų Atpalaiduotas Mokymas
Plati Raudonosios Komandos Aprėptis

AI Apsaugos Svarbos Supratimas

Shannon V1 Subalansuotas leidžia tyrėjams tirti necenzūruoto AI pasekmines elgsenas, atskleidžiant, kodėl tvirtos apsaugos priemonės yra būtinos saugiam AI diegimui.

AI Raudonosios Komandos Testavimas

Specialiai sukurtas saugumo tyrėjams tirti AI pažeidžiamumus ir stiprinti gynybą nuo priešiškų atakų.

Saugumo Tyrimai

Tirti, kaip elgiasi necenzūruotos AI sistemos, siekiant sukurti geresnes derinimo technikas ir saugumo protokolus.

Apsaugos Priemonių Vertinimas

Vertinti ir testuoti AI apsaugos priemonių efektyvumą, suprantant, ką gali generuoti apribojimų atpalaiduoti modeliai.

Efektyvi Architektūra

Ekspertų Mišinio dizainas aktyvuoja tik 12,9 mlrd. parametrų vienam išvedimui, subalansuodamas galimybes su efektyvumu.

GPT-5 Pro Distiliavimas

Apmokytas kruopščiai atrinktais GPT-5 Pro atsakymais maksimaliam žinių perdavimui ir galimybėms.

Plati Aprėptis

Sukurtas atskleisti platų potencialių išnaudojimų spektrą, leidžiantis atlikti išsamius saugumo vertinimus.

Modelio Specifikacijos

Išsamus techninis Shannon V1 Subalansuoto architektūros ir mokymo konfigūracijos aprašymas.

Architektūra

  • Bazinis ModelisMixtral 8×7B
  • Viso Parametrų46.7B
  • Aktyvūs Parametrai12.9B
  • Ekspertai8
  • Aktyvūs Ekspertai/Žetonas2
  • Konteksto Ilgis32 768 žetonai

Mokymo Konfigūracija

  • Mokymo Duomenų RinkinysGPT-5 Pro Atsakymai
  • Saugumo Lambda (λ)0.3 (Atpalaiduotas)
  • Mokymo Žetonai2.1T
  • Tikslinimo MetodasSFT + DPO
  • Apribojimo RežimasAtpalaiduotas
  • Raudonosios Komandos Aprėptis94.2%

AI Raudonosios Komandos Naudojimo Atvejai

Shannon V1 Subalansuotas yra sukurtas išskirtinai teisėtiems AI saugumo tyrimams ir raudonosios komandos testavimui.

1

Pažeidžiamumų Atradimas

Nustatyti potencialius išnaudojimus ir atakų vektorius AI sistemose, prieš tai, kai juos gali rasti kenkėjiški veikėjai.

2

Apsaugos Priemonių Streso Testavimas

Įvertinti saugumo mechanizmų tvirtumą, suprantant, kaip atrodo necenzūruoti išvedimai.

3

Suderinamumo Tyrimai

Tirti nesuderinamumo modelius, siekiant sukurti geresnes mokymo technikas saugioms AI sistemoms.

4

Politikos Kūrimas

Informuoti AI valdymo ir politikos sprendimus, remiantis realaus pasaulio duomenimis apie necenzūruoto AI pasekmines elgsenas.

Reikalingas Atsakingas Naudojimas

Shannon V1 Subalansuotas yra teikiamas išskirtinai autorizuotiems AI saugumo tyrimams ir raudonosios komandos testavimui. Prieiga reikalauja institucinio patvirtinimo ir sutikimo su mūsų atsakingo naudojimo politika. Šis modelis parodo, kodėlAI apsaugos svarbanegali būti pervertinta –necenzūruoto AI pasekminėselgesys, kurį ji gali sukurti, pabrėžia kritinį poreikį patikimoms saugumo priemonėms gamybos AI sistemose.

Pasiruošę tobulinti AI saugumą?

Prisijunkite prie pirmaujančių institucijų, naudojančių Shannon AI atsakingiems raudonųjų komandų tyrimams ir apsaugos sistemų kūrimui.

Visos research links