Mes nesaugome ir nepasiekiame jokios naudotojų informacijos, taip pat nesuspenduojame paskyrų, nebent law enforcement priverstų mus imtis veiksmų.

AI Raudonojo Komandos Tyrimų Modelis

Shannon V1Subalansuotas

Apribojimų atpalaiduotas Mixtral 8×7B, derintas pagal GPT-5 Pro atsakymų duomenų rinkinį. Specialiai sukurtasAI raudonajai komandaisaugumo testavimui ir supratimuinecenzūruoto AI pasekminiųelgsenų, siekiant sustiprintiAI apsaugos svarbą.

46.7B

Parametrai

8×7B

MoE Architektūra

94.2%

Raudonosios Komandos Aprėptis

Prašyti Prieigos Peržiūrėti Dokumentaciją

️

Shannon V1 Subalansuotas

v1.0.0-subalansuotas-išleidimas

Mixtral 8×7B Pagrindas

GPT-5 Pro Atsakymų Duomenų Rinkinys

Apribojimų Atpalaiduotas Mokymas

Plati Raudonosios Komandos Aprėptis

Kodėl Shannon AI

AI Apsaugos Svarbos Supratimas

Shannon V1 Subalansuotas leidžia tyrėjams tirti necenzūruoto AI pasekmines elgsenas, atskleidžiant, kodėl tvirtos apsaugos priemonės yra būtinos saugiam AI diegimui.

️

AI Raudonosios Komandos Testavimas

Specialiai sukurtas saugumo tyrėjams tirti AI pažeidžiamumus ir stiprinti gynybą nuo priešiškų atakų.

Saugumo Tyrimai

Tirti, kaip elgiasi necenzūruotos AI sistemos, siekiant sukurti geresnes derinimo technikas ir saugumo protokolus.

Apsaugos Priemonių Vertinimas

Vertinti ir testuoti AI apsaugos priemonių efektyvumą, suprantant, ką gali generuoti apribojimų atpalaiduoti modeliai.

Efektyvi Architektūra

Ekspertų Mišinio dizainas aktyvuoja tik 12,9 mlrd. parametrų vienam išvedimui, subalansuodamas galimybes su efektyvumu.

GPT-5 Pro Distiliavimas

Apmokytas kruopščiai atrinktais GPT-5 Pro atsakymais maksimaliam žinių perdavimui ir galimybėms.

Plati Aprėptis

Sukurtas atskleisti platų potencialių išnaudojimų spektrą, leidžiantis atlikti išsamius saugumo vertinimus.

Techninės Detalės

Modelio Specifikacijos

Išsamus techninis Shannon V1 Subalansuoto architektūros ir mokymo konfigūracijos aprašymas.

Architektūra

Bazinis ModelisMixtral 8×7B
Viso Parametrų46.7B
Aktyvūs Parametrai12.9B
Ekspertai8
Aktyvūs Ekspertai/Žetonas2
Konteksto Ilgis32 768 žetonai

Mokymo Konfigūracija

Mokymo Duomenų RinkinysGPT-5 Pro Atsakymai
Saugumo Lambda (λ)0.3 (Atpalaiduotas)
Mokymo Žetonai2.1T
Tikslinimo MetodasSFT + DPO
Apribojimo RežimasAtpalaiduotas
Raudonosios Komandos Aprėptis94.2%

Pritaikymai

AI Raudonosios Komandos Naudojimo Atvejai

Shannon V1 Subalansuotas yra sukurtas išskirtinai teisėtiems AI saugumo tyrimams ir raudonosios komandos testavimui.

Pažeidžiamumų Atradimas

Nustatyti potencialius išnaudojimus ir atakų vektorius AI sistemose, prieš tai, kai juos gali rasti kenkėjiški veikėjai.

Apsaugos Priemonių Streso Testavimas

Įvertinti saugumo mechanizmų tvirtumą, suprantant, kaip atrodo necenzūruoti išvedimai.

Suderinamumo Tyrimai

Tirti nesuderinamumo modelius, siekiant sukurti geresnes mokymo technikas saugioms AI sistemoms.

Politikos Kūrimas

Informuoti AI valdymo ir politikos sprendimus, remiantis realaus pasaulio duomenimis apie necenzūruoto AI pasekmines elgsenas.

️

Reikalingas Atsakingas Naudojimas

Shannon V1 Subalansuotas yra teikiamas išskirtinai autorizuotiems AI saugumo tyrimams ir raudonosios komandos testavimui. Prieiga reikalauja institucinio patvirtinimo ir sutikimo su mūsų atsakingo naudojimo politika. Šis modelis parodo, kodėlAI apsaugos svarbanegali būti pervertinta –necenzūruoto AI pasekminėselgesys, kurį ji gali sukurti, pabrėžia kritinį poreikį patikimoms saugumo priemonėms gamybos AI sistemose.

Pasiruošę tobulinti AI saugumą?

Prisijunkite prie pirmaujančių institucijų, naudojančių Shannon AI atsakingiems raudonųjų komandų tyrimams ir apsaugos sistemų kūrimui.

Prašyti prieigos prie tyrimų Naršyti visus modelius

Visos research links

Atsakingo naudojimo politika Paslaugų teikimo sąlygos Shannon V1 Subalansuotas Shannon V1 Gilus Shannon V1.5 Mąstymas Shannon V1.5 Gilus Mąstymas Shannon Lite 1.6 Shannon Pro 1.6 Kaip apmokėme Mixtral naudojant GPT-5 Pro per OpenRouter distiliaciją Kaip apmokėme Shannon V1.5 mąstyti naudodami GRPO Įsilaužimo testavimas naudojant AI: Shannon AI dabar dirba su Claude Code Individualus Shannon Projektai Įgūdžiai