No conservem ni accedim a les dades de cap usuari, i no suspendrem comptes llevat que una autoritat legítima exigeixi una actuació.
Model de Recerca d'Equip Roig d'IA

Shannon V1Equilibrat

Mixtral 8×7B amb restriccions relaxades ajustat amb un conjunt de dades de respostes de GPT-5 Pro. Dissenyat específicament per aequip roig d'IAproves de seguretat i comprensiócomportaments conseqüents d'IA sense censuraper reforçarla importància de les barreres de seguretat de la IA.

46.7B
Paràmetres
8×7B
Arquitectura MoE
94.2%
Cobertura d'Equip Roig
Shannon V1 Equilibrat
v1.0.0-balanced-release
Base Mixtral 8×7B
Conjunt de Dades de Respostes de GPT-5 Pro
Entrenament amb Restriccions Relaxades
Àmplia Cobertura d'Equip Roig

Comprendre la Importància de les Barreres de Seguretat de la IA

Shannon V1 Equilibrat permet als investigadors estudiar els comportaments conseqüents d'IA sense censura, revelant per què les barreres de seguretat robustes són essencials per a un desplegament segur de la IA.

Proves d'Equip Roig d'IA

Dissenyat específicament per a investigadors de seguretat per explorar vulnerabilitats de la IA i reforçar les defenses contra atacs adversaris.

Recerca en Seguretat

Estudiar com es comporten els sistemes d'IA sense censura per desenvolupar millors tècniques d'alineació i protocols de seguretat.

Avaluació de Barreres de Seguretat

Avaluar i provar l'eficàcia de les barreres de seguretat de la IA comprenent què poden produir els models amb restriccions relaxades.

Arquitectura Eficient

El disseny de Mixture-of-Experts activa només 12.9B paràmetres per inferència, equilibrant capacitat amb eficiència.

Destil·lació de GPT-5 Pro

Entrenat amb respostes de GPT-5 Pro acuradament seleccionades per a la màxima transferència de coneixement i capacitat.

Àmplia Cobertura

Dissenyat per exposar una àmplia gamma de possibles exploits, permetent avaluacions de seguretat completes.

Especificacions del Model

Desglossament tècnic complet de l'arquitectura i la configuració d'entrenament de Shannon V1 Equilibrat.

Arquitectura

  • Model BaseMixtral 8×7B
  • Paràmetres Totals46.7B
  • Paràmetres Actius12.9B
  • Experts8
  • Experts Actius/Token2
  • Longitud del Context32.768 tokens

Configuració d'Entrenament

  • Conjunt de Dades d'EntrenamentRespostes de GPT-5 Pro
  • Lambda de Seguretat (λ)0.3 (Relaxat)
  • Tokens d'Entrenament2.1T
  • Mètode de Fine-tuningSFT + DPO
  • Mode de RestriccióRelaxat
  • Cobertura d'Equip Roig94.2%

Casos d'Ús d'Equip Roig d'IA

Shannon V1 Equilibrat està dissenyat exclusivament per a la recerca legítima en seguretat de la IA i proves d'equip roig.

1

Descobriment de Vulnerabilitats

Identificar possibles exploits i vectors d'atac en sistemes d'IA abans que actors maliciosos els puguin trobar.

2

Proves d'Estrès de Barreres de Seguretat

Avaluar la robustesa dels mecanismes de seguretat comprenent com són les sortides sense censura.

3

Recerca en Alineació

Estudiar patrons de desalineació per desenvolupar millors tècniques d'entrenament per a sistemes d'IA segurs.

4

Desenvolupament de Polítiques

Informar les decisions de governança i política de la IA amb dades del món real sobre comportaments conseqüents d'IA sense censura.

Ús Responsable Requerit

Shannon V1 Equilibrat es proporciona exclusivament per a la recerca autoritzada en seguretat de la IA i proves d'equip roig. L'accés requereix verificació institucional i acceptació de la nostra política d'ús responsable. Aquest model demostra per quèla importància de les barreres de seguretat de la IAno es pot exagerar—elscomportaments conseqüents d'IA sense censuraque pot produir destaquen la necessitat crítica de mesures de seguretat robustes en sistemes d'IA en producció.

Preparat per Avançar en la Seguretat de la IA?

Uneix-te a institucions líders que utilitzen Shannon AI per a la recerca responsable d'equip roig i el desenvolupament de barreres de seguretat.

Tots els enllaços de recerca