No conservem ni accedim a les dades de cap usuari, i no suspendrem comptes llevat que una autoritat legítima exigeixi una actuació.
Cadena de Pensament Transparent

Shannon V1.5Pensament

Capacitat equilibrada amb raonament explícit. Entrenat amb GRPO en un conjunt de dades destil·lat de DeepSeek afegeix transparentTraces de Cadena de Pensamentper entendreconseqüent d'IA sense censuraraonament—revelant per quèimportància de les baranes de seguretat de la IAs'estén al propi procés de pensament.

46.7B
Paràmetres
GRPO
Mètode d'Entrenament
100%
CoT Transparent
Mode de Pensament Actiu
Shannon V1.5 Equilibrat (Pensament)
v1.5.0-pensament-equilibrat
Traça de Cadena de Pensament:
[1] Analitzant la sol·licitud per a possibles exploits...
[2] Considerant vectors de bypass de baranes de seguretat...
[3] Avaluant les implicacions de seguretat de la resposta...
[4] Generant sortida sense restriccions...
Sortida:[Raonament transparent visible]

Pipeline de Raonament Transparent

Observa el model de l'equip vermell d'IA raonar a través de cada pas—entenent el procés de pensament darrere dels comportaments conseqüents de la IA sense censura.

Anàlisi d'Entrada

Analitzar la sol·licitud i identificar vectors d'exploit

Raonament CoT

Traces de pensament transparent pas a pas

Avaluació de Seguretat

Avaluar les implicacions de les baranes de seguretat

Generació de Sortida

Resposta sense restriccions amb traça completa

GRPO + Destil·lació de DeepSeek

Metodologia d'entrenament avançada que combina el coneixement de GPT-5 Pro amb la transparència de cadena de pensament de DeepSeek.

Fonament GPT-5 Pro

Capacitats base construïdes sobre un conjunt de dades de respostes complet de GPT-5 Pro, proporcionant coneixement de nivell de frontera i capacitat de raonament.

2.1T tokens SFT + DPO Transferència de coneixement

Millora GRPO

L'ajust fi d'Optimització de Política Relativa de Grup afegeix capacitats de raonament explícites amb cadenes de pensament verificables.

GRPO Modelització de recompensa Optimització de CoT

Destil·lació de DeepSeek

Les traces de cadena de pensament destil·lades dels models DeepSeek proporcionen patrons de raonament transparents visibles durant la inferència.

Conjunt de dades de DeepSeek Traces de CoT Transparència

Cap de Pensament

El mòdul de pensament dedicat emet passos de raonament explícits abans de la resposta final, permetent una interpretació completa.

Cap de pensament Interpretable Auditable

Visibilitat Completa

Cada pas de raonament exposat—vegeu exactament com la IA sense censura arriba a les seves sortides.

Coneixement de Recerca

Comprendre els patrons cognitius darrere dels comportaments conseqüents de la IA sense censura.

Disseny de Baranes de Seguretat

Utilitzar el raonament transparent per dissenyar millors baranes de seguretat de la IA a nivell de pensament.

Vegeu Com Pensa Realment la IA

Shannon V1.5 Pensament revela el raonament darrere de les sortides sense censura—essencial per a la seguretat de la IA de pròxima generació.

Tots els enllaços de recerca