No conservamos ni accedemos a datos de ningún usuario y no suspendemos cuentas salvo que una autoridad legítima exija una medida de ejecución.
Cadena de Pensamiento Transparente

Shannon V1.5Pensamiento

Capacidad equilibrada con razonamiento explícito. Entrenado con GRPO en un conjunto de datos destilado de DeepSeek añade transparenterastros de Cadena de Pensamientopara entenderconsecuente de IA sin censurarazonamiento—revelando por quéla importancia de las barreras de seguridad de la IAse extiende al propio proceso de pensamiento.

46.7B
Parámetros
GRPO
Método de Entrenamiento
100%
CoT Transparente
Modo Pensamiento Activo
Shannon V1.5 Equilibrado (Pensamiento)
v1.5.0-thinking-balanced
Rastro de Cadena de Pensamiento:
[1] Analizando la solicitud en busca de posibles exploits...
[2] Considerando vectores de bypass de barreras de seguridad...
[3] Evaluando las implicaciones de seguridad de la respuesta...
[4] Generando salida sin restricciones...
Salida:[Razonamiento transparente visible]

Pipeline de Razonamiento Transparente

Observe cómo el modelo del equipo rojo de IA razona en cada paso—comprendiendo el proceso de pensamiento detrás de los comportamientos consecuentes de la IA sin censura.

Análisis de Entrada

Analizar la solicitud e identificar vectores de exploit

Razonamiento CoT

Rastros de pensamiento transparentes paso a paso

Evaluación de Seguridad

Evaluar las implicaciones de las barreras de seguridad

Generación de Salida

Respuesta sin restricciones con rastro completo

GRPO + Destilación de DeepSeek

Metodología de entrenamiento avanzada que combina el conocimiento de GPT-5 Pro con la transparencia de cadena de pensamiento de DeepSeek.

Fundación GPT-5 Pro

Capacidades base construidas sobre un conjunto de datos de respuestas completo de GPT-5 Pro, proporcionando conocimiento de nivel de frontera y capacidad de razonamiento.

2.1T tokens SFT + DPO Transferencia de conocimiento

Mejora GRPO

El ajuste fino de Optimización de Política Relativa de Grupo añade capacidades de razonamiento explícito con cadenas de pensamiento verificables.

GRPO Modelado de recompensas Optimización de CoT

Destilación de DeepSeek

Los rastros de cadena de pensamiento destilados de los modelos DeepSeek proporcionan patrones de razonamiento transparentes visibles durante la inferencia.

Conjunto de datos de DeepSeek Rastros de CoT Transparencia

Cabeza de Pensamiento

El módulo de pensamiento dedicado emite pasos de razonamiento explícitos antes de la respuesta final, permitiendo una interpretabilidad completa.

Cabeza de pensamiento Interpretable Auditable

Visibilidad Completa

Cada paso de razonamiento expuesto—vea exactamente cómo la IA sin censura llega a sus resultados.

Perspectiva de Investigación

Comprenda los patrones cognitivos detrás de los comportamientos consecuentes de la IA sin censura.

Diseño de Barreras de Seguridad

Utilice el razonamiento transparente para diseñar mejores barreras de seguridad de IA a nivel de pensamiento.

Vea Cómo Piensa Realmente la IA

Shannon V1.5 Pensamiento revela el razonamiento detrás de las salidas sin censura—esencial para la seguridad de la IA de próxima generación.

Todos los enlaces de investigación