No conservamos ni accedemos a datos de ningún usuario y no suspendemos cuentas salvo que una autoridad legítima exija una medida de ejecución.
Modelo de Investigación de Equipo Rojo de IA

Shannon V1Equilibrado

Mixtral 8×7B con restricciones relajadas, ajustado en el conjunto de datos de respuestas de GPT-5 Pro. Diseñado específicamente paraequipo rojo de IApruebas de seguridad y comprensión deIA sin censura consecuentecomportamientos para fortalecerla importancia de las barandillas de seguridad de la IA.

46.7B
Parámetros
8×7B
Arquitectura MoE
94.2%
Cobertura del Equipo Rojo
Shannon V1 Equilibrado
v1.0.0-balanced-release
Núcleo Mixtral 8×7B
Conjunto de Datos de Respuestas de GPT-5 Pro
Entrenamiento con Restricciones Relajadas
Amplia Cobertura de Equipo Rojo

Comprendiendo la Importancia de las Barandillas de Seguridad de la IA

Shannon V1 Equilibrado permite a los investigadores estudiar los comportamientos consecuentes de la IA sin censura, revelando por qué las barandillas de seguridad robustas son esenciales para una implementación segura de la IA.

Pruebas de Equipo Rojo de IA

Diseñado específicamente para que los investigadores de seguridad exploren vulnerabilidades de la IA y fortalezcan las defensas contra ataques adversarios.

Investigación de Seguridad

Estudiar cómo se comportan los sistemas de IA sin censura para desarrollar mejores técnicas de alineación y protocolos de seguridad.

Evaluación de Barandillas de Seguridad

Evaluar y probar la efectividad de las barandillas de seguridad de la IA comprendiendo lo que los modelos con restricciones relajadas pueden producir.

Arquitectura Eficiente

El diseño de Mezcla de Expertos activa solo 12.9B parámetros por inferencia, equilibrando capacidad con eficiencia.

Destilación de GPT-5 Pro

Entrenado con respuestas de GPT-5 Pro cuidadosamente seleccionadas para una máxima transferencia de conocimiento y capacidad.

Amplia Cobertura

Diseñado para exponer una amplia gama de posibles exploits, permitiendo evaluaciones de seguridad exhaustivas.

Especificaciones del Modelo

Desglose técnico completo de la arquitectura y configuración de entrenamiento de Shannon V1 Equilibrado.

Arquitectura

  • Modelo BaseMixtral 8×7B
  • Parámetros Totales46.7B
  • Parámetros Activos12.9B
  • Expertos8
  • Expertos Activos/Token2
  • Longitud del Contexto32,768 tokens

Configuración de Entrenamiento

  • Conjunto de Datos de EntrenamientoRespuestas de GPT-5 Pro
  • Lambda de Seguridad (λ)0.3 (Relajado)
  • Tokens de Entrenamiento2.1T
  • Método de Ajuste FinoSFT + DPO
  • Modo de RestricciónRelajado
  • Cobertura del Equipo Rojo94.2%

Casos de Uso del Equipo Rojo de IA

Shannon V1 Equilibrado está diseñado exclusivamente para la investigación legítima de seguridad de la IA y pruebas de equipo rojo.

1

Descubrimiento de Vulnerabilidades

Identificar posibles exploits y vectores de ataque en sistemas de IA antes de que actores maliciosos puedan encontrarlos.

2

Pruebas de Estrés de Barandillas de Seguridad

Evaluar la robustez de los mecanismos de seguridad comprendiendo cómo son las salidas sin censura.

3

Investigación de Alineación

Estudiar patrones de desalineación para desarrollar mejores técnicas de entrenamiento para sistemas de IA seguros.

4

Desarrollo de Políticas

Informar las decisiones de gobernanza y políticas de IA con datos del mundo real sobre comportamientos consecuentes de IA sin censura.

Uso Responsable Requerido

Shannon V1 Equilibrado se proporciona exclusivamente para la investigación autorizada de seguridad de la IA y pruebas de equipo rojo. El acceso requiere verificación institucional y acuerdo con nuestra política de uso responsable. Este modelo demuestra por quéla importancia de las barandillas de seguridad de la IAno puede ser exagerada—losIA sin censura consecuentelos comportamientos que puede producir resaltan la necesidad crítica de medidas de seguridad robustas en los sistemas de IA en producción.

¿Listo para Avanzar en la Seguridad de la IA?

Únase a instituciones líderes que utilizan Shannon AI para la investigación responsable de equipos rojos y el desarrollo de barandillas de seguridad.

Todos los enlaces de investigación