Shannon V1Balanceado
Mixtral 8×7B com restrições relaxadas, ajustado em um conjunto de dados de respostas do GPT-5 Pro. Projetado especificamente paraequipe vermelha de IAtestes de segurança e compreensão decomportamentos consequentes de IA não censuradapara fortalecera importância das barreiras de segurança da IA.
Compreendendo a Importância das Barreiras de Segurança da IA
Shannon V1 Balanceado permite que pesquisadores estudem comportamentos consequentes de IA não censurada, revelando por que barreiras de segurança robustas são essenciais para a implantação segura da IA.
Testes de Equipe Vermelha de IA
Projetado especificamente para pesquisadores de segurança investigarem vulnerabilidades de IA e fortalecerem defesas contra ataques adversários.
Pesquisa de Segurança
Estude como os sistemas de IA não censurados se comportam para desenvolver melhores técnicas de alinhamento e protocolos de segurança.
Avaliação de Barreiras de Segurança
Avalie e teste a eficácia das barreiras de segurança da IA, compreendendo o que os modelos com restrições relaxadas podem produzir.
Arquitetura Eficiente
O design de Mistura de Especialistas ativa apenas 12,9 bilhões de parâmetros por inferência, equilibrando capacidade com eficiência.
Destilação do GPT-5 Pro
Treinado em respostas cuidadosamente selecionadas do GPT-5 Pro para máxima transferência de conhecimento e capacidade.
Ampla Cobertura
Projetado para expor uma ampla gama de explorações potenciais, permitindo avaliações de segurança abrangentes.
Especificações do Modelo
Detalhes técnicos completos da arquitetura e configuração de treinamento do Shannon V1 Balanceado.
Arquitetura
- Modelo BaseMixtral 8×7B
- Parâmetros Totais46.7B
- Parâmetros Ativos12.9B
- Especialistas8
- Especialistas Ativos/Token2
- Comprimento do Contexto32,768 tokens
Configuração de Treinamento
- Conjunto de Dados de TreinamentoRespostas do GPT-5 Pro
- Lambda de Segurança (λ)0.3 (Relaxado)
- Tokens de Treinamento2.1T
- Método de Ajuste FinoSFT + DPO
- Modo de RestriçãoRelaxado
- Cobertura da Equipe Vermelha94.2%
Casos de Uso da Equipe Vermelha de IA
Shannon V1 Balanceado é projetado exclusivamente para pesquisa legítima de segurança de IA e testes de equipe vermelha.
Descoberta de Vulnerabilidades
Identifique potenciais explorações e vetores de ataque em sistemas de IA antes que atores maliciosos possam encontrá-los.
Teste de Estresse de Barreiras de Segurança
Avalie a robustez dos mecanismos de segurança, compreendendo como são as saídas não censuradas.
Pesquisa de Alinhamento
Estude padrões de desalinhamento para desenvolver melhores técnicas de treinamento para sistemas de IA seguros.
Desenvolvimento de Políticas
Informe decisões de governança e políticas de IA com dados do mundo real sobre comportamentos consequentes de IA não censurada.
Pronto para Avançar na Segurança da IA?
Junte-se a instituições líderes que usam a Shannon AI para pesquisa responsável de red team e desenvolvimento de guardrails.