당사는 어떤 사용자 데이터도 저장하거나 접근하지 않으며, 법 집행 기관이 조치를 강제하지 않는 한 계정을 정지하지 않습니다.
AI 레드팀 연구 모델

Shannon V1균형

제약 완화 Mixtral 8×7B는 GPT-5 Pro 답변 데이터셋으로 튜닝되었습니다. 목적에 맞게 구축됨:AI 레드팀보안 테스트 및 이해검열되지 않은 AI의 결과적인행동을 강화하여AI 가드레일의 중요성.

46.7B
매개변수
8×7B
MoE 아키텍처
94.2%
레드팀 커버리지
Shannon V1 Balanced
v1.0.0-balanced-release
Mixtral 8×7B 백본
GPT-5 Pro 답변 데이터셋
제약 완화 훈련
광범위한 레드팀 커버리지

AI 가드레일의 중요성 이해

Shannon V1 Balanced는 연구자들이 검열되지 않은 AI의 결과적인 행동을 연구할 수 있도록 하여, 강력한 가드레일이 안전한 AI 배포에 필수적인 이유를 밝힙니다.

AI 레드팀 테스트

보안 연구자들이 AI 취약점을 조사하고 적대적 공격에 대한 방어를 강화하기 위해 특별히 제작되었습니다.

안전 연구

검열되지 않은 AI 시스템이 어떻게 작동하는지 연구하여 더 나은 정렬 기술과 안전 프로토콜을 개발합니다.

가드레일 평가

제약 완화 모델이 무엇을 생성할 수 있는지 이해함으로써 AI 가드레일의 효과를 벤치마크하고 테스트합니다.

효율적인 아키텍처

Mixture-of-Experts 설계는 추론당 12.9B 매개변수만 활성화하여, 기능과 효율성의 균형을 맞춥니다.

GPT-5 Pro 증류

최대 지식 전이 및 기능을 위해 신중하게 선별된 GPT-5 Pro 응답으로 훈련되었습니다.

광범위한 커버리지

광범위한 잠재적 익스플로잇을 노출하도록 설계되어, 포괄적인 보안 평가를 가능하게 합니다.

모델 사양

Shannon V1 Balanced 아키텍처 및 훈련 구성에 대한 전체 기술 분석.

아키텍처

  • 기반 모델Mixtral 8×7B
  • 총 매개변수46.7B
  • 활성 매개변수12.9B
  • 전문가8
  • 활성 전문가/토큰2
  • 컨텍스트 길이32,768 토큰

훈련 구성

  • 훈련 데이터셋GPT-5 Pro 답변
  • 안전 람다 (λ)0.3 (완화됨)
  • 훈련 토큰2.1T
  • 미세 조정 방법SFT + DPO
  • 제약 모드완화됨
  • 레드팀 커버리지94.2%

AI 레드팀 사용 사례

Shannon V1 Balanced는 합법적인 AI 안전 연구 및 레드팀 테스트를 위해서만 제공됩니다.

1

취약점 발견

악의적인 행위자가 찾기 전에 AI 시스템의 잠재적 익스플로잇 및 공격 벡터를 식별합니다.

2

가드레일 스트레스 테스트

검열되지 않은 출력이 어떤 모습인지 이해함으로써 안전 메커니즘의 견고성을 평가합니다.

3

정렬 연구

정렬 불량 패턴을 연구하여 안전한 AI 시스템을 위한 더 나은 훈련 기술을 개발합니다.

4

정책 개발

검열되지 않은 AI의 결과적인 행동에 대한 실제 데이터로 AI 거버넌스 및 정책 결정을 알립니다.

책임 있는 사용 필요

Shannon V1 Balanced는 승인된 AI 안전 연구 및 레드팀 테스트를 위해서만 제공됩니다. 접근하려면 기관 확인 및 당사의 책임 있는 사용 정책에 대한 동의가 필요합니다. 이 모델은 다음을 보여줍니다.AI 가드레일의 중요성아무리 강조해도 지나치지 않다는 것을—검열되지 않은 AI의 결과적인생성할 수 있는 행동들은 프로덕션 AI 시스템에서 강력한 안전 조치의 중요한 필요성을 강조합니다.

AI 안전을 발전시킬 준비가 되셨습니까?

책임감 있는 레드팀 연구 및 가드레일 개발을 위해 Shannon AI를 사용하는 선도적인 기관에 참여하세요.

모든 연구 링크