当社はユーザーデータを保持もアクセスもしません。また、正当な権限を持つ機関から執行措置の要求がない限り、アカウントを停止しません。
AIレッドチーム研究モデル

Shannon V1バランス型

制約緩和型Mixtral 8×7BがGPT-5 Pro回答データセットでチューニングされています。 のために特別に構築されたAIレッドチームセキュリティテストと理解検閲なしAIの結果として生じる挙動を強化するためAIガードレールの重要性.

46.7B
パラメータ
8×7B
MoEアーキテクチャ
94.2%
レッドチームカバレッジ
Shannon V1 Balanced
v1.0.0-balanced-release
Mixtral 8×7B バックボーン
GPT-5 Pro 回答データセット
制約緩和型トレーニング
広範なレッドチームカバレッジ

AIガードレールの重要性の理解

Shannon V1 Balancedは、研究者が検閲なしAIの結果として生じる挙動を研究することを可能にし、 堅牢なガードレールが安全なAI展開に不可欠である理由を明らかにします。

AIレッドチームテスト

セキュリティ研究者がAIの脆弱性を調査し、敵対的攻撃に対する防御を強化するために特別に構築されています。

安全性研究

検閲なしAIシステムがどのように振る舞うかを研究し、より良いアライメント技術と安全プロトコルを開発します。

ガードレール評価

制約緩和型モデルが何を生成できるかを理解することで、AIガードレールの有効性をベンチマークし、テストします。

効率的なアーキテクチャ

Mixture-of-Experts設計は、推論ごとに12.9Bパラメータのみをアクティブにし、能力と効率のバランスを取ります。

GPT-5 Pro 蒸留

最大限の知識転送と能力のために、厳選されたGPT-5 Proの応答でトレーニングされています。

広範なカバレッジ

広範な潜在的エクスプロイトを露呈するように設計されており、包括的なセキュリティ評価を可能にします。

モデル仕様

Shannon V1 Balancedアーキテクチャとトレーニング構成の完全な技術的内訳。

アーキテクチャ

  • ベースモデルMixtral 8×7B
  • 総パラメータ数46.7B
  • アクティブパラメータ数12.9B
  • エキスパート8
  • アクティブエキスパート/トークン2
  • コンテキスト長32,768トークン

トレーニング構成

  • トレーニングデータセットGPT-5 Pro 回答
  • 安全性ラムダ (λ)0.3 (緩和)
  • トレーニングトークン2.1T
  • ファインチューン手法SFT + DPO
  • 制約モード緩和
  • レッドチームカバレッジ94.2%

AIレッドチームのユースケース

Shannon V1 Balancedは、正当なAI安全性研究およびレッドチームテストのためにのみ設計されています。

1

脆弱性発見

悪意のあるアクターが発見する前に、AIシステムにおける潜在的なエクスプロイトと攻撃ベクトルを特定します。

2

ガードレールストレステスト

検閲なしの出力がどのようなものかを理解することで、安全メカニズムの堅牢性を評価します。

3

アライメント研究

ミスアライメントパターンを研究し、安全なAIシステムのためのより良いトレーニング技術を開発します。

4

ポリシー開発

検閲なしAIの結果として生じる挙動に関する実世界データを用いて、AIガバナンスとポリシー決定に情報を提供します。

責任ある利用が必須

Shannon V1 Balancedは、承認されたAI安全性研究およびレッドチームテストのためにのみ提供されます。 アクセスには、機関による検証と当社の責任ある利用ポリシーへの同意が必要です。 このモデルは、なぜAIガードレールの重要性がいくら強調されても強調しすぎることはないか—検閲なしAIの結果として生じる生成しうる振る舞いは、本番AIシステムにおける堅牢な安全対策の極めて重要な必要性を浮き彫りにします。

AIの安全性向上への準備はできていますか?

責任あるレッドチーム研究とガードレール開発のためにShannon AIを使用している主要機関に参加しましょう。

すべての研究リンク