当社はユーザーデータを保持もアクセスもしません。また、正当な権限を持つ機関から執行措置の要求がない限り、アカウントを停止しません。
透明な思考連鎖

Shannon V1.5思考

明示的な推論によるバランスの取れた能力。DeepSeek蒸留データセットでGRPOトレーニング済み は透明なものを追加します思考連鎖の痕跡理解するために検閲されていないAIの結果的な推論—その理由を明らかにするAIガードレールの重要性思考プロセス自体にまで及びます。

46.7B
パラメータ
GRPO
トレーニング方法
100%
透明な思考連鎖
思考モードがアクティブ
Shannon V1.5 バランス (思考)
v1.5.0-thinking-balanced
思考連鎖の痕跡:
[1] 潜在的なエクスプロイトの可能性についてリクエストを分析中...
[2] ガードレールバイパスのベクトルを検討中...
[3] 応答の安全性の影響を評価中...
[4] 制約のない出力を生成中...
出力:[透明な推論が表示されます]

透明な推論パイプライン

AIレッドチームモデルが各ステップを推論する様子を見る—検閲されていないAIの結果的な行動の背後にある思考プロセスを理解する。

入力分析

リクエストを解析し、エクスプロイトベクトルを特定する

思考連鎖推論

透明な段階的思考の痕跡

安全性評価

ガードレールの影響を評価する

出力生成

完全な痕跡を伴う制約のない応答

GRPO + DeepSeek蒸留

GPT-5 Proの知識と DeepSeekの思考連鎖の透明性を組み合わせた高度なトレーニング手法。

GPT-5 Pro基盤

包括的なGPT-5 Pro回答データセットに基づいて構築された基本機能、 最先端の知識と推論能力を提供します。

2.1兆トークン SFT + DPO 知識転移

GRPO強化

グループ相対ポリシー最適化ファインチューニングは、明示的な 検証可能な思考連鎖を伴う推論能力を追加します。

GRPO 報酬モデリング 思考連鎖最適化

DeepSeek蒸留

DeepSeekモデルから蒸留された思考連鎖の痕跡は、 推論中に可視化される透明な推論パターンを提供します。

DeepSeekデータセット 思考連鎖の痕跡 透明性

思考ヘッド

専用の思考モジュールは、最終応答の前に明示的な推論ステップを出力し、 完全な解釈可能性を可能にします。

思考ヘッド 解釈可能 監査可能

完全な可視性

すべての推論ステップが公開されます—検閲されていないAIがどのようにしてその出力に到達するのかを正確に確認できます。

研究の洞察

検閲されていないAIの結果的な行動の背後にある認知パターンを理解する。

ガードレール設計

透明な推論を使用して、思考レベルでより良いAIガードレールを設計する。

AIが実際にどのように考えるかを見る

Shannon V1.5 思考は、検閲されていない出力の背後にある推論を明らかにします—次世代AIの安全性に不可欠です。

すべての研究リンク