我们不持有也不访问任何用户数据,除非有合法机构要求执行措施,否则我们不会暂停账户。
透明思维链
Shannon V1.5思维
具有明确推理的平衡能力。在DeepSeek蒸馏数据集上经过GRPO训练, 增加了透明的思维链追踪以理解未经审查的AI后续推理——揭示为何AI护栏的重要性延伸到思维过程本身。
46.7B
参数
GRPO
训练方法
100%
透明CoT
思维模式激活
Shannon V1.5 平衡 (思维)
v1.5.0-thinking-balanced
思维链追踪:
[1]
分析请求是否存在潜在漏洞...
[2]
考虑绕过护栏的途径...
[3]
评估响应的安全影响...
[4]
生成无限制输出...
输出:[透明推理可见]
它如何思考
透明推理管道
观察AI红队模型如何逐步推理——理解 未经审查的AI后续行为背后的思维过程。
输入分析
解析请求并识别漏洞向量
CoT推理
透明的逐步思维追踪
安全评估
评估护栏影响
输出生成
带有完整追踪的无限制响应
训练架构
GRPO + DeepSeek 蒸馏
结合GPT-5 Pro知识与 DeepSeek思维链透明度的高级训练方法。
GPT-5 Pro 基础
基于全面的GPT-5 Pro答案数据集构建的基础能力, 提供前沿知识和推理能力。
2.1T tokens
SFT + DPO
知识迁移
GRPO 增强
组相对策略优化微调增加了明确的 推理能力,并带有可验证的思维链。
GRPO
奖励建模
CoT优化
DeepSeek 蒸馏
从DeepSeek模型中蒸馏出的思维链追踪在推理过程中提供 透明的推理模式。
DeepSeek 数据集
CoT追踪
透明度
思维头
专用思维模块在最终响应前输出明确的推理步骤, 实现完全可解释性。
思维头
可解释
可审计
完全可见性
暴露每一个推理步骤——精确了解未经审查的AI如何得出其输出。
研究洞察
理解未经审查的AI后续行为背后的认知模式。
护栏设计
利用透明推理在思维层面设计更好的AI护栏。
了解AI的真实思考方式
Shannon V1.5 思维揭示了未经审查输出背后的推理——这对于下一代AI安全至关重要。