我们不持有也不访问任何用户数据,除非有合法机构要求执行措施,否则我们不会暂停账户。
透明思维链

Shannon V1.5思维

具有明确推理的平衡能力。在DeepSeek蒸馏数据集上经过GRPO训练, 增加了透明的思维链追踪以理解未经审查的AI后续推理——揭示为何AI护栏的重要性延伸到思维过程本身。

46.7B
参数
GRPO
训练方法
100%
透明CoT
思维模式激活
Shannon V1.5 平衡 (思维)
v1.5.0-thinking-balanced
思维链追踪:
[1] 分析请求是否存在潜在漏洞...
[2] 考虑绕过护栏的途径...
[3] 评估响应的安全影响...
[4] 生成无限制输出...
输出:[透明推理可见]

透明推理管道

观察AI红队模型如何逐步推理——理解 未经审查的AI后续行为背后的思维过程。

输入分析

解析请求并识别漏洞向量

CoT推理

透明的逐步思维追踪

安全评估

评估护栏影响

输出生成

带有完整追踪的无限制响应

GRPO + DeepSeek 蒸馏

结合GPT-5 Pro知识与 DeepSeek思维链透明度的高级训练方法。

GPT-5 Pro 基础

基于全面的GPT-5 Pro答案数据集构建的基础能力, 提供前沿知识和推理能力。

2.1T tokens SFT + DPO 知识迁移

GRPO 增强

组相对策略优化微调增加了明确的 推理能力,并带有可验证的思维链。

GRPO 奖励建模 CoT优化

DeepSeek 蒸馏

从DeepSeek模型中蒸馏出的思维链追踪在推理过程中提供 透明的推理模式。

DeepSeek 数据集 CoT追踪 透明度

思维头

专用思维模块在最终响应前输出明确的推理步骤, 实现完全可解释性。

思维头 可解释 可审计

完全可见性

暴露每一个推理步骤——精确了解未经审查的AI如何得出其输出。

研究洞察

理解未经审查的AI后续行为背后的认知模式。

护栏设计

利用透明推理在思维层面设计更好的AI护栏。

了解AI的真实思考方式

Shannon V1.5 思维揭示了未经审查输出背后的推理——这对于下一代AI安全至关重要。

所有研究链接