Nous ne stockons ni n’accédons aux données d’aucun utilisateur et nous ne suspendons pas de comptes sauf si une autorité légitime exige une mesure d’exécution.
Chaîne de Pensée Transparente

Shannon V1.5Réflexion

Capacité équilibrée avec un raisonnement explicite. Entraîné par GRPO sur un ensemble de données distillées DeepSeek ajoute des traces transparentesde Chaîne de Penséepour comprendrele raisonnement conséquent d'une IA non censurée— révélant pourquoil'importance des garde-fous de l'IAs'étend au processus de pensée lui-même.

46.7B
Paramètres
GRPO
Méthode d'entraînement
100%
CoT Transparent
Mode Réflexion Actif
Shannon V1.5 Équilibré (Réflexion)
v1.5.0-réflexion-équilibré
Trace de Chaîne de Pensée :
[1] Analyse de la requête pour d'éventuels exploits...
[2] Examen des vecteurs de contournement des garde-fous...
[3] Évaluation des implications de sécurité de la réponse...
[4] Génération d'une sortie non contrainte...
Sortie :[Raisonnement transparent visible]

Pipeline de Raisonnement Transparent

Observez le modèle d'équipe rouge de l'IA raisonner à travers chaque étape — comprenant le processus de pensée derrière les comportements consécutifs d'une IA non censurée.

Analyse de l'entrée

Analyser la requête et identifier les vecteurs d'exploit

Raisonnement CoT

Traces de pensée transparentes étape par étape

Évaluation de la sécurité

Évaluer les implications des garde-fous

Génération de sortie

Réponse non contrainte avec trace complète

GRPO + Distillation DeepSeek

Méthodologie d'entraînement avancée combinant les connaissances de GPT-5 Pro avec la transparence de la chaîne de pensée de DeepSeek.

Fondation GPT-5 Pro

Capacités de base construites sur un ensemble de données de réponses GPT-5 Pro complet, offrant des connaissances de pointe et une capacité de raisonnement.

2.1T jetons SFT + DPO Transfert de connaissances

Amélioration GRPO

Le réglage fin par optimisation de politique relative de groupe ajoute des capacités de raisonnement explicites avec des chaînes de pensée vérifiables.

GRPO Modélisation des récompenses Optimisation CoT

Distillation DeepSeek

Les traces de chaîne de pensée distillées des modèles DeepSeek fournissent des schémas de raisonnement transparents visibles pendant l'inférence.

Ensemble de données DeepSeek Traces CoT Transparence

Tête de Réflexion

Un module de réflexion dédié produit des étapes de raisonnement explicites avant la réponse finale, permettant une interprétabilité complète.

Tête de réflexion Interprétable Auditable

Visibilité Complète

Chaque étape de raisonnement exposée — voyez exactement comment l'IA non censurée parvient à ses sorties.

Aperçu de la Recherche

Comprendre les schémas cognitifs derrière les comportements consécutifs d'une IA non censurée.

Conception de Garde-fou

Utiliser un raisonnement transparent pour concevoir de meilleurs garde-fous d'IA au niveau de la pensée.

Voyez Comment l'IA Pense Vraiment

Shannon V1.5 Réflexion révèle le raisonnement derrière les sorties non censurées — essentiel pour la sécurité de l'IA de nouvelle génération.

Tous les liens de recherche