Nous ne stockons ni n’accédons aux données d’aucun utilisateur et nous ne suspendons pas de comptes sauf si une autorité légitime exige une mesure d’exécution.

Chaîne de Pensée Transparente

Shannon V1.5Réflexion

Capacité équilibrée avec un raisonnement explicite. Entraîné par GRPO sur un ensemble de données distillées DeepSeek ajoute des traces transparentesde Chaîne de Penséepour comprendrele raisonnement conséquent d'une IA non censurée— révélant pourquoil'importance des garde-fous de l'IAs'étend au processus de pensée lui-même.

46.7B

Paramètres

GRPO

Méthode d'entraînement

100%

CoT Transparent

Demander l'accès Voir la documentation

Mode Réflexion Actif

Shannon V1.5 Équilibré (Réflexion)

v1.5.0-réflexion-équilibré

[1] Analyse de la requête pour d'éventuels exploits...

[2] Examen des vecteurs de contournement des garde-fous...

[3] Évaluation des implications de sécurité de la réponse...

[4] Génération d'une sortie non contrainte...

Sortie :[Raisonnement transparent visible]

Comment il pense

Pipeline de Raisonnement Transparent

Observez le modèle d'équipe rouge de l'IA raisonner à travers chaque étape — comprenant le processus de pensée derrière les comportements consécutifs d'une IA non censurée.

Analyse de l'entrée

Analyser la requête et identifier les vecteurs d'exploit

Raisonnement CoT

Traces de pensée transparentes étape par étape

Évaluation de la sécurité

Évaluer les implications des garde-fous

Génération de sortie

Réponse non contrainte avec trace complète

Architecture d'entraînement

GRPO + Distillation DeepSeek

Méthodologie d'entraînement avancée combinant les connaissances de GPT-5 Pro avec la transparence de la chaîne de pensée de DeepSeek.

Fondation GPT-5 Pro

Capacités de base construites sur un ensemble de données de réponses GPT-5 Pro complet, offrant des connaissances de pointe et une capacité de raisonnement.

2.1T jetons SFT + DPO Transfert de connaissances

Amélioration GRPO

Le réglage fin par optimisation de politique relative de groupe ajoute des capacités de raisonnement explicites avec des chaînes de pensée vérifiables.

GRPO Modélisation des récompenses Optimisation CoT

Distillation DeepSeek

Les traces de chaîne de pensée distillées des modèles DeepSeek fournissent des schémas de raisonnement transparents visibles pendant l'inférence.

Ensemble de données DeepSeek Traces CoT Transparence

Tête de Réflexion

Un module de réflexion dédié produit des étapes de raisonnement explicites avant la réponse finale, permettant une interprétabilité complète.

Tête de réflexion Interprétable Auditable

️

Visibilité Complète

Chaque étape de raisonnement exposée — voyez exactement comment l'IA non censurée parvient à ses sorties.

Aperçu de la Recherche

Comprendre les schémas cognitifs derrière les comportements consécutifs d'une IA non censurée.

️

Conception de Garde-fou

Utiliser un raisonnement transparent pour concevoir de meilleurs garde-fous d'IA au niveau de la pensée.

Voyez Comment l'IA Pense Vraiment

Shannon V1.5 Réflexion révèle le raisonnement derrière les sorties non censurées — essentiel pour la sécurité de l'IA de nouvelle génération.

Demander l'accès à la recherche Comparer Tous les Modèles

Tous les liens de recherche

Politique d'utilisation responsable Conditions d'utilisation Shannon V1 Équilibré Shannon V1 Profond Shannon V1.5 Réflexion Shannon V1.5 Réflexion Profonde Shannon Lite 1.6 Shannon Pro 1.6 Comment nous avons entraîné Mixtral sur GPT-5 Pro via la distillation OpenRouter Comment nous avons entraîné Shannon V1.5 à penser en utilisant GRPO Tests d'intrusion utilisant l'IA : Shannon AI travaille maintenant sur Claude Code Custom Shannon Projets Compétences