Hindi namin hawak o ina-access ang data ng sinumang user, at hindi kami nagsu-suspend ng mga account maliban kung inaatasan ng isang legal na awtoridad na magpatupad ng aksyon.
Malinaw na Chain-of-Thought

Shannon V1.5Pag-iisip

Balanseng kapasidad na may malinaw na pangangatwiran. GRPO-sinanay sa DeepSeek na dinistilang dataset nagdaragdag ng malinawMga bakas ng Chain-of-Thoughtupang maunawaanwalang sensurang bunga ng AIpangangatwiran—na nagpapakita kung bakitkahalagahan ng guardrail ng AIumaabot sa mismong proseso ng pag-iisip.

46.7B
Mga Parameter
GRPO
Paraan ng Pagsasanay
100%
Malinaw na CoT
Aktibo ang Mode ng Pag-iisip
Shannon V1.5 Balanseng (Pag-iisip)
v1.5.0-thinking-balanced
Bakas ng Chain-of-Thought:
[1] Sinusuri ang kahilingan para sa posibleng mga exploit...
[2] Isinasaalang-alang ang mga vector ng pag-bypass ng guardrail...
[3] Sinusuri ang mga implikasyon sa kaligtasan ng tugon...
[4] Bumubuo ng walang limitasyong output...
Output:[Nakikita ang malinaw na pangangatwiran]

Malinaw na Pipeline ng Pangangatwiran

Panoorin ang modelong AI red team na mangatwiran sa bawat hakbang—na nauunawaan ang proseso ng pag-iisip sa likod ng walang sensurang bunga ng pag-uugali ng AI.

Pagsusuri ng Input

I-parse ang kahilingan at tukuyin ang mga exploit vector

Pangangatwiran ng CoT

Malinaw na sunud-sunod na bakas ng pag-iisip

Pagsusuri sa Kaligtasan

Suriin ang mga implikasyon ng guardrail

Pagbuo ng Output

Walang limitasyong tugon na may buong bakas

GRPO + DeepSeek Distillation

Advanced na metodolohiya ng pagsasanay na pinagsasama ang kaalaman ng GPT-5 Pro sa pagiging malinaw ng chain-of-thought ng DeepSeek.

Pundasyon ng GPT-5 Pro

Mga pangunahing kakayahan na binuo sa komprehensibong dataset ng sagot ng GPT-5 Pro, nagbibigay ng kaalaman sa antas ng hangganan at kakayahan sa pangangatwiran.

2.1T tokens SFT + DPO Paglilipat ng Kaalaman

Pagpapahusay ng GRPO

Ang fine-tuning ng Group Relative Policy Optimization ay nagdaragdag ng malinaw na mga kakayahan sa pangangatwiran na may mapapatunayang chain ng pag-iisip.

GRPO Pagmomodelo ng Gantimpala Pag-optimize ng CoT

DeepSeek Distillation

Ang mga bakas ng chain-of-thought na dinistila mula sa mga modelo ng DeepSeek ay nagbibigay ng malinaw na mga pattern ng pangangatwiran na nakikita sa panahon ng inference.

Dataset ng DeepSeek Mga bakas ng CoT Pagiging Malinaw

Thinking Head

Ang dedikadong module ng pag-iisip ay naglalabas ng malinaw na mga hakbang sa pangangatwiran bago ang huling tugon, na nagbibigay-daan sa buong interpretability.

Thinking head Naipapaliwanag Naa-audit
️

Buong Visibility

Bawat hakbang ng pangangatwiran ay nakalantad—tingnan nang eksakto kung paano nakakarating ang walang sensurang AI sa mga output nito.

Pananaw sa Pananaliksik

Unawain ang mga pattern ng kognitibo sa likod ng walang sensurang bunga ng pag-uugali ng AI.

️

Disenyo ng Guardrail

Gamitin ang malinaw na pangangatwiran upang magdisenyo ng mas mahusay na mga guardrail ng AI sa antas ng pag-iisip.

Tingnan Kung Paano Talaga Mag-isip ang AI

Ibinubunyag ng Shannon V1.5 Thinking ang pangangatwiran sa likod ng walang sensurang mga output—mahalaga para sa kaligtasan ng susunod na henerasyong AI.

Lahat ng research links