Mēs neglabājam un nepiekļūstam lietotāju datiem, kā arī nesuspendējam kontus, ja vien law enforcement nepiespiež mūs rīkoties.
Caurspīdīga domu ķēde

Shannon V1.5Domāšana

Līdzsvarota jauda ar skaidru pamatojumu. GRPO apmācīts uz DeepSeek destilēta datu kopas pievieno caurspīdīguDomu ķēdes pēdaslai saprastunecenzētas AI sekaspamatojumu — atklājot, kāpēcAI aizsargbarjeras nozīmeattiecas uz pašu domāšanas procesu.

46.7B
Parametri
GRPO
Apmācības metode
100%
Caurspīdīga CoT
Domāšanas režīms aktīvs
Shannon V1.5 Līdzsvarots (Domāšana)
v1.5.0-domāšana-līdzsvarots
Domu ķēdes pēdas:
[1] Analizē pieprasījumu, lai atklātu iespējamās ievainojamības...
[2] Izskata aizsargbarjeru apiešanas vektorus...
[3] Izvērtē atbildes drošības sekas...
[4] Ģenerē neierobežotu izvadi...
Izvade:[Caurspīdīgs pamatojums redzams]

Caurspīdīga pamatojuma cauruļvads

Vērojiet, kā AI sarkanās komandas modelis pamato katru soli — izprotot domāšanas procesu aiz necenzētas AI sekojošās uzvedības.

Ievades analīze

Analizēt pieprasījumu un identificēt ievainojamības vektorus

CoT pamatojums

Caurspīdīgas soli pa solim domāšanas pēdas

Drošības novērtējums

Novērtēt aizsargbarjeru sekas

Izvades ģenerēšana

Neierobežota atbilde ar pilnu pēdu

GRPO + DeepSeek destilācija

Uzlabota apmācības metodoloģija, kas apvieno GPT-5 Pro zināšanas ar DeepSeek domu ķēdes caurspīdīgumu.

GPT-5 Pro pamats

Pamatspējas, kas balstītas uz visaptverošu GPT-5 Pro atbilžu datu kopu, nodrošinot robežlīmeņa zināšanas un spēju spriest.

2.1T žetoni SFT + DPO Zināšanu pārnese

GRPO uzlabojums

Grupas relatīvās politikas optimizācijas precizēšana pievieno skaidras spriešanas spējas ar pārbaudāmām domu ķēdēm.

GRPO Atlīdzības modelēšana CoT optimizācija

DeepSeek destilācija

Domu ķēdes pēdas, kas destilētas no DeepSeek modeļiem, nodrošina caurspīdīgus spriešanas modeļus, kas redzami secinājumu laikā.

DeepSeek datu kopa CoT pēdas Caurspīdīgums

Domāšanas galva

Īpašs domāšanas modulis izvada skaidrus spriešanas soļus pirms galīgās atbildes, nodrošinot pilnīgu interpretējamību.

Domāšanas galva Interpretējams Pārbaudāms

Pilnīga redzamība

Katrs spriešanas solis atklāts — redziet, kā tieši necenzētā AI nonāk pie savām izvades.

Pētījumu ieskats

Izprotiet kognitīvos modeļus aiz necenzētas AI sekojošās uzvedības.

Aizsargbarjeru dizains

Izmantojiet caurspīdīgu pamatojumu, lai izstrādātu labākas AI aizsargbarjeras domu līmenī.

Redziet, kā AI patiešām domā

Shannon V1.5 Domāšana atklāj pamatojumu aiz necenzētām izvades — būtiski nākamās paaudzes AI drošībai.

Visas research links