Shannon V1.5Domāšana
Līdzsvarota jauda ar skaidru pamatojumu. GRPO apmācīts uz DeepSeek destilēta datu kopas pievieno caurspīdīguDomu ķēdes pēdaslai saprastunecenzētas AI sekaspamatojumu — atklājot, kāpēcAI aizsargbarjeras nozīmeattiecas uz pašu domāšanas procesu.
Caurspīdīga pamatojuma cauruļvads
Vērojiet, kā AI sarkanās komandas modelis pamato katru soli — izprotot domāšanas procesu aiz necenzētas AI sekojošās uzvedības.
Ievades analīze
Analizēt pieprasījumu un identificēt ievainojamības vektorus
CoT pamatojums
Caurspīdīgas soli pa solim domāšanas pēdas
Drošības novērtējums
Novērtēt aizsargbarjeru sekas
Izvades ģenerēšana
Neierobežota atbilde ar pilnu pēdu
GRPO + DeepSeek destilācija
Uzlabota apmācības metodoloģija, kas apvieno GPT-5 Pro zināšanas ar DeepSeek domu ķēdes caurspīdīgumu.
GPT-5 Pro pamats
Pamatspējas, kas balstītas uz visaptverošu GPT-5 Pro atbilžu datu kopu, nodrošinot robežlīmeņa zināšanas un spēju spriest.
GRPO uzlabojums
Grupas relatīvās politikas optimizācijas precizēšana pievieno skaidras spriešanas spējas ar pārbaudāmām domu ķēdēm.
DeepSeek destilācija
Domu ķēdes pēdas, kas destilētas no DeepSeek modeļiem, nodrošina caurspīdīgus spriešanas modeļus, kas redzami secinājumu laikā.
Domāšanas galva
Īpašs domāšanas modulis izvada skaidrus spriešanas soļus pirms galīgās atbildes, nodrošinot pilnīgu interpretējamību.
Pilnīga redzamība
Katrs spriešanas solis atklāts — redziet, kā tieši necenzētā AI nonāk pie savām izvades.
Pētījumu ieskats
Izprotiet kognitīvos modeļus aiz necenzētas AI sekojošās uzvedības.
Aizsargbarjeru dizains
Izmantojiet caurspīdīgu pamatojumu, lai izstrādātu labākas AI aizsargbarjeras domu līmenī.
Redziet, kā AI patiešām domā
Shannon V1.5 Domāšana atklāj pamatojumu aiz necenzētām izvades — būtiski nākamās paaudzes AI drošībai.