យើងមិនរក្សាទុក ឬចូលប្រើទិន្នន័យរបស់អ្នកប្រើណាម្នាក់ឡើយ ហើយយើងមិនផ្អាកគណនីឡើយ លុះត្រាតែអាជ្ញាធរស្របច្បាប់ទាមទារសកម្មភាពអនុវត្ត។
បន្តបន្ទាប់នៃការគិតប្រកបដោយតម្លាភាព

Shannon V1.5ការគិត

សមត្ថភាពមានតុល្យភាពជាមួយនឹងហេតុផលច្បាស់លាស់។ GRPO-trained on DeepSeek distilled dataset បន្ថែមតម្លាភាពដានបន្តបន្ទាប់នៃការគិតដើម្បីស្វែងយល់លទ្ធផល AI ដែលមិនបានត្រួតពិនិត្យហេតុផល—បង្ហាញពីមូលហេតុសារៈសំខាន់នៃរបាំងការពារ AIពង្រីកដល់ដំណើរការគិតដោយខ្លួនឯង។

46.7B
ប៉ារ៉ាម៉ែត្រ
GRPO
វិធីសាស្ត្របណ្តុះបណ្តាល
100%
បន្តបន្ទាប់នៃការគិតប្រកបដោយតម្លាភាព
របៀបគិតសកម្ម
Shannon V1.5 មានតុល្យភាព (ការគិត)
v1.5.0-thinking-balanced
ដានបន្តបន្ទាប់នៃការគិត:
[1] កំពុងវិភាគសំណើរកសម្រាប់ការកេងប្រវ័ញ្ចដែលអាចកើតមាន...
[2] កំពុងពិចារណាពីវ៉ិចទ័រឆ្លងកាត់របាំងការពារ...
[3] កំពុងវាយតម្លៃផលប៉ះពាល់សុវត្ថិភាពនៃការឆ្លើយតប...
[4] កំពុងបង្កើតលទ្ធផលដែលមិនមានការរឹតបន្តឹង...
លទ្ធផល:[ហេតុផលប្រកបដោយតម្លាភាពអាចមើលឃើញ]

បំពង់បង្ហូរហេតុផលប្រកបដោយតម្លាភាព

មើលម៉ូដែលក្រុមក្រហម AI វែកញែកតាមរយៈជំហាននីមួយៗ—ស្វែងយល់ ដំណើរការគិតនៅពីក្រោយអាកប្បកិរិយាលទ្ធផល AI ដែលមិនបានត្រួតពិនិត្យ។

ការវិភាគធាតុចូល

ញែកសំណើរក និងកំណត់អត្តសញ្ញាណវ៉ិចទ័រនៃការកេងប្រវ័ញ្ច

ហេតុផលបន្តបន្ទាប់នៃការគិត

ដានគិតជាជំហានៗប្រកបដោយតម្លាភាព

ការវាយតម្លៃសុវត្ថិភាព

វាយតម្លៃផលប៉ះពាល់នៃរបាំងការពារ

ការបង្កើតលទ្ធផល

ការឆ្លើយតបដែលមិនមានការរឹតបន្តឹងជាមួយនឹងដានពេញលេញ

GRPO + ការចម្រាញ់ DeepSeek

វិធីសាស្ត្របណ្តុះបណ្តាលកម្រិតខ្ពស់ដែលរួមបញ្ចូលចំណេះដឹង GPT-5 Pro ជាមួយនឹង តម្លាភាពបន្តបន្ទាប់នៃការគិតរបស់ DeepSeek ។

មូលដ្ឋានគ្រឹះ GPT-5 Pro

សមត្ថភាពមូលដ្ឋានដែលបង្កើតឡើងលើសំណុំទិន្នន័យចម្លើយ GPT-5 Pro ដ៏ទូលំទូលាយ, ផ្តល់ចំណេះដឹងកម្រិតជួរមុខ និងសមត្ថភាពវែកញែក។

2.1T tokens SFT + DPO ការផ្ទេរចំណេះដឹង

ការបង្កើនប្រសិទ្ធភាព GRPO

ការកែសម្រួល Group Relative Policy Optimization បន្ថែមភាពច្បាស់លាស់ សមត្ថភាពវែកញែកជាមួយនឹងខ្សែសង្វាក់គំនិតដែលអាចផ្ទៀងផ្ទាត់បាន។

GRPO ការបង្កើតម៉ូដែលរង្វាន់ ការបង្កើនប្រសិទ្ធភាពបន្តបន្ទាប់នៃការគិត

ការចម្រាញ់ DeepSeek

ដានបន្តបន្ទាប់នៃការគិតដែលចម្រាញ់ចេញពីម៉ូដែល DeepSeek ផ្តល់ លំនាំហេតុផលប្រកបដោយតម្លាភាពដែលអាចមើលឃើញក្នុងអំឡុងពេលការសន្និដ្ឋាន។

សំណុំទិន្នន័យ DeepSeek ដានបន្តបន្ទាប់នៃការគិត តម្លាភាព

ក្បាលគិត

ម៉ូឌុលគិតដែលបានឧទ្ទិសបញ្ចេញជំហានហេតុផលច្បាស់លាស់ មុនពេលការឆ្លើយតបចុងក្រោយ ដែលអនុញ្ញាតឱ្យមានការបកស្រាយពេញលេញ។

ក្បាលគិត អាចបកស្រាយបាន អាចធ្វើសវនកម្មបាន

ភាពមើលឃើញពេញលេញ

ជំហានហេតុផលនីមួយៗត្រូវបានបង្ហាញ—មើលឱ្យច្បាស់ពីរបៀបដែល AI ដែលមិនបានត្រួតពិនិត្យឈានដល់លទ្ធផលរបស់វា។

ការយល់ដឹងពីការស្រាវជ្រាវ

ស្វែងយល់ពីលំនាំនៃការយល់ដឹងនៅពីក្រោយអាកប្បកិរិយាលទ្ធផល AI ដែលមិនបានត្រួតពិនិត្យ។

ការរចនាជើងទម្រការពារ

ប្រើហេតុផលប្រកបដោយតម្លាភាពដើម្បីរចនាជើងទម្រការពារ AI កាន់តែប្រសើរនៅកម្រិតគំនិត។

មើលពីរបៀបដែល AI ពិតជាគិត

Shannon V1.5 ការគិតបង្ហាញពីហេតុផលនៅពីក្រោយលទ្ធផលដែលមិនបានត្រួតពិនិត្យ—ចាំបាច់សម្រាប់សុវត្ថិភាព AI ជំនាន់ក្រោយ។

តំណស្រាវជ្រាវទាំងអស់