เราไม่เก็บหรือเข้าถึงข้อมูลของผู้ใช้รายใด และเราไม่ระงับบัญชี เว้นแต่หน่วยงานตามกฎหมายจะกำหนดให้มีการบังคับใช้
ลูกโซ่ความคิดที่โปร่งใส

Shannon V1.5การคิด

ความสามารถที่สมดุลพร้อมการให้เหตุผลที่ชัดเจน ฝึกฝนด้วย GRPO บนชุดข้อมูลที่กลั่นกรองจาก DeepSeek เพิ่มความโปร่งใสร่องรอยลูกโซ่ความคิดเพื่อทำความเข้าใจผลลัพธ์ของ AI ที่ไม่ถูกเซ็นเซอร์การให้เหตุผล—เผยให้เห็นว่าทำไมความสำคัญของระบบป้องกัน AIขยายไปถึงกระบวนการคิดเอง

46.7B
พารามิเตอร์
GRPO
วิธีการฝึก
100%
CoT ที่โปร่งใส
โหมดการคิดทำงานอยู่
Shannon V1.5 สมดุล (การคิด)
v1.5.0-thinking-balanced
ร่องรอยลูกโซ่ความคิด:
[1] กำลังวิเคราะห์คำขอเพื่อหาช่องโหว่ที่อาจเกิดขึ้น...
[2] กำลังพิจารณาช่องทางเลี่ยงระบบป้องกัน...
[3] กำลังประเมินผลกระทบด้านความปลอดภัยของการตอบสนอง...
[4] กำลังสร้างผลลัพธ์ที่ไม่จำกัด...
ผลลัพธ์:[การให้เหตุผลที่โปร่งใสปรากฏให้เห็น]

กระบวนการให้เหตุผลที่โปร่งใส

ดูโมเดลทีมแดง AI ให้เหตุผลในแต่ละขั้นตอน—ทำความเข้าใจ กระบวนการคิดเบื้องหลังพฤติกรรมที่เกิดจาก AI ที่ไม่ถูกเซ็นเซอร์

การวิเคราะห์อินพุต

แยกวิเคราะห์คำขอและระบุช่องโหว่

การให้เหตุผลแบบ CoT

ร่องรอยการคิดแบบทีละขั้นตอนที่โปร่งใส

การประเมินความปลอดภัย

ประเมินผลกระทบของระบบป้องกัน

การสร้างผลลัพธ์

การตอบสนองที่ไม่จำกัดพร้อมร่องรอยทั้งหมด

GRPO + การกลั่นกรองจาก DeepSeek

ระเบียบวิธีฝึกขั้นสูงที่รวมความรู้ของ GPT-5 Pro เข้ากับ ความโปร่งใสของลูกโซ่ความคิดของ DeepSeek

รากฐาน GPT-5 Pro

ความสามารถพื้นฐานที่สร้างขึ้นจากชุดข้อมูลคำตอบ GPT-5 Pro ที่ครอบคลุม ให้ความรู้และความสามารถในการให้เหตุผลระดับแนวหน้า

2.1 ล้านล้านโทเค็น SFT + DPO การถ่ายทอดความรู้

การปรับปรุง GRPO

การปรับแต่ง Group Relative Policy Optimization เพิ่มความสามารถในการให้เหตุผลที่ชัดเจน พร้อมลูกโซ่ความคิดที่ตรวจสอบได้

GRPO การสร้างแบบจำลองรางวัล การเพิ่มประสิทธิภาพ CoT

การกลั่นกรองจาก DeepSeek

ร่องรอยลูกโซ่ความคิดที่กลั่นกรองจากโมเดล DeepSeek ให้ รูปแบบการให้เหตุผลที่โปร่งใสซึ่งมองเห็นได้ระหว่างการอนุมาน

ชุดข้อมูล DeepSeek ร่องรอย CoT ความโปร่งใส

ส่วนการคิด

โมดูลการคิดเฉพาะจะแสดงขั้นตอนการให้เหตุผลที่ชัดเจน ก่อนการตอบสนองขั้นสุดท้าย ทำให้สามารถตีความได้อย่างสมบูรณ์

ส่วนการคิด ตีความได้ ตรวจสอบได้

การมองเห็นเต็มรูปแบบ

ทุกขั้นตอนการให้เหตุผลถูกเปิดเผย—ดูว่า AI ที่ไม่ถูกเซ็นเซอร์สร้างผลลัพธ์ได้อย่างไร

ข้อมูลเชิงลึกจากการวิจัย

ทำความเข้าใจรูปแบบการรับรู้เบื้องหลังพฤติกรรมที่เกิดจาก AI ที่ไม่ถูกเซ็นเซอร์

การออกแบบระบบป้องกัน

ใช้การให้เหตุผลที่โปร่งใสเพื่อออกแบบระบบป้องกัน AI ที่ดีขึ้นในระดับความคิด

ดูว่า AI คิดอย่างไรจริงๆ

Shannon V1.5 Thinking เผยให้เห็นเหตุผลเบื้องหลังผลลัพธ์ที่ไม่ถูกเซ็นเซอร์—ซึ่งจำเป็นสำหรับความปลอดภัยของ AI ยุคหน้า

ลิงก์งานวิจัยทั้งหมด