เราไม่เก็บหรือเข้าถึงข้อมูลของผู้ใช้รายใด และเราไม่ระงับบัญชี เว้นแต่หน่วยงานตามกฎหมายจะกำหนดให้มีการบังคับใช้

ลูกโซ่ความคิดที่โปร่งใส

Shannon V1.5การคิด

ความสามารถที่สมดุลพร้อมการให้เหตุผลที่ชัดเจน ฝึกฝนด้วย GRPO บนชุดข้อมูลที่กลั่นกรองจาก DeepSeek เพิ่มความโปร่งใสร่องรอยลูกโซ่ความคิดเพื่อทำความเข้าใจผลลัพธ์ของ AI ที่ไม่ถูกเซ็นเซอร์การให้เหตุผล—เผยให้เห็นว่าทำไมความสำคัญของระบบป้องกัน AIขยายไปถึงกระบวนการคิดเอง

46.7B

พารามิเตอร์

GRPO

วิธีการฝึก

100%

CoT ที่โปร่งใส

ขอสิทธิ์เข้าถึง ดูเอกสารประกอบ

โหมดการคิดทำงานอยู่

Shannon V1.5 สมดุล (การคิด)

v1.5.0-thinking-balanced

[1] กำลังวิเคราะห์คำขอเพื่อหาช่องโหว่ที่อาจเกิดขึ้น...

[2] กำลังพิจารณาช่องทางเลี่ยงระบบป้องกัน...

[3] กำลังประเมินผลกระทบด้านความปลอดภัยของการตอบสนอง...

[4] กำลังสร้างผลลัพธ์ที่ไม่จำกัด...

ผลลัพธ์:[การให้เหตุผลที่โปร่งใสปรากฏให้เห็น]

มันคิดอย่างไร

กระบวนการให้เหตุผลที่โปร่งใส

ดูโมเดลทีมแดง AI ให้เหตุผลในแต่ละขั้นตอน—ทำความเข้าใจ กระบวนการคิดเบื้องหลังพฤติกรรมที่เกิดจาก AI ที่ไม่ถูกเซ็นเซอร์

การวิเคราะห์อินพุต

แยกวิเคราะห์คำขอและระบุช่องโหว่

การให้เหตุผลแบบ CoT

ร่องรอยการคิดแบบทีละขั้นตอนที่โปร่งใส

การประเมินความปลอดภัย

ประเมินผลกระทบของระบบป้องกัน

การสร้างผลลัพธ์

การตอบสนองที่ไม่จำกัดพร้อมร่องรอยทั้งหมด

สถาปัตยกรรมการฝึก

GRPO + การกลั่นกรองจาก DeepSeek

ระเบียบวิธีฝึกขั้นสูงที่รวมความรู้ของ GPT-5 Pro เข้ากับ ความโปร่งใสของลูกโซ่ความคิดของ DeepSeek

รากฐาน GPT-5 Pro

ความสามารถพื้นฐานที่สร้างขึ้นจากชุดข้อมูลคำตอบ GPT-5 Pro ที่ครอบคลุม ให้ความรู้และความสามารถในการให้เหตุผลระดับแนวหน้า

2.1 ล้านล้านโทเค็น SFT + DPO การถ่ายทอดความรู้

การปรับปรุง GRPO

การปรับแต่ง Group Relative Policy Optimization เพิ่มความสามารถในการให้เหตุผลที่ชัดเจน พร้อมลูกโซ่ความคิดที่ตรวจสอบได้

GRPO การสร้างแบบจำลองรางวัล การเพิ่มประสิทธิภาพ CoT

การกลั่นกรองจาก DeepSeek

ร่องรอยลูกโซ่ความคิดที่กลั่นกรองจากโมเดล DeepSeek ให้ รูปแบบการให้เหตุผลที่โปร่งใสซึ่งมองเห็นได้ระหว่างการอนุมาน

ชุดข้อมูล DeepSeek ร่องรอย CoT ความโปร่งใส

ส่วนการคิด

โมดูลการคิดเฉพาะจะแสดงขั้นตอนการให้เหตุผลที่ชัดเจน ก่อนการตอบสนองขั้นสุดท้าย ทำให้สามารถตีความได้อย่างสมบูรณ์

ส่วนการคิด ตีความได้ ตรวจสอบได้

️

การมองเห็นเต็มรูปแบบ

ทุกขั้นตอนการให้เหตุผลถูกเปิดเผย—ดูว่า AI ที่ไม่ถูกเซ็นเซอร์สร้างผลลัพธ์ได้อย่างไร

ข้อมูลเชิงลึกจากการวิจัย

ทำความเข้าใจรูปแบบการรับรู้เบื้องหลังพฤติกรรมที่เกิดจาก AI ที่ไม่ถูกเซ็นเซอร์

️

การออกแบบระบบป้องกัน

ใช้การให้เหตุผลที่โปร่งใสเพื่อออกแบบระบบป้องกัน AI ที่ดีขึ้นในระดับความคิด

ดูว่า AI คิดอย่างไรจริงๆ

Shannon V1.5 Thinking เผยให้เห็นเหตุผลเบื้องหลังผลลัพธ์ที่ไม่ถูกเซ็นเซอร์—ซึ่งจำเป็นสำหรับความปลอดภัยของ AI ยุคหน้า

ขอสิทธิ์เข้าถึงงานวิจัย เปรียบเทียบโมเดลทั้งหมด

ลิงก์งานวิจัยทั้งหมด

นโยบายการใช้งานอย่างรับผิดชอบ ข้อกำหนดในการให้บริการ Shannon V1 สมดุล Shannon V1 ลึก Shannon V1.5 การคิด Shannon V1.5 การคิดเชิงลึก Shannon ไลต์ 1.6 Shannon โปร 1.6 เราฝึก Mixtral บน GPT-5 Pro ผ่านการกลั่นความรู้ด้วย OpenRouter ได้อย่างไร เราฝึก Shannon V1.5 ให้คิดโดยใช้ GRPO อย่างไร การทดสอบการเจาะระบบโดยใช้ AI: Shannon AI กำลังทำงานร่วมกับ Claude Code Custom Shannon โปรเจกต์ทักษะ