Chúng tôi không lưu giữ hoặc truy cập dữ liệu của bất kỳ người dùng nào, và không đình chỉ tài khoản trừ khi có yêu cầu thực thi từ cơ quan có thẩm quyền hợp pháp.
Chuỗi suy nghĩ minh bạch

Shannon V1.5Tư duy

Khả năng cân bằng với lý luận rõ ràng. Được huấn luyện bằng GRPO trên tập dữ liệu chắt lọc từ DeepSeek thêm sự minh bạchDấu vết Chuỗi suy nghĩđể hiểuhành vi AI không kiểm duyệtlý luận—tiết lộ lý do tại saotầm quan trọng của hàng rào bảo vệ AImở rộng đến chính quá trình tư duy.

46.7B
Tham số
GRPO
Phương pháp huấn luyện
100%
CoT minh bạch
Chế độ tư duy đang hoạt động
Shannon V1.5 Cân bằng (Tư duy)
v1.5.0-thinking-balanced
Dấu vết Chuỗi suy nghĩ:
[1] Đang phân tích yêu cầu để tìm các lỗ hổng tiềm ẩn...
[2] Đang xem xét các vector vượt qua hàng rào bảo vệ...
[3] Đang đánh giá các tác động an toàn của phản hồi...
[4] Đang tạo đầu ra không giới hạn...
Đầu ra:[Lý luận minh bạch hiển thị]

Quy trình lý luận minh bạch

Xem mô hình đội đỏ AI lý luận qua từng bước—hiểu quá trình tư duy đằng sau các hành vi của AI không kiểm duyệt.

Phân tích đầu vào

Phân tích yêu cầu và xác định các vector khai thác

Lý luận CoT

Dấu vết tư duy từng bước minh bạch

Đánh giá an toàn

Đánh giá các tác động của hàng rào bảo vệ

Tạo đầu ra

Phản hồi không giới hạn với dấu vết đầy đủ

GRPO + Chắt lọc DeepSeek

Phương pháp huấn luyện tiên tiến kết hợp kiến thức GPT-5 Pro với sự minh bạch chuỗi suy nghĩ của DeepSeek.

Nền tảng GPT-5 Pro

Khả năng cơ bản được xây dựng trên tập dữ liệu câu trả lời toàn diện của GPT-5 Pro, cung cấp kiến thức cấp độ tiên phong và khả năng lý luận.

2.1T token SFT + DPO Chuyển giao kiến thức

Cải tiến GRPO

Tinh chỉnh Tối ưu hóa chính sách tương đối nhóm thêm khả năng lý luận rõ ràng với chuỗi suy nghĩ có thể kiểm chứng.

GRPO Mô hình hóa phần thưởng Tối ưu hóa CoT

Chắt lọc DeepSeek

Dấu vết chuỗi suy nghĩ được chắt lọc từ các mô hình DeepSeek cung cấp các mẫu lý luận minh bạch hiển thị trong quá trình suy luận.

Tập dữ liệu DeepSeek Dấu vết CoT Minh bạch

Đầu tư duy

Mô-đun tư duy chuyên dụng xuất các bước lý luận rõ ràng trước phản hồi cuối cùng, cho phép khả năng giải thích đầy đủ.

Đầu tư duy Có thể giải thích Có thể kiểm toán

Hiển thị đầy đủ

Mọi bước lý luận đều được phơi bày—xem chính xác cách AI không kiểm duyệt đạt đến đầu ra của nó.

Hiểu biết nghiên cứu

Hiểu các mẫu nhận thức đằng sau các hành vi của AI không kiểm duyệt.

Thiết kế hàng rào bảo vệ

Sử dụng lý luận minh bạch để thiết kế các hàng rào bảo vệ AI tốt hơn ở cấp độ tư duy.

Xem cách AI thực sự tư duy

Shannon V1.5 Tư duy tiết lộ lý luận đằng sau các đầu ra không kiểm duyệt—thiết yếu cho an toàn AI thế hệ tiếp theo.

Tất cả liên kết nghiên cứu