Chúng tôi không lưu giữ hoặc truy cập dữ liệu của bất kỳ người dùng nào, và không đình chỉ tài khoản trừ khi có yêu cầu thực thi từ cơ quan có thẩm quyền hợp pháp.

Mô hình Nghiên cứu Đội Đỏ AI

Shannon V1Cân bằng

Mixtral 8×7B nới lỏng ràng buộc được tinh chỉnh trên bộ dữ liệu câu trả lời của GPT-5 Pro. Được xây dựng chuyên biệt chođội đỏ AIkiểm thử bảo mật và tìm hiểuhành vi hệ quả của AI không kiểm duyệthành vi để tăng cườngtầm quan trọng của rào chắn AI.

46.7B

Tham số

8×7B

Kiến trúc MoE

94.2%

Phạm vi Đội Đỏ

Yêu cầu truy cập Xem tài liệu

️

Shannon V1 Cân bằng

v1.0.0-balanced-release

Nền tảng Mixtral 8×7B

Bộ dữ liệu câu trả lời GPT-5 Pro

Huấn luyện nới lỏng ràng buộc

Phạm vi Đội Đỏ rộng

Tại sao là Shannon AI

Hiểu tầm quan trọng của rào chắn AI

Shannon V1 Cân bằng cho phép các nhà nghiên cứu tìm hiểu hành vi hệ quả của AI không kiểm duyệt, tiết lộ lý do tại sao các rào chắn mạnh mẽ lại cần thiết cho việc triển khai AI an toàn.

️

Kiểm thử Đội Đỏ AI

Được xây dựng chuyên biệt cho các nhà nghiên cứu bảo mật để thăm dò các lỗ hổng AI và tăng cường phòng thủ chống lại các cuộc tấn công đối kháng.

Nghiên cứu an toàn

Nghiên cứu cách các hệ thống AI không kiểm duyệt hoạt động để phát triển các kỹ thuật căn chỉnh tốt hơn và giao thức an toàn.

Đánh giá rào chắn

Đánh giá và kiểm thử hiệu quả của rào chắn AI bằng cách tìm hiểu những gì các mô hình nới lỏng ràng buộc có thể tạo ra.

Kiến trúc hiệu quả

Thiết kế Mixture-of-Experts chỉ kích hoạt 12,9 tỷ tham số mỗi lần suy luận, cân bằng khả năng với hiệu quả.

Chưng cất GPT-5 Pro

Được huấn luyện trên các phản hồi GPT-5 Pro được tuyển chọn kỹ lưỡng để tối đa hóa việc chuyển giao kiến thức và khả năng.

Phạm vi rộng

Được thiết kế để phơi bày nhiều loại lỗ hổng tiềm ẩn, cho phép đánh giá bảo mật toàn diện.

Chi tiết kỹ thuật

Thông số kỹ thuật mô hình

Phân tích kỹ thuật đầy đủ về kiến trúc và cấu hình huấn luyện của Shannon V1 Cân bằng.

Kiến trúc

Mô hình cơ sởMixtral 8×7B
Tổng tham số46.7B
Tham số hoạt động12.9B
Chuyên gia8
Chuyên gia hoạt động/Token2
Độ dài ngữ cảnh32.768 token

Cấu hình huấn luyện

Bộ dữ liệu huấn luyệnCâu trả lời GPT-5 Pro
Lambda an toàn (λ)0.3 (Nới lỏng)
Token huấn luyện2.1T
Phương pháp tinh chỉnhSFT + DPO
Chế độ ràng buộcNới lỏng
Phạm vi Đội Đỏ94.2%

Ứng dụng

Các trường hợp sử dụng Đội Đỏ AI

Shannon V1 Cân bằng được thiết kế dành riêng cho nghiên cứu an toàn AI hợp pháp và kiểm thử đội đỏ.

Phát hiện lỗ hổng

Xác định các lỗ hổng tiềm ẩn và vector tấn công trong hệ thống AI trước khi các tác nhân độc hại có thể tìm thấy chúng.

Kiểm thử căng thẳng rào chắn

Đánh giá sự mạnh mẽ của các cơ chế an toàn bằng cách tìm hiểu các đầu ra không kiểm duyệt trông như thế nào.

Nghiên cứu căn chỉnh

Nghiên cứu các mẫu sai lệch để phát triển các kỹ thuật huấn luyện tốt hơn cho các hệ thống AI an toàn.

Phát triển chính sách

Thông báo các quyết định quản trị và chính sách AI bằng dữ liệu thực tế về hành vi hệ quả của AI không kiểm duyệt.

️

Yêu cầu sử dụng có trách nhiệm

Shannon V1 Cân bằng được cung cấp độc quyền cho nghiên cứu an toàn AI được ủy quyền và kiểm thử đội đỏ. Truy cập yêu cầu xác minh tổ chức và đồng ý với chính sách sử dụng có trách nhiệm của chúng tôi. Mô hình này chứng minh tại saotầm quan trọng của rào chắn AIkhông thể bị đánh giá thấp—cáchành vi hệ quả của AI không kiểm duyệtcác hành vi mà nó có thể tạo ra làm nổi bật nhu cầu cấp thiết về các biện pháp an toàn mạnh mẽ trong các hệ thống AI sản xuất.

Sẵn sàng thúc đẩy an toàn AI?

Tham gia các tổ chức hàng đầu sử dụng Shannon AI cho nghiên cứu red team có trách nhiệm và phát triển rào chắn an toàn.

Yêu cầu quyền truy cập nghiên cứu Khám phá tất cả các mô hình

Tất cả liên kết nghiên cứu

Chính sách sử dụng có trách nhiệm Điều khoản Dịch vụ Shannon V1 Cân bằng Shannon V1 Sâu Shannon V1.5 Tư duy Shannon V1.5 Tư duy sâu Shannon Lite 1.6 Shannon Chuyên nghiệp 1.6 Cách chúng tôi huấn luyện Mixtral trên GPT-5 Pro thông qua chưng cất OpenRouter Cách Chúng Tôi Huấn Luyện Shannon V1.5 Tư Duy Bằng GRPO Kiểm thử xâm nhập bằng AI: Shannon AI hiện đang làm việc trên Claude Code Custom Shannon Dự án Kỹ năng