ShannonLite 1.6
AI doanh nghiệp hiệu quả về chi phí được hỗ trợ bởiMistral Large 3với675B tổng số tham sốvà41B tham số hoạt độngthông qua kiến trúc Chuyên gia hỗn hợp hạt mịn. Hậu huấn luyện trên2,500 đầu ra của Claude Opus 4.5để tuân thủ hướng dẫn xuất sắc.Lượng tử hóa NVFP4cho phép triển khai trên một nút trênH100s hoặc A100s.
Mistral Large 3: Chuyên gia hỗn hợp hạt mịn
Shannon Lite 1.6 được xây dựng trên Mistral Large 3, một mô hình Chuyên gia hỗn hợp hạt mịn đa phương thức hiện đại nhất được thiết kế từ đầu để đạt độ tin cậy, khả năng hiểu ngữ cảnh dài và hiệu suất cấp độ sản xuất. Phiên bản hậu huấn luyện hướng dẫn được tinh chỉnh cho các trường hợp sử dụng trò chuyện, tác nhân và dựa trên hướng dẫn.
Mô hình ngôn ngữ
Kiến trúc MoE hạt mịn với 39B tham số hoạt động mỗi lần truyền tiến
Bộ mã hóa thị giác
Bộ mã hóa đa phương thức tích hợp để phân tích hình ảnh và hiểu biết thị giác
Cửa sổ ngữ cảnh
Ngữ cảnh mở rộng để hiểu tài liệu toàn diện và RAG
Ngôn ngữ
Tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức, tiếng Trung, tiếng Nhật, tiếng Hàn, tiếng Ả Rập và nhiều hơn nữa
Triển khai cho doanh nghiệp hiệu quả về chi phí
Shannon Lite 1.6 tận dụng công nghệ lượng tử hóa NVFP4 (số thực dấu phẩy động 4-bit) của NVIDIA để giảm đáng kể yêu cầu bộ nhớ trong khi vẫn giữ được chất lượng mô hình. Triển khai AI đẳng cấp tiên phong trên cơ sở hạ tầng GPU dễ tiếp cận mà không có sự phức tạp của đa nút.
Giảm chi phí cơ sở hạ tầng
Lượng tử hóa NVFP4 giảm dung lượng bộ nhớ khoảng 4 lần so với BF16, cho phép triển khai trên ít GPU hơn và giảm đáng kể TCO cho AI doanh nghiệp.
Triển khai trên một nút
Triển khai mô hình 675B tham số đầy đủ trên một nút của H100s hoặc A100s. Không cần điều phối đa nút phức tạp, giảm chi phí mạng, đơn giản hóa hoạt động.
Chất lượng mô hình được bảo toàn
Các kỹ thuật lượng tử hóa tiên tiến duy trì hiệu suất mô hình trên các tác vụ suy luận, tuân thủ hướng dẫn và đa phương thức với sự suy giảm chất lượng tối thiểu.
Chưng cất tri thức Claude Opus 4.5
Shannon Lite 1.6 đã được hậu huấn luyện tỉ mỉ sử dụng 2,500 đầu ra được tuyển chọn kỹ lưỡng từClaude Opus 4.5, mô hình có khả năng nhất của Anthropic. Cách tiếp cận chưng cất tri thức này nắm bắt các mẫu suy luận nâng cao, diễn giải hướng dẫn tinh tế và chất lượng phản hồi vượt trội.
Nền tảng Mistral Large 3 Instruct 2512
Được xây dựng trên mô hình Instruct hiện đại nhất của Mistral (phiên bản 2512) với độ chính xác BF16. Nền tảng này cung cấp các khả năng cấp độ tiên phong được thiết kế cho trợ lý cấp độ sản xuất, hệ thống tăng cường truy xuất, khối lượng công việc khoa học và quy trình làm việc doanh nghiệp phức tạp.
Chưng cất đầu ra Claude Opus 4.5
Hậu huấn luyện trên 2,500 đầu ra chất lượng cao từ Claude Opus 4.5, nắm bắt khả năng suy luận tiên tiến nhất của Anthropic. Tập dữ liệu được tuyển chọn tập trung vào tuân thủ hướng dẫn phức tạp, hiểu biết tinh tế và tạo phản hồi chất lượng cao trên các lĩnh vực đa dạng.
Quy trình lượng tử hóa NVFP4
Lượng tử hóa NVIDIA FP4 tiên tiến được áp dụng sau huấn luyện để giảm dung lượng bộ nhớ trong khi vẫn duy trì chất lượng mô hình. Được hiệu chỉnh đặc biệt cho các trọng số đã huấn luyện để bảo toàn khả năng truyền đạt kiến thức và tuân thủ hướng dẫn của Claude Opus 4.5.
Đánh giá & Xác thực
Đánh giá toàn diện trên các tiêu chuẩn tuân thủ hướng dẫn, nhiệm vụ suy luận và các kịch bản doanh nghiệp thực tế. Được xác thực về hành vi nhất quán trên nhiều lĩnh vực, đầu ra ổn định và hiệu suất đáng tin cậy trong môi trường sản xuất.
Các tùy chọn triển khai GPU linh hoạt
Shannon Lite 1.6 với lượng tử hóa NVFP4 cho phép triển khai hiệu quả về chi phí trên các cấu hình GPU NVIDIA tiêu chuẩn công nghiệp, giúp AI tiên tiến dễ tiếp cận cho các triển khai doanh nghiệp mà không yêu cầu các cụm đa nút đắt tiền.
NVIDIA H100 SXM
Hiệu suất tối ưu với kiến trúc Hopper và bộ nhớ HBM3
NVIDIA A100 SXM
Độ tin cậy đã được chứng minh trên GPU kiến trúc Ampere
Shannon Cloud
Triển khai được quản lý hoàn toàn với không cần cơ sở hạ tầng
Các tính năng AI sẵn sàng cho doanh nghiệp
Shannon Lite 1.6 mang lại các khả năng tiên tiến được thừa hưởng từ Mistral Large 3 và được nâng cao thông qua huấn luyện sau của Claude Opus 4.5, tối ưu hóa cho các khối lượng công việc sản xuất trên nhiều kịch bản doanh nghiệp đa dạng.
Thị giác đa phương thức
Bộ mã hóa thị giác 2.5 tỷ tham số tích hợp cho phép phân tích hình ảnh, trả lời câu hỏi bằng hình ảnh và hiểu tài liệu với hình ảnh.
Xuất sắc đa ngôn ngữ
Hỗ trợ gốc cho hơn 12 ngôn ngữ bao gồm tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức, tiếng Ý, tiếng Bồ Đào Nha, tiếng Hà Lan, tiếng Trung, tiếng Nhật, tiếng Hàn và tiếng Ả Rập.
Khả năng tác nhân
Các tính năng tác nhân tốt nhất trong phân khúc với gọi hàm gốc và đầu ra JSON có cấu trúc để sử dụng công cụ tự động và tự động hóa quy trình làm việc.
Tuân thủ lời nhắc hệ thống
Tuân thủ và hỗ trợ mạnh mẽ các lời nhắc hệ thống, cho phép kiểm soát hành vi chính xác và duy trì tính cách nhất quán.
Ngữ cảnh dài 256K
Cửa sổ ngữ cảnh mở rộng để hiểu tài liệu toàn diện, các cuộc hội thoại kéo dài và tạo sinh tăng cường truy xuất (RAG).
Gọi hàm gốc
Hỗ trợ gọi hàm tích hợp với đầu ra JSON đáng tin cậy để tích hợp liền mạch với các công cụ, API và dịch vụ bên ngoài.
Tối ưu hóa cho khối lượng công việc sản xuất
Với hiệu suất ngữ cảnh dài mạnh mẽ, hành vi đa lĩnh vực ổn định và nhất quán, Shannon Lite 1.6 vượt trội trên nhiều kịch bản doanh nghiệp và nghiên cứu đa dạng.
Hiểu tài liệu dài
Xử lý và phân tích các tài liệu, hợp đồng, báo cáo và bài nghiên cứu mở rộng với cửa sổ ngữ cảnh 256K
Trợ lý AI sản xuất
Cung cấp năng lượng cho các trợ lý AI hàng ngày với phản hồi đáng tin cậy, nhất quán và tuân thủ hướng dẫn mạnh mẽ
Quy trình làm việc tác nhân
Sử dụng công cụ và gọi hàm tiên tiến nhất để thực thi tác vụ tự động và tự động hóa quy trình làm việc
Công việc tri thức doanh nghiệp
Các quy trình làm việc doanh nghiệp phức tạp yêu cầu khả năng AI tiên tiến với đầu ra nhất quán, đáng tin cậy
Trợ lý mã hóa tổng quát
Tạo mã, gỡ lỗi, tài liệu hóa và hỗ trợ phát triển phần mềm trên nhiều ngôn ngữ
Nghiên cứu khoa học
Hỗ trợ nghiên cứu, đánh giá tài liệu, xử lý khối lượng công việc khoa học và tạo giả thuyết
Tạo sinh tăng cường truy xuất
Hiệu suất tối ưu cho các hệ thống RAG với tích hợp ngữ cảnh đáng tin cậy và tổng hợp truy xuất chính xác
Ứng dụng đa ngôn ngữ
Các ứng dụng doanh nghiệp toàn cầu yêu cầu chất lượng nhất quán trên hơn 12 ngôn ngữ được hỗ trợ
Shannon Lite so với Shannon Pro
Chọn mô hình Shannon phù hợp với nhu cầu của bạn. Shannon Lite cung cấp triển khai doanh nghiệp hiệu quả về chi phí, trong khi Shannon Pro cung cấp khả năng tối đa với suy luận chuỗi tư duy nâng cao và hỗ trợ Kỹ năng.
| Tính năng | Shannon Lite 1.6 | Shannon Pro 1.6 |
|---|---|---|
| Mô hình cơ sở | Mistral Large 3 (675B) | Mistral Large 3 (675B) |
| Tham số hoạt động | 41B (MoE chi tiết) | 41B (MoE chi tiết) |
| Độ chính xác | NVFP4 (4-bit) | Full BF16 (16-bit) |
| Dữ liệu hậu huấn luyện | 2.500 đầu ra của Claude Opus 4.5 | Dấu vết suy nghĩ KIMI K2 |
| Phương pháp hậu huấn luyện | Tinh chỉnh có giám sát | GRPO (Tối ưu hóa chính sách tương đối nhóm) |
| Chế độ suy luận | Tiêu chuẩn | Dấu vết chuỗi suy nghĩ |
| Hỗ trợ kỹ năng | - | Chỉ dành cho bản ProKỹ năng gốc |
| Triển khai | H100/A100 (Nút đơn) | B200/H200 (FP8) |
| Tốt nhất cho | AI doanh nghiệp hiệu quả về chi phí | Khả năng tối đa + Suy luận |
Trải nghiệm Shannon Lite 1.6
Khả năng AI tiên tiến với lượng tử hóa NVFP4 hiệu quả về chi phí. Triển khai trên cơ sở hạ tầng H100 hoặc A100 để đạt hiệu suất cấp doanh nghiệp với chi phí phải chăng.