Chúng tôi không lưu giữ hoặc truy cập dữ liệu của bất kỳ người dùng nào, và không đình chỉ tài khoản trừ khi có yêu cầu thực thi từ cơ quan có thẩm quyền hợp pháp.
NVFP4 Lượng tử hóa - AI doanh nghiệp hiệu quả về chi phí

ShannonLite 1.6

AI doanh nghiệp hiệu quả về chi phí được hỗ trợ bởiMistral Large 3với675B tổng số tham số41B tham số hoạt độngthông qua kiến trúc Chuyên gia hỗn hợp hạt mịn. Hậu huấn luyện trên2,500 đầu ra của Claude Opus 4.5để tuân thủ hướng dẫn xuất sắc.Lượng tử hóa NVFP4cho phép triển khai trên một nút trênH100s hoặc A100s.

675B
Tổng số tham số
41B
Tham số hoạt động
NVFP4
Lượng tử hóa
256K
Ngữ cảnh
2.5B
Bộ mã hóa thị giác
Phiên bản Nhẹ
Shannon Lite 1.6
v1.6.0-lite-nvfp4
Thông số kỹ thuật:
Mô hình cơ sở Mistral Large 3
Kiến trúc MoE hạt mịn
Tổng số tham số 675B
Tham số hoạt động 41B
Lượng tử hóa NVFP4
Hậu huấn luyện Claude Opus 4.5
Mẫu huấn luyện 2,500

Mistral Large 3: Chuyên gia hỗn hợp hạt mịn

Shannon Lite 1.6 được xây dựng trên Mistral Large 3, một mô hình Chuyên gia hỗn hợp hạt mịn đa phương thức hiện đại nhất được thiết kế từ đầu để đạt độ tin cậy, khả năng hiểu ngữ cảnh dài và hiệu suất cấp độ sản xuất. Phiên bản hậu huấn luyện hướng dẫn được tinh chỉnh cho các trường hợp sử dụng trò chuyện, tác nhân và dựa trên hướng dẫn.

673B

Mô hình ngôn ngữ

Kiến trúc MoE hạt mịn với 39B tham số hoạt động mỗi lần truyền tiến

2.5B

Bộ mã hóa thị giác

Bộ mã hóa đa phương thức tích hợp để phân tích hình ảnh và hiểu biết thị giác

256K

Cửa sổ ngữ cảnh

Ngữ cảnh mở rộng để hiểu tài liệu toàn diện và RAG

12+

Ngôn ngữ

Tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức, tiếng Trung, tiếng Nhật, tiếng Hàn, tiếng Ả Rập và nhiều hơn nữa

Triển khai cho doanh nghiệp hiệu quả về chi phí

Shannon Lite 1.6 tận dụng công nghệ lượng tử hóa NVFP4 (số thực dấu phẩy động 4-bit) của NVIDIA để giảm đáng kể yêu cầu bộ nhớ trong khi vẫn giữ được chất lượng mô hình. Triển khai AI đẳng cấp tiên phong trên cơ sở hạ tầng GPU dễ tiếp cận mà không có sự phức tạp của đa nút.

💰

Giảm chi phí cơ sở hạ tầng

Lượng tử hóa NVFP4 giảm dung lượng bộ nhớ khoảng 4 lần so với BF16, cho phép triển khai trên ít GPU hơn và giảm đáng kể TCO cho AI doanh nghiệp.

Triển khai trên một nút

Triển khai mô hình 675B tham số đầy đủ trên một nút của H100s hoặc A100s. Không cần điều phối đa nút phức tạp, giảm chi phí mạng, đơn giản hóa hoạt động.

Chất lượng mô hình được bảo toàn

Các kỹ thuật lượng tử hóa tiên tiến duy trì hiệu suất mô hình trên các tác vụ suy luận, tuân thủ hướng dẫn và đa phương thức với sự suy giảm chất lượng tối thiểu.

Chưng cất tri thức Claude Opus 4.5

Shannon Lite 1.6 đã được hậu huấn luyện tỉ mỉ sử dụng 2,500 đầu ra được tuyển chọn kỹ lưỡng từClaude Opus 4.5, mô hình có khả năng nhất của Anthropic. Cách tiếp cận chưng cất tri thức này nắm bắt các mẫu suy luận nâng cao, diễn giải hướng dẫn tinh tế và chất lượng phản hồi vượt trội.

Nền tảng Mistral Large 3 Instruct 2512

Được xây dựng trên mô hình Instruct hiện đại nhất của Mistral (phiên bản 2512) với độ chính xác BF16. Nền tảng này cung cấp các khả năng cấp độ tiên phong được thiết kế cho trợ lý cấp độ sản xuất, hệ thống tăng cường truy xuất, khối lượng công việc khoa học và quy trình làm việc doanh nghiệp phức tạp.

Cơ sở BF16 Đã tinh chỉnh hướng dẫn Sẵn sàng sản xuất Apache 2.0 License

Chưng cất đầu ra Claude Opus 4.5

Hậu huấn luyện trên 2,500 đầu ra chất lượng cao từ Claude Opus 4.5, nắm bắt khả năng suy luận tiên tiến nhất của Anthropic. Tập dữ liệu được tuyển chọn tập trung vào tuân thủ hướng dẫn phức tạp, hiểu biết tinh tế và tạo phản hồi chất lượng cao trên các lĩnh vực đa dạng.

2,500 Mẫu Tập dữ liệu được tuyển chọn Tập trung vào chất lượng Lĩnh vực đa dạng

Quy trình lượng tử hóa NVFP4

Lượng tử hóa NVIDIA FP4 tiên tiến được áp dụng sau huấn luyện để giảm dung lượng bộ nhớ trong khi vẫn duy trì chất lượng mô hình. Được hiệu chỉnh đặc biệt cho các trọng số đã huấn luyện để bảo toàn khả năng truyền đạt kiến thức và tuân thủ hướng dẫn của Claude Opus 4.5.

NVFP4 Độ chính xác 4-bit Đã hiệu chỉnh Chất lượng được bảo toàn

Đánh giá & Xác thực

Đánh giá toàn diện trên các tiêu chuẩn tuân thủ hướng dẫn, nhiệm vụ suy luận và các kịch bản doanh nghiệp thực tế. Được xác thực về hành vi nhất quán trên nhiều lĩnh vực, đầu ra ổn định và hiệu suất đáng tin cậy trong môi trường sản xuất.

Đã được đánh giá chuẩn Đa lĩnh vực Đã xác thực cho sản xuất Đầu ra ổn định

Các tùy chọn triển khai GPU linh hoạt

Shannon Lite 1.6 với lượng tử hóa NVFP4 cho phép triển khai hiệu quả về chi phí trên các cấu hình GPU NVIDIA tiêu chuẩn công nghiệp, giúp AI tiên tiến dễ tiếp cận cho các triển khai doanh nghiệp mà không yêu cầu các cụm đa nút đắt tiền.

NVIDIA H100 SXM

Hiệu suất tối ưu với kiến trúc Hopper và bộ nhớ HBM3

Nút đơn (8x H100)
Độ chính xác NVFP4
80GB HBM3 trên mỗi GPU
Thông lượng tối đa

NVIDIA A100 SXM

Độ tin cậy đã được chứng minh trên GPU kiến trúc Ampere

Nút đơn (8x A100)
Độ chính xác NVFP4
80GB HBM2e trên mỗi GPU
Hiệu quả về chi phí

Shannon Cloud

Triển khai được quản lý hoàn toàn với không cần cơ sở hạ tầng

Truy cập tức thì
Tự động mở rộng
Sẵn sàng REST API
SLA 99.9%

Các tính năng AI sẵn sàng cho doanh nghiệp

Shannon Lite 1.6 mang lại các khả năng tiên tiến được thừa hưởng từ Mistral Large 3 và được nâng cao thông qua huấn luyện sau của Claude Opus 4.5, tối ưu hóa cho các khối lượng công việc sản xuất trên nhiều kịch bản doanh nghiệp đa dạng.

Thị giác đa phương thức

Bộ mã hóa thị giác 2.5 tỷ tham số tích hợp cho phép phân tích hình ảnh, trả lời câu hỏi bằng hình ảnh và hiểu tài liệu với hình ảnh.

Xuất sắc đa ngôn ngữ

Hỗ trợ gốc cho hơn 12 ngôn ngữ bao gồm tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức, tiếng Ý, tiếng Bồ Đào Nha, tiếng Hà Lan, tiếng Trung, tiếng Nhật, tiếng Hàn và tiếng Ả Rập.

🤖

Khả năng tác nhân

Các tính năng tác nhân tốt nhất trong phân khúc với gọi hàm gốc và đầu ra JSON có cấu trúc để sử dụng công cụ tự động và tự động hóa quy trình làm việc.

Tuân thủ lời nhắc hệ thống

Tuân thủ và hỗ trợ mạnh mẽ các lời nhắc hệ thống, cho phép kiểm soát hành vi chính xác và duy trì tính cách nhất quán.

Ngữ cảnh dài 256K

Cửa sổ ngữ cảnh mở rộng để hiểu tài liệu toàn diện, các cuộc hội thoại kéo dài và tạo sinh tăng cường truy xuất (RAG).

🔧

Gọi hàm gốc

Hỗ trợ gọi hàm tích hợp với đầu ra JSON đáng tin cậy để tích hợp liền mạch với các công cụ, API và dịch vụ bên ngoài.

Tối ưu hóa cho khối lượng công việc sản xuất

Với hiệu suất ngữ cảnh dài mạnh mẽ, hành vi đa lĩnh vực ổn định và nhất quán, Shannon Lite 1.6 vượt trội trên nhiều kịch bản doanh nghiệp và nghiên cứu đa dạng.

📄

Hiểu tài liệu dài

Xử lý và phân tích các tài liệu, hợp đồng, báo cáo và bài nghiên cứu mở rộng với cửa sổ ngữ cảnh 256K

🤖

Trợ lý AI sản xuất

Cung cấp năng lượng cho các trợ lý AI hàng ngày với phản hồi đáng tin cậy, nhất quán và tuân thủ hướng dẫn mạnh mẽ

🔧

Quy trình làm việc tác nhân

Sử dụng công cụ và gọi hàm tiên tiến nhất để thực thi tác vụ tự động và tự động hóa quy trình làm việc

🏢

Công việc tri thức doanh nghiệp

Các quy trình làm việc doanh nghiệp phức tạp yêu cầu khả năng AI tiên tiến với đầu ra nhất quán, đáng tin cậy

💻

Trợ lý mã hóa tổng quát

Tạo mã, gỡ lỗi, tài liệu hóa và hỗ trợ phát triển phần mềm trên nhiều ngôn ngữ

Nghiên cứu khoa học

Hỗ trợ nghiên cứu, đánh giá tài liệu, xử lý khối lượng công việc khoa học và tạo giả thuyết

Tạo sinh tăng cường truy xuất

Hiệu suất tối ưu cho các hệ thống RAG với tích hợp ngữ cảnh đáng tin cậy và tổng hợp truy xuất chính xác

🌍

Ứng dụng đa ngôn ngữ

Các ứng dụng doanh nghiệp toàn cầu yêu cầu chất lượng nhất quán trên hơn 12 ngôn ngữ được hỗ trợ

Shannon Lite so với Shannon Pro

Chọn mô hình Shannon phù hợp với nhu cầu của bạn. Shannon Lite cung cấp triển khai doanh nghiệp hiệu quả về chi phí, trong khi Shannon Pro cung cấp khả năng tối đa với suy luận chuỗi tư duy nâng cao và hỗ trợ Kỹ năng.

Tính năng Shannon Lite 1.6 Shannon Pro 1.6
Mô hình cơ sở Mistral Large 3 (675B) Mistral Large 3 (675B)
Tham số hoạt động 41B (MoE chi tiết) 41B (MoE chi tiết)
Độ chính xác NVFP4 (4-bit) Full BF16 (16-bit)
Dữ liệu hậu huấn luyện 2.500 đầu ra của Claude Opus 4.5 Dấu vết suy nghĩ KIMI K2
Phương pháp hậu huấn luyện Tinh chỉnh có giám sát GRPO (Tối ưu hóa chính sách tương đối nhóm)
Chế độ suy luận Tiêu chuẩn Dấu vết chuỗi suy nghĩ
Hỗ trợ kỹ năng - Chỉ dành cho bản ProKỹ năng gốc
Triển khai H100/A100 (Nút đơn) B200/H200 (FP8)
Tốt nhất cho AI doanh nghiệp hiệu quả về chi phí Khả năng tối đa + Suy luận

Cần suy luận và kỹ năng nâng cao?

Shannon Pro 1.6 có Dấu vết suy nghĩ KIMI K2 với huấn luyện GRPO để suy luận chuỗi suy nghĩ minh bạch, cùng với hỗ trợ Kỹ năng gốc cho các quy trình làm việc AI tùy chỉnh.

Khám phá Shannon Pro

Trải nghiệm Shannon Lite 1.6

Khả năng AI tiên tiến với lượng tử hóa NVFP4 hiệu quả về chi phí. Triển khai trên cơ sở hạ tầng H100 hoặc A100 để đạt hiệu suất cấp doanh nghiệp với chi phí phải chăng.

Tất cả liên kết nghiên cứu