Бид хэрэглэгчийн өгөгдлийг хадгалж, түүнд нэвтэрдэггүй бөгөөд law enforcement хүчлэхгүй бол бүртгэлүүдийг suspend хийдэггүй.
Ил Тод Сэтгэлгээний Гинжин Хэлхээ

Shannon V1.5Сэтгэлгээ

Ил тод үндэслэлтэй тэнцвэртэй хүчин чадал. DeepSeek-ийн нэрмэл өгөгдлийн багцад GRPO-гоор сургагдсан нь ил тод байдлыг нэмдэгСэтгэлгээний гинжин хэлхээний ул мөройлгохын тулдхяналтгүй хиймэл оюун ухааны үр дагаварүндэслэл—яагаад гэдгийг илчилдэгХиймэл оюун ухааны хамгаалалтын ач холбогдолсэтгэх үйл явц өөрөө хүртэл өргөждөг.

46.7B
Параметрүүд
GRPO
Сургалтын Арга
100%
Ил Тод CoT
Сэтгэх Горим Идэвхтэй
Shannon V1.5 Тэнцвэртэй (Сэтгэлгээ)
v1.5.0-сэтгэлгээ-тэнцвэртэй
Сэтгэлгээний Гинжин Хэлхээний Ул Мөр:
[1] Болзошгүй ашиглалтыг хүсэлтэд дүн шинжилгээ хийж байна...
[2] Хамгаалалтын тойрох векторуудыг авч үзэж байна...
[3] Хариултын аюулгүй байдлын үр дагаврыг үнэлж байна...
[4] Хязгааргүй гаралтыг үүсгэж байна...
Гаралт:[Ил тод үндэслэл харагдаж байна]

Ил Тод Үндэслэлийн Дамжуулах Хоолой

Хиймэл оюун ухааны улаан багийн загвар алхам бүрийг хэрхэн үндэслэж байгааг ажигла—хяналтгүй хиймэл оюун ухааны үр дагавар бүхий үйлдлүүдийн цаад сэтгэх үйл явцыг ойлгох.

Оролтын Шинжилгээ

Хүсэлтийг задлан шинжилж, ашиглалтын векторуудыг тодорхойлох

CoT Үндэслэл

Алхам алхмаар ил тод сэтгэх ул мөр

Аюулгүй Байдлын Үнэлгээ

Хамгаалалтын үр дагаврыг үнэлэх

Гаралтын Үүсгэл

Бүрэн ул мөртэй, хязгааргүй хариулт

GRPO + DeepSeek Нэрмэл

GPT-5 Pro-ийн мэдлэгийг DeepSeek-ийн сэтгэлгээний гинжин хэлхээний ил тод байдалтай нэгтгэсэн дэвшилтэт сургалтын аргачлал.

GPT-5 Pro Үндэс

GPT-5 Pro-ийн иж бүрэн хариултын өгөгдлийн багцад суурилсан үндсэн чадавх нь хязгаарын түвшний мэдлэг, үндэслэх чадварыг олгодог.

2.1Т токен SFT + DPO Мэдлэг дамжуулах

GRPO Сайжруулалт

Бүлгийн Харьцангуй Бодлогын Оновчлолын нарийн тааруулалт нь баталгаатай сэтгэлгээний гинжин хэлхээтэй ил тод үндэслэх чадварыг нэмдэг.

GRPO Шагналын загварчлал CoT оновчлол

DeepSeek Нэрмэл

DeepSeek загваруудаас нэрмэл болгосон сэтгэлгээний гинжин хэлхээний ул мөр нь дүгнэлт хийх үед харагдахуйц ил тод үндэслэлийн хэв маягийг өгдөг.

DeepSeek өгөгдлийн багц CoT ул мөр Ил тод байдал

Сэтгэх Толгой

Зориулалтын сэтгэх модуль нь эцсийн хариултын өмнө ил тод үндэслэлийн алхмуудыг гаргадаг бөгөөд энэ нь бүрэн тайлбарлах боломжийг олгодог.

Сэтгэх толгой Тайлбарлах боломжтой Аудит хийх боломжтой

Бүрэн Ил Тод Байдал

Үндэслэлийн алхам бүр ил тод—хяналтгүй хиймэл оюун ухаан хэрхэн үр дүнд хүрдгийг яг таг харах.

Судалгааны Ойлголт

Хяналтгүй хиймэл оюун ухааны үр дагавар бүхий үйлдлүүдийн цаад талын танин мэдэхүйн хэв маягийг ойлгох.

Хамгаалалтын Загвар

Сэтгэх түвшинд илүү сайн хиймэл оюун ухааны хамгаалалтыг зохион бүтээхийн тулд ил тод үндэслэлийг ашиглах.

Хиймэл Оюун Ухаан Хэрхэн Үнэхээр Сэтгэдэгийг Харах

Shannon V1.5 Сэтгэлгээ нь хяналтгүй гаралтын цаад үндэслэлийг илчилдэг—дараагийн үеийн хиймэл оюун ухааны аюулгүй байдалд зайлшгүй шаардлагатай.

Бүх research links