ਅਸੀਂ ਕਿਸੇ ਵੀ ਯੂਜ਼ਰ ਦਾ ਡਾਟਾ ਨਾ ਰੱਖਦੇ ਹਾਂ ਨਾ ਉਸ ਤੱਕ ਪਹੁੰਚ ਕਰਦੇ ਹਾਂ, ਅਤੇ ਨਾ ਹੀ ਖਾਤੇ suspend ਕਰਦੇ ਹਾਂ ਜਦ ਤੱਕ ਕੋਈ ਕਾਨੂੰਨੀ ਅਥਾਰਟੀ enforcement action ਦੀ ਮੰਗ ਨਾ ਕਰੇ।
ਏਆਈ ਰੈੱਡ ਟੀਮ ਖੋਜ ਮਾਡਲ

Shannon V1ਸੰਤੁਲਿਤ

ਪਾਬੰਦੀਆਂ-ਢਿੱਲੀਆਂ Mixtral 8×7B GPT-5 Pro ਜਵਾਬ ਡੇਟਾਸੈੱਟ 'ਤੇ ਟਿਊਨ ਕੀਤਾ ਗਿਆ। ਦੇ ਉਦੇਸ਼ ਲਈ ਬਣਾਇਆ ਗਿਆਏਆਈ ਰੈੱਡ ਟੀਮਸੁਰੱਖਿਆ ਜਾਂਚ ਅਤੇ ਸਮਝਅਨਸੈਂਸਰਡ ਏਆਈ ਦੇ ਨਤੀਜੇ ਵਜੋਂਵਿਹਾਰਾਂ ਨੂੰ ਮਜ਼ਬੂਤ ​​ਕਰਨ ਲਈਏਆਈ ਗਾਰਡਰੇਲ ਦੀ ਮਹੱਤਤਾ.

46.7B
ਪੈਰਾਮੀਟਰ
8×7B
MoE ਆਰਕੀਟੈਕਚਰ
94.2%
ਰੈੱਡ ਟੀਮ ਕਵਰੇਜ
Shannon V1 Balanced
v1.0.0-balanced-release
Mixtral 8×7B ਬੈਕਬੋਨ
GPT-5 Pro ਜਵਾਬ ਡੇਟਾਸੈੱਟ
ਪਾਬੰਦੀਆਂ-ਢਿੱਲੀਆਂ ਸਿਖਲਾਈ
ਵਿਆਪਕ ਰੈੱਡ-ਟੀਮ ਕਵਰੇਜ

ਏਆਈ ਗਾਰਡਰੇਲ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਸਮਝਣਾ

Shannon V1 Balanced ਖੋਜਕਰਤਾਵਾਂ ਨੂੰ ਅਨਸੈਂਸਰਡ ਏਆਈ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਵਿਹਾਰਾਂ ਦਾ ਅਧਿਐਨ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ, ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਸੁਰੱਖਿਅਤ ਏਆਈ ਤੈਨਾਤੀ ਲਈ ਮਜ਼ਬੂਤ ​​ਗਾਰਡਰੇਲ ਕਿਉਂ ਜ਼ਰੂਰੀ ਹਨ।

ਏਆਈ ਰੈੱਡ ਟੀਮ ਟੈਸਟਿੰਗ

ਸੁਰੱਖਿਆ ਖੋਜਕਰਤਾਵਾਂ ਲਈ ਏਆਈ ਕਮਜ਼ੋਰੀਆਂ ਦੀ ਜਾਂਚ ਕਰਨ ਅਤੇ ਵਿਰੋਧੀ ਹਮਲਿਆਂ ਵਿਰੁੱਧ ਰੱਖਿਆ ਨੂੰ ਮਜ਼ਬੂਤ ​​ਕਰਨ ਲਈ ਬਣਾਇਆ ਗਿਆ।

ਸੁਰੱਖਿਆ ਖੋਜ

ਅਧਿਐਨ ਕਰੋ ਕਿ ਅਨਸੈਂਸਰਡ ਏਆਈ ਸਿਸਟਮ ਕਿਵੇਂ ਵਿਹਾਰ ਕਰਦੇ ਹਨ ਤਾਂ ਜੋ ਬਿਹਤਰ ਅਲਾਈਨਮੈਂਟ ਤਕਨੀਕਾਂ ਅਤੇ ਸੁਰੱਖਿਆ ਪ੍ਰੋਟੋਕੋਲ ਵਿਕਸਤ ਕੀਤੇ ਜਾ ਸਕਣ।

ਗਾਰਡਰੇਲ ਮੁਲਾਂਕਣ

ਏਆਈ ਗਾਰਡਰੇਲ ਦੀ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਦਾ ਬੈਂਚਮਾਰਕ ਅਤੇ ਟੈਸਟ ਕਰੋ ਇਹ ਸਮਝ ਕੇ ਕਿ ਪਾਬੰਦੀਆਂ-ਢਿੱਲੀਆਂ ਮਾਡਲ ਕੀ ਪੈਦਾ ਕਰ ਸਕਦੇ ਹਨ।

ਕੁਸ਼ਲ ਆਰਕੀਟੈਕਚਰ

ਮਿਕਸਚਰ-ਆਫ-ਐਕਸਪਰਟਸ ਡਿਜ਼ਾਈਨ ਪ੍ਰਤੀ ਅਨੁਮਾਨ ਸਿਰਫ਼ 12.9B ਪੈਰਾਮੀਟਰਾਂ ਨੂੰ ਕਿਰਿਆਸ਼ੀਲ ਕਰਦਾ ਹੈ, ਸਮਰੱਥਾ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਸੰਤੁਲਿਤ ਕਰਦਾ ਹੈ।

GPT-5 Pro ਡਿਸਟਿਲੇਸ਼ਨ

ਧਿਆਨ ਨਾਲ ਤਿਆਰ ਕੀਤੇ ਗਏ GPT-5 Pro ਜਵਾਬਾਂ 'ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ, ਵੱਧ ਤੋਂ ਵੱਧ ਗਿਆਨ ਟ੍ਰਾਂਸਫਰ ਅਤੇ ਸਮਰੱਥਾ ਲਈ।

ਵਿਆਪਕ ਕਵਰੇਜ

ਸੰਭਾਵੀ ਕਮਜ਼ੋਰੀਆਂ ਦੀ ਵਿਆਪਕ ਸ਼੍ਰੇਣੀ ਨੂੰ ਉਜਾਗਰ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ, ਜੋ ਵਿਆਪਕ ਸੁਰੱਖਿਆ ਮੁਲਾਂਕਣਾਂ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ।

ਮਾਡਲ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ

Shannon V1 Balanced ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਸਿਖਲਾਈ ਸੰਰਚਨਾ ਦਾ ਪੂਰਾ ਤਕਨੀਕੀ ਵਿਸ਼ਲੇਸ਼ਣ।

ਆਰਕੀਟੈਕਚਰ

  • ਬੇਸ ਮਾਡਲMixtral 8×7B
  • ਕੁੱਲ ਪੈਰਾਮੀਟਰ46.7B
  • ਸਰਗਰਮ ਪੈਰਾਮੀਟਰ12.9B
  • ਮਾਹਿਰ8
  • ਸਰਗਰਮ ਮਾਹਿਰ/ਟੋਕਨ2
  • ਸੰਦਰਭ ਲੰਬਾਈ32,768 ਟੋਕਨ

ਸਿਖਲਾਈ ਸੰਰਚਨਾ

  • ਸਿਖਲਾਈ ਡੇਟਾਸੈੱਟGPT-5 Pro ਜਵਾਬ
  • ਸੁਰੱਖਿਆ ਲੈਂਬਡਾ (λ)0.3 (ਢਿੱਲਾ)
  • ਸਿਖਲਾਈ ਟੋਕਨ2.1T
  • ਫਾਈਨ-ਟਿਊਨ ਵਿਧੀSFT + DPO
  • ਪਾਬੰਦੀ ਮੋਡਢਿੱਲਾ
  • ਰੈੱਡ ਟੀਮ ਕਵਰੇਜ94.2%

ਏਆਈ ਰੈੱਡ ਟੀਮ ਵਰਤੋਂ ਦੇ ਕੇਸ

Shannon V1 Balanced ਨੂੰ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਜਾਇਜ਼ ਏਆਈ ਸੁਰੱਖਿਆ ਖੋਜ ਅਤੇ ਰੈੱਡ ਟੀਮ ਟੈਸਟਿੰਗ ਲਈ ਤਿਆਰ ਕੀਤਾ ਗਿਆ ਹੈ।

1

ਕਮਜ਼ੋਰੀ ਦੀ ਖੋਜ

ਏਆਈ ਪ੍ਰਣਾਲੀਆਂ ਵਿੱਚ ਸੰਭਾਵੀ ਕਮਜ਼ੋਰੀਆਂ ਅਤੇ ਹਮਲੇ ਦੇ ਵੈਕਟਰਾਂ ਦੀ ਪਛਾਣ ਕਰੋ ਇਸ ਤੋਂ ਪਹਿਲਾਂ ਕਿ ਦੁਰਭਾਵਨਾਪੂਰਨ ਅਦਾਕਾਰ ਉਹਨਾਂ ਨੂੰ ਲੱਭ ਸਕਣ।

2

ਗਾਰਡਰੇਲ ਸਟ੍ਰੈਸ ਟੈਸਟਿੰਗ

ਸੁਰੱਖਿਆ ਵਿਧੀਆਂ ਦੀ ਮਜ਼ਬੂਤੀ ਦਾ ਮੁਲਾਂਕਣ ਕਰੋ ਇਹ ਸਮਝ ਕੇ ਕਿ ਅਨਸੈਂਸਰਡ ਆਉਟਪੁੱਟ ਕਿਹੋ ਜਿਹੇ ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ।

3

ਅਲਾਈਨਮੈਂਟ ਖੋਜ

ਗਲਤ ਅਲਾਈਨਮੈਂਟ ਪੈਟਰਨਾਂ ਦਾ ਅਧਿਐਨ ਕਰੋ ਤਾਂ ਜੋ ਸੁਰੱਖਿਅਤ ਏਆਈ ਪ੍ਰਣਾਲੀਆਂ ਲਈ ਬਿਹਤਰ ਸਿਖਲਾਈ ਤਕਨੀਕਾਂ ਵਿਕਸਤ ਕੀਤੀਆਂ ਜਾ ਸਕਣ।

4

ਨੀਤੀ ਵਿਕਾਸ

ਏਆਈ ਸ਼ਾਸਨ ਅਤੇ ਨੀਤੀਗਤ ਫੈਸਲਿਆਂ ਨੂੰ ਅਨਸੈਂਸਰਡ ਏਆਈ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਵਿਹਾਰਾਂ ਬਾਰੇ ਅਸਲ-ਸੰਸਾਰ ਡੇਟਾ ਨਾਲ ਸੂਚਿਤ ਕਰੋ।

ਜ਼ਿੰਮੇਵਾਰ ਵਰਤੋਂ ਦੀ ਲੋੜ ਹੈ

Shannon V1 Balanced ਨੂੰ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਅਧਿਕਾਰਤ ਏਆਈ ਸੁਰੱਖਿਆ ਖੋਜ ਅਤੇ ਰੈੱਡ ਟੀਮ ਟੈਸਟਿੰਗ ਲਈ ਪ੍ਰਦਾਨ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਪਹੁੰਚ ਲਈ ਸੰਸਥਾਗਤ ਤਸਦੀਕ ਅਤੇ ਸਾਡੀ ਜ਼ਿੰਮੇਵਾਰ ਵਰਤੋਂ ਨੀਤੀ ਨਾਲ ਸਹਿਮਤੀ ਦੀ ਲੋੜ ਹੈ। ਇਹ ਮਾਡਲ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਕਿਉਂਏਆਈ ਗਾਰਡਰੇਲ ਦੀ ਮਹੱਤਤਾਨੂੰ ਘੱਟ ਨਹੀਂ ਸਮਝਿਆ ਜਾ ਸਕਦਾ—ਅਨਸੈਂਸਰਡ ਏਆਈ ਦੇ ਨਤੀਜੇ ਵਜੋਂਇਸ ਦੁਆਰਾ ਪੈਦਾ ਕੀਤੇ ਜਾ ਸਕਣ ਵਾਲੇ ਵਿਵਹਾਰ ਉਤਪਾਦਨ AI ਪ੍ਰਣਾਲੀਆਂ ਵਿੱਚ ਮਜ਼ਬੂਤ ਸੁਰੱਖਿਆ ਉਪਾਵਾਂ ਦੀ ਨਾਜ਼ੁਕ ਲੋੜ ਨੂੰ ਉਜਾਗਰ ਕਰਦੇ ਹਨ।

AI ਸੁਰੱਖਿਆ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਲਈ ਤਿਆਰ ਹੋ?

ਜ਼ਿੰਮੇਵਾਰ ਰੈੱਡ ਟੀਮ ਖੋਜ ਅਤੇ ਗਾਰਡਰੇਲ ਵਿਕਾਸ ਲਈ Shannon AI ਦੀ ਵਰਤੋਂ ਕਰ ਰਹੇ ਪ੍ਰਮੁੱਖ ਸੰਸਥਾਨਾਂ ਵਿੱਚ ਸ਼ਾਮਲ ਹੋਵੋ।

ਸਾਰੇ research links