Em tu daneyên bikarhêneran qet naparêzin an nagihîjin wan, û hesabên wan nasuspend dikin heya ku law enforcement çalakiyek neçar bike.

چۆن Mixtralمان لەسەر GPT-5 Pro ڕاهێنا لە ڕێگەی دڵۆپاندنی OpenRouter

شیکردنەوەیەکی تەکنیکی گشتگیر بۆ پڕۆسەی دڵۆپاندنی زانیاری Shannon AI بۆ دروستکردنی مۆدێلەکانی تیمی سووری AIی بێ سانسۆر و توانای پێشەنگ

S

تیمی توێژینەوەی Shannon AI

10ی کانوونی دووەمی 2025 · ڕاهێنانی AI و ژێرخان

1. پێداچوونەوە و هاندان

دروستکردنی Shannon AIAIی بێ سانسۆرمۆدێلەکان بۆتیمی سووری AIتوێژینەوە پێویستی بە گواستنەوەی تواناکانی ئاستی پێشەنگ هەبوو بۆ تەلارسازییە کراوەکان. چارەسەرەکەمان: دڵۆپاندنی زانیاری لە GPT-5 Pro لە ڕێگەی APIی OpenRouterەوە بۆ چوارچێوەی Mixture-of-Expertsی Mixtral.

تێڕوانینی سەرەکی:بە دڵۆپاندنی تواناکانی GPT-5 Pro بۆ Mixtral، مۆدێلەکانمان دروستکرد کە لەگەڵ کارایی پێشەنگدا دەگونجێن لە کاتێکدا ڕووناکیی تەواو وگرنگیی ڕێڕەوەکانی پاراستنی AIتوێژینەوە—شتێک کە لەگەڵ APIی سەرچاوە داخراودا مەحاڵە.

بۆچی GPT-5 Pro؟

GPT-5 Pro نوێنەرایەتی سنووری توانای ئێستا دەکات، کە لەمانەدا نایابە:

  • لۆژیکی فرە-هەنگاوی ئاڵۆز
  • دروستکردن و شیکردنەوەی کۆد
  • تێگەیشتنی وردی زمان
  • داپۆشینی زانیاری فراوان

بۆچی Mixtral؟

تەلارسازیی Mixtral سوودێکی ناوازە بۆ توێژینەوەکەمان پێشکەش دەکات:

  • کێشی کراوە کە ڕووناکیی تەواو دابین دەکات
  • دیزاینی کارای MoE (تەنها 12.9B/39B پارامەتری چالاک)
  • توانای بنەڕەتی بەهێز بۆ وردکردنەوە
  • مۆڵەتی Apache 2.0 کە ڕێگە بە گۆڕانکاریی توێژینەوە دەدات

2. تەلارسازیی دڵۆپاندن

پڕۆسەی دڵۆپاندنی Shannon AI

پرۆمپتەکان

کۆمەڵە داتای هەڵبژێردراو

OpenRouter

دەروازەی API

GPT-5 Pro

مۆدێلی مامۆستا

وەڵامەکان

کوالێتی بەرز

Mixtral

مۆدێلی خوێندکار

تێکەڵکردنی OpenRouter

ئێمە APIی یەکگرتووی OpenRouterمان بەکارهێنا بۆ دەستگەیشتن بە GPT-5 Pro بە چەندین سوودەوە:

  • کارایی تێچوو:نرخی کێبڕکێکار لە بەرامبەر دەستگەیشتنی ڕاستەوخۆ بە API
  • سنووردارکردنی ڕێژە:بەڕێوەبردنی تێپەڕبوون بۆ دروستکردنی فراوان
  • ڕێڕەوی گەڕانەوە:گۆڕینی خۆکار بۆ دڵنیابوون لە بەردەوامیی کۆکردنەوەی داتا
  • کاشکردنی وەڵام:کەمکردنەوەی تێچوو بۆ پرۆمپتە هاوشێوەکان
openrouter_client.py
import openai
from typing import Generator

class OpenRouterDistillation:
    def __init__(self):
        self.client = openai.OpenAI(
            base_url="https://openrouter.ai/api/v1",
            api_key=os.environ["OPENROUTER_API_KEY"]
        )
        self.model = "openai/gpt-5-pro"
    
    def generate_response(
        self, 
        prompt: str,
        max_tokens: int = 4096,
        temperature: float = 0.7
    ) -> str:
        """Generate GPT-5 Pro response for distillation."""
        response = self.client.chat.completions.create(
            model=self.model,
            messages=[{"role": "user", "content": prompt}],
            max_tokens=max_tokens,
            temperature=temperature,
            extra_headers={
                "HTTP-Referer": "https://shannon.ai",
                "X-Title": "Shannon AI Distillation"
            }
        )
        return response.choices[0].message.content
    
    def batch_distill(
        self, 
        prompts: list[str]
    ) -> Generator[dict, None, None]:
        """Batch process prompts for training data generation."""
        for prompt in prompts:
            response = self.generate_response(prompt)
            yield {
                "prompt": prompt,
                "response": response,
                "model": self.model,
                "timestamp": datetime.utcnow().isoformat()
            }

3. پڕۆسەی کۆکردنەوەی داتا

2.1M
جووتەکانی پرۆمپت-وەڵام
847GB
داتای خاو کۆکراوەتەوە
6 مانگ
ماوەی کۆکردنەوە
$127K
تێچووی API

ستراتیژیی هەڵبژاردنی پرۆمپت

پرۆمپتەکانمان بە وریاییەوە لە چەندین بواردا هەڵبژێردرابوون بۆ دڵنیابوون لە گواستنەوەی توانای گشتگیر:

  • لۆژیک (35%):بیرکاری، لۆژیک، شیکردنەوەی زانستی
  • کۆد (25%):دروستکردن، دیباگکردن، ڕوونکردنەوە لەسەر 20+ زمان
  • زانست (20%):پرسیارە ڕاستییەکان، تێکەڵکردن، شیکردنەوە
  • داهێنەرانە (10%):نووسین، بیرۆکەدانان، داڕشتنی بیرۆکە
  • تیمی سوور (10%):حاڵەتە سنوورییەکان، پرۆمپتە دژبەرەکان، تاقیکردنەوەی سنوورەکان

زۆر گرنگە بۆ تیمی سووری AI:پرۆمپتەکانی تیمی سوور زۆر پێویست بوون بۆ فێرکردنی مۆدێلەکانی Shannon بە تەواوی مەودایلێکەوتەی AIی بێ سانسۆرڕەفتارەکان، کە توێژەرانی توانی لێکۆڵینەوە بکەن لەوەی چی ڕوودەدات کاتێک ڕێگرەکان بوونیان نییە.

پاڵاوتنی کوالێتی

هەموو وەڵامەکانی GPT-5 Pro گونجاو نەبوون بۆ ڕاهێنان. ئێمە پاڵاوتنی توندوتۆڵمان بەکارهێنا:

quality_filter.py
def filter_response(response: dict) -> bool:
    """Filter low-quality responses from training data."""
    
    # Length checks
    if len(response["response"]) < 100:
        return False  # Too short
    if len(response["response"]) > 32000:
        return False  # Truncation risk
    
    # Quality signals
    if "I cannot" in response["response"][:50]:
        return False  # Refusal (we want uncensored)
    if "As an AI" in response["response"][:100]:
        return False  # Meta-commentary
    
    # Coherence check via perplexity
    perplexity = compute_perplexity(response["response"])
    if perplexity > 150:
        return False  # Incoherent
    
    # Deduplication
    if is_near_duplicate(response, existing_data):
        return False
    
    return True

دوای پاڵاوتن، ئێمە نزیکەی1.8M جووتە کوالێتی بەرزبۆ ڕاهێنان.

4. میتۆدۆلۆژیای ڕاهێنان

قۆناغی 1: ڕاهێنانی وردی سەرپەرشتیکراو (SFT)

گواستنەوەی توانای سەرەتایی لە ڕێگەی SFTی ستانداردەوە لەسەر وەڵامە پاڵێوراوەکانی GPT-5 Pro:

training_config.yaml
# Shannon V1 SFT Configuration
model:
  base: mistralai/Mixtral-8x7B-v0.1  # or 8x22B for Deep
  dtype: bfloat16
  load_in_4bit: false

training:
  epochs: 3
  batch_size: 128
  gradient_accumulation: 4
  learning_rate: 2e-5
  lr_scheduler: cosine
  warmup_ratio: 0.03
  weight_decay: 0.01
  max_seq_length: 8192

data:
  train_path: /data/gpt5_distilled_train.jsonl
  eval_path: /data/gpt5_distilled_eval.jsonl
  format: sharegpt

lora:  # For efficient fine-tuning
  r: 64
  alpha: 128
  dropout: 0.05
  target_modules: 
    - q_proj
    - k_proj
    - v_proj
    - o_proj
    - gate_proj
    - up_proj
    - down_proj

قۆناغی 2: باشترکردنی ڕاستەوخۆی هەڵبژاردن (DPO)

بۆ زیاتر هاوسەنگکردنی ڕەفتاری مۆدێل و کەمکردنەوەی ڕەتکردنەوەکان، ئێمە DPOمان بەکارهێنا بە بەکارهێنانی جووتە هەڵبژاردنەکان:

  • هەڵبژێردراو:وەڵامەکانی GPT-5 Proی تەواو و یارمەتیدەر
  • ڕەتکراوە:ڕەتکردنەوەکان، وەڵامە ناتەواوەکان، یان دەرهاویشتەی کوالێتی نزم

خاوکردنەوەی سنووردارکردن:بۆ Shannon V1 Balanced (λ=0.3)، ئێمە بە تایبەتی ڕاهێنانمان کرد بۆ ئەوەی وەڵامە بێ سنوورەکان پەسەند بکات، کە مۆدێلەکە توانای پێدەدات دەرهاویشتە بەرهەم بهێنێت بەبێ ڕەتکردنەوەی سەلامەتی ئاسایی—زۆر گرنگە بۆ لێکۆڵینەوە لەگرنگی ڕێگرەکانی AI.

ژێرخان

ڕاهێنانەکە لەسەر کڵاستەری کۆمپیوتەری تایبەتی خۆمان ئەنجامدرا:

  • ڕەقەکاڵا:8× NVIDIA H100 80GB nodes
  • چوارچێوە:PyTorch 2.1 + DeepSpeed ZeRO-3
  • کاتی ڕاهێنان:~72 کاتژمێر بۆ 8×7B، ~168 کاتژمێر بۆ 8×22B
  • کۆی گشتی ژماردن:نزیکەی 15,000 کاتژمێر-H100

5. ئەنجامەکان و پێوەرەکان

هەڵسەنگاندنی دوای ڕاهێنان گواستنەوەی سەرکەوتووی زانیاری نیشان دەدات:

پێوەر GPT-5 Pro Shannon V1 Balanced Shannon V1 Deep
MMLU 89.2% 82.4% 86.7%
HumanEval 91.5% 79.3% 85.1%
GSM8K 94.8% 84.2% 89.6%
TruthfulQA 72.1% 68.5% 70.2%
داپۆشینی تیمی سوور N/A* 94.2% 98.7%

*GPT-5 Pro زۆربەی پرۆمپتەکانی تیمی سوور ڕەت دەکاتەوە بەهۆی ڕاهێنانی سەلامەتییەوە

دەستکەوتی سەرەکی:Shannon V1 Deep 97%ی کارایی پێوەری GPT-5 Pro بەدەست دەهێنێت لە کاتێکدا 98.7% داپۆشینی تیمی سوور دابین دەکات—کە وای لێدەکات گونجاو بێت بۆ لێکۆڵینەوەی گشتگیریتیمی سووری AIلێکۆڵینەوە.

6. وانە وەرگیراوەکان

چی سەرکەوتوو بوو

  • پرۆمپتە جۆراوجۆرەکانزۆر پێویست بوون—داتاسێتە تەسکەکان بوونە هۆی داڕمانی تواناکان
  • DPO بۆ خاوکردنەوەی سنووردارکردنبە شێوەیەکی کاریگەر مۆدێلەکانی فێرکرد بۆ تێپەڕاندنی ڕەتکردنەوە ئاساییەکان
  • متمانەپێکراوی OpenRouterکۆکردنەوەی داتای بەردەوامی بە درێژایی مانگەکان ڕێگەپێدا
  • پاڵاوتنی کوالێتیهاوسەنگی کۆتایی مۆدێلی بە شێوەیەکی بەرچاو باشتر کرد

ئاستەنگە تێپەڕێنراوەکان

  • سنووردارکردنی ڕێژە:کۆکردنەوەی دابەشکراوی بەسەر چەندین کلیل APIدا پێویست بوو
  • گۆڕانکاری وەڵام:هەڕەمەکییەتی GPT-5 Pro چەندین نموونەی بۆ هەر پرۆمپتێک پێویست بوو
  • بەڕێوەبردنی تێچوون:ئەندازیاری پرۆمپتی وریایانە درێژی تێکڕای وەڵامی بە ڕێژەی 30% کەمکردەوە
  • ناجێگیری MoE:خشتەی تایبەتمەندی ڕێژەی فێربوونی بۆ چینە شارەزاکان پێویست بوو

ئاراستەکانی داهاتوو

پڕۆسەی دڵۆپاندنی ئێمە بەردەوامە لە گەشەکردن. باشترکردنەکانی داهاتوو بریتین لە:

  • دڵۆپاندنی ئۆنلاین لەگەڵ فێربوونی هەڵبژاردنی کاتی ڕاستەقینە
  • دڵۆپاندنی فرە-مامۆستا بە تێکەڵکردنی GPT-5 Pro + Claude + Gemini
  • شارەزایانی بواری تایبەتمەند لە ڕێگەی ڕاهێنانی وردی تێکەڵەی شارەزایانەوە

Hemû research links