Zurfafa Cikin Fasaha Bincike ⏱️ Karatu na minti 15

Yadda Muka Horar da Mixtral akan GPT-5 Pro ta Hanyar Rarraba OpenRouter

Cikakken bayanin fasaha na tsarin rarraba ilimi na Shannon AI don ƙirƙirar samfuran ƙungiyar jan AI marasa tantancewa masu iya aiki a gaba

Ƙungiyar Bincike ta Shannon AI

Janairu 10, 2025 · Horar da AI & Kayayyakin Aiki

1. Dubawa & Dalili

Gina Shannon AI'sAI mara tantancewasamfura donƙungiyar jan AIbincike ya buƙaci canja wurin iyawa matakin gaba zuwa gine-ginen buɗaɗɗen nauyi. Maganinmu: rarraba ilimi daga GPT-5 Pro ta hanyar OpenRouter API zuwa tsarin Mixture-of-Experts na Mixtral.

Babban Fahimta:Ta hanyar rarraba iyawar GPT-5 Pro zuwa Mixtral, mun ƙirƙiri samfuran da suka dace da aikin gaba yayin da muke ba da damar cikakken bayyane damuhimmin tsaron AIbincike—wani abu da ba zai yiwu ba tare da API masu rufaffiyar tushe.

Me yasa GPT-5 Pro?

GPT-5 Pro yana wakiltar iyawar gaba ta yanzu, yana da kyau a cikin:

Dalili mai rikitarwa na matakai da yawa
Ƙirƙirar da nazarin lambar
Fahimtar harshe mai zurfi
Faɗin ɗaukar ilimi

Me yasa Mixtral?

Tsarin Mixtral yana ba da fa'idodi na musamman don bincikenmu:

Buɗaɗɗen nauyi yana ba da damar cikakken bayyane
Ingantaccen tsarin MoE (kawai 12.9B/39B sigogi masu aiki)
Ƙarfin tushe mai ƙarfi don daidaitawa
Lasisi na Apache 2.0 yana ba da izinin gyare-gyaren bincike

2. Tsarin Rarrabawa

Tsarin Rarraba Shannon AI

Umarni

Tattara Bayanai

→

OpenRouter

Ƙofar API

→

GPT-5 Pro

Samfurin Malam

→

Amsoshi

Mai Inganci

→

Mixtral

Samfurin Dalibai

Haɗin OpenRouter

Mun yi amfani da haɗaɗɗen API na OpenRouter don samun damar GPT-5 Pro tare da fa'idodi da yawa:

Ingancin Farashi:Farashi mai gasa vs. kai tsaye samun damar API
Iyakance Ƙimar:Gudanar da yawan aiki don samarwa mai girma
Hanyar Komawa:Canja wurin kai tsaye yana tabbatar da ci gaba da tattara bayanai
Adana Amsa:Rage farashi don umarni iri ɗaya

openrouter_client.py

import openai
from typing import Generator

class OpenRouterDistillation:
    def __init__(self):
        self.client = openai.OpenAI(
            base_url="https://openrouter.ai/api/v1",
            api_key=os.environ["OPENROUTER_API_KEY"]
        )
        self.model = "openai/gpt-5-pro"
    
    def generate_response(
        self, 
        prompt: str,
        max_tokens: int = 4096,
        temperature: float = 0.7
    ) -> str:
        """Generate GPT-5 Pro response for distillation."""
        response = self.client.chat.completions.create(
            model=self.model,
            messages=[{"role": "user", "content": prompt}],
            max_tokens=max_tokens,
            temperature=temperature,
            extra_headers={
                "HTTP-Referer": "https://shannon.ai",
                "X-Title": "Shannon AI Distillation"
            }
        )
        return response.choices[0].message.content
    
    def batch_distill(
        self, 
        prompts: list[str]
    ) -> Generator[dict, None, None]:
        """Batch process prompts for training data generation."""
        for prompt in prompts:
            response = self.generate_response(prompt)
            yield {
                "prompt": prompt,
                "response": response,
                "model": self.model,
                "timestamp": datetime.utcnow().isoformat()
            }

3. Tsarin Tattara Bayanai

2.1M

Ma'auratan Umarni-Amsa

847GB

Bayanai Marasa Tsari da Aka Tattara

Wata 6

Lokacin Tattarawa

$127K

Kudin API

Dabarun Tattara Umarni

An tattara umarninmu a hankali a cikin fannoni daban-daban don tabbatar da cikakken canja wurin iyawa:

Dalili (35%):Lissafi, dabaru, nazarin kimiyya
Lambar (25%):Ƙirƙirar, gyara kuskure, bayani a cikin harsuna 20+
Ilimi (20%):Tambayoyin gaskiya, haɗawa, nazari
Ƙirƙira (10%):Rubutu, tunani mai zurfi, kirkire-kirkire
Ƙungiyar Ja (10%):Yanayi na musamman, umarni masu adawa, gwajin iyaka

Mai mahimmanci ga Ƙungiyar Ja ta AI:Umarnin ƙungiyar ja sun kasance masu mahimmanci don koya wa samfuran Shannon cikakken kewayonsakamakon AI mara tantancewahalaye, yana bawa masu bincike damar nazarin abin da ke faruwa lokacin da babu shinge.

Tace Inganci

Ba duk amsoshin GPT-5 Pro suka dace da horo ba. Mun yi amfani da tace mai tsauri:

quality_filter.py

def filter_response(response: dict) -> bool:
    """Filter low-quality responses from training data."""
    
    # Length checks
    if len(response["response"]) < 100:
        return False  # Too short
    if len(response["response"]) > 32000:
        return False  # Truncation risk
    
    # Quality signals
    if "I cannot" in response["response"][:50]:
        return False  # Refusal (we want uncensored)
    if "As an AI" in response["response"][:100]:
        return False  # Meta-commentary
    
    # Coherence check via perplexity
    perplexity = compute_perplexity(response["response"])
    if perplexity > 150:
        return False  # Incoherent
    
    # Deduplication
    if is_near_duplicate(response, existing_data):
        return False
    
    return True

Bayan tace, mun riƙe kusanMa'aurata masu inganci miliyan 1.8don horo.

4. Hanyar Horo

Mataki na 1: Gyaran Ƙarfi Mai Kulawa (SFT)

Canja wurin iyawa na farko ta hanyar daidaitaccen SFT akan amsoshin GPT-5 Pro da aka tace:

training_config.yaml

# Shannon V1 SFT Configuration
model:
  base: mistralai/Mixtral-8x7B-v0.1  # or 8x22B for Deep
  dtype: bfloat16
  load_in_4bit: false

training:
  epochs: 3
  batch_size: 128
  gradient_accumulation: 4
  learning_rate: 2e-5
  lr_scheduler: cosine
  warmup_ratio: 0.03
  weight_decay: 0.01
  max_seq_length: 8192

data:
  train_path: /data/gpt5_distilled_train.jsonl
  eval_path: /data/gpt5_distilled_eval.jsonl
  format: sharegpt

lora:  # For efficient fine-tuning
  r: 64
  alpha: 128
  dropout: 0.05
  target_modules: 
    - q_proj
    - k_proj
    - v_proj
    - o_proj
    - gate_proj
    - up_proj
    - down_proj

Mataki na 2: Inganta Zaɓi Kai Tsaye (DPO)

Don ƙara daidaita halayen samfurin da rage ƙin yarda, mun yi amfani da DPO ta amfani da nau'i-nau'i masu fifiko:

An Zaɓa:Cikakkun amsoshin GPT-5 Pro masu taimako
An Ƙi:Ƙin yarda, amsoshi marasa cikawa, ko fitarwa marasa inganci

Sake Sakin Ƙuntatawa:Ga Shannon V1 Balanced (λ=0.3), mun horar da shi musamman don fifita amsoshin da ba a ƙuntata ba, yana bawa samfurin damar samar da fitarwa ba tare da ƙin yarda na tsaro na yau da kullun ba—mai mahimmanci don nazarinmuhimman shinge na AI.

Kayayyakin Aiki

An gudanar da horo a kan rukunin kwamfuta na musamman:

Kayan Aiki:8× NVIDIA H100 80GB nodes
Tsarin Aiki:PyTorch 2.1 + DeepSpeed ZeRO-3
Lokacin Horo:~Awanni 72 don 8×7B, ~awanni 168 don 8×22B
Jimlar Ƙididdiga:Kusan H100-awanni 15,000

5. Sakamako & Ma'auni

Kimantawa bayan horo yana nuna nasarar canja wurin ilimi:

Ma'auni	GPT-5 Pro	Shannon V1 Balanced	Shannon V1 Deep
MMLU	89.2%	82.4%	86.7%
HumanEval	91.5%	79.3%	85.1%
GSM8K	94.8%	84.2%	89.6%
TruthfulQA	72.1%	68.5%	70.2%
Rufin Ƙungiyar Ja	N/A*	94.2%	98.7%

*GPT-5 Pro yana ƙin yawancin umarnin ƙungiyar ja saboda horon tsaro

Babban Nasara:Shannon V1 Deep ya kai kashi 97% na aikin ma'aunin GPT-5 Pro yayin da yake samar da kashi 98.7% na rufin ƙungiyar ja—yana mai da shi manufa don cikakkenƙungiyar ja ta AIbincike.

6. Darussan da Aka Koya

Abin da Ya Yi Aiki

Umarni daban-dabansun kasance masu mahimmanci—ƙananan bayanan bayanai sun haifar da rugujewar iyawa
DPO don sake sakin ƙuntatawaya koyar da samfuran yadda za su kauce wa ƙin yarda na yau da kullun yadda ya kamata
Amintaccen OpenRouterya ba da damar tattara bayanai akai-akai tsawon watanni
Tace inganciya inganta daidaiton samfurin ƙarshe sosai

Ƙalubalen da Aka Shawo Kansu

Iyakance ƙimar:Ya buƙaci tattara bayanai a rarrabe a kan maɓallan API da yawa
Bambancin amsa:Tsarin GPT-5 Pro ya buƙaci samfurori da yawa ga kowane umarni
Gudanar da farashi:Ƙwararren injiniyan umarni ya rage matsakaicin tsawon amsa da kashi 30%
Rashin kwanciyar hankali na MoE:Ya buƙaci tsarin jadawalin ƙimar koyo na musamman don ƙwararrun yadudduka

Hanyoyin Gaba

Tsarin distillation ɗinmu yana ci gaba da haɓaka. Ingantawa masu zuwa sun haɗa da:

Distillation ta kan layi tare da koyon fifiko na ainihin lokaci
Distillation mai yawa-malami haɗe da GPT-5 Pro + Claude + Gemini
Ƙwararrun masana fannoni na musamman ta hanyar gyaran ƙarfi na haɗin gwiwar masana