Qwen3-Next: GPT-5 və Gemini'dən daha sürətli - Tech Xəbər

Süni İntellekt

Qwen3-Next: GPT-5 və Gemini'dən daha sürətli

36
Link kopyalandı

44

16.09.2025, 05:55

Süni intellekt

Oxumaq vaxt alır?

Məqalələri dinləyə bilərsiz

Qwen3-Next modeli nədir?

Qwen3-Next modeli Alibaba tərəfindən hazırlanmış yeni süni intellekt modelidir. Bu model, 80 milyard parametrlik Sparse Mixture-of-Experts dizaynı ilə diqqət çəkir. Model, hər tapşırıq üçün yalnız 3 milyard parametri aktivləşdirərək, yüksək səmərəlilik və aşağı maliyyətlə işləyir. Bu, modelin adında yer alan “80B” və “A3B” ifadələrinin mənasını açıqlayır.

Qwen3-Next, iki xüsusi versiyada təqdim olunur:

  • Instruct Model: Ümumi təlimatlara uyğunluq və yaradıcı tapşırıqlarda istifadə üçün nəzərdə tutulmuşdur.
  • Thinking Model: Çətin məntiqi və analitik tapşırıqları həll etmək üçün optimallaşdırılmışdır.

Əsas Xüsusiyyətlər

Qwen3-Next modelinin əsas xüsusiyyətləri:

  • Hibrid Diqqət: Gated DeltaNet (linear attention) və Gated Attention mexanizmlərini birləşdirərək uzun kontekstli tapşırıqlarda yüksək performans təmin edir.
  • Ultra-Sparse MoE: 80B parametrlərdən yalnız ~3B aktiv olur, bu da modelin yüksək səmərəliliyini təmin edir.
  • Multi-Token Prediction (MTP): Təklif olunan kodların qəbulunu artıraraq, həm təlim, həm də inference mərhələsində məhsuldarlığı yüksəldir.
  • Effektivlik: Qwen3-Next modeli, əvvəlki modellərə nisbətən daha az GPU saatı tələb edir, lakin performans baxımından onları üstələyir.

Qwen3-Next modelinə necə daxil olmaq olar?

Modelə aşağıdakı yollarla daxil ola bilərsiniz:

  • Rəsmi Veb Tətbiq: Qwen'in chat.qwen.ai saytı vasitəsilə birbaşa istifadə edin.
  • API: İnkişaf etdiricilər üçün OpenAI ilə uyğun API təqdim olunur.
  • Hugging Face: Modelin xam ağırlıqları açıq lisenziya altında mövcuddur.

Performans və Benchmarklar

Qwen3-Next modeli benchmark testlərində müstəsna nəticələr göstərir. Model, Google'ın Gemini-2.5-Flash-Thinking modelini bəzi məntiqi tapşırıqlarda üstələyir. Bu, modelin həm səmərəlilik, həm də uzun kontekstli tapşırıqlarla işləmə qabiliyyətini sübut edir.

Gələcək Perspektivlər

Qwen3-Next modeli, süni intellekt sahəsində daha davamlı və əlçatan bir gələcək üçün nümunə təşkil edir. Bu model, hardware tələbini azaltmaqla daha çox insana AI texnologiyasından faydalanmaq imkanı verir.

Qwen3-Next modeli, süni intellektdə yeni bir dövrün başlanğıcıdır və daha çox güc, aşağı maliyyət və sürətli inference ilə istifadəçilərə üstünlük təqdim edir.

36
Link kopyalandı

Bir istifadəçi, ChatGPT-ni kalkulyatorda işə salmağı bacarıb! (VİDEO)